摘要:不同地球物理方法的反演结果常常存在差异,根据不同方法的联合反演结果得到最终合理解释是了解地下结构的关键。为此,提出了一种引导式模糊C均值(FCM)聚类算法,即在FCM聚类算法的基础上,结合现有地质认识,引入先验约束信息指导聚类中心的确定,对地球物理联合反演结果进行综合定量解释,旨在降低传统人工解释的主观性和局限性。模型测试表明,与传统FCM聚类技术相比,引导FCM聚类技术效果更好,特别是处理复杂地质结构的反演数据时,能够有效地区分不同地质体。实际数据的应用结果证明了引导FCM聚类技术在多属性地球物理联合反演结果综合解释中的应用潜力较大。该技术不仅提升了地球物理数据解释的科学性,而且为地下资源勘探提供了一个更可靠和精确的工具。
近年来,各种分类或聚类算法应用于地球物理资料处理和反演,主要包括模糊C均值(FCM)聚类[1]、支持向量机(SVM)[2-3]和神经网络(NN)[4-5]等。其中,SVM和NN算法均属于监督学习分类方法,需要足够数量的样本维持结果的稳定性;而FCM聚类算法是一种无监督学习方法,具有样本量需求少的优势[6-7],更适用于地球物理方法联合反演。Paasche等[8]运用FCM聚类技术开展基于井间地震、地质雷达和地面地震等多种数据的物性预测,论证了FCM聚类算法对于不同物性数据聚类的实用性。Orfanos等[9]通过密度和电阻率二维反演开展裂缝预测,在优化模型的过程中同步分析了FCM聚类算法的有效性。Ward等[10]利用FCM聚类算法对小范围矿区的三维电阻率反演结果开展聚类分析,以确定地层的年代属性,提出了将结果偏差纳入FCM加权项以进一步指导聚类的思想。刘佳成等[11]在地震走时反演中应用FCM聚类算法有效提升了反演效果。为了更有效地利用先验信息优化聚类结果,Pedrycz[12]提出了一种部分监督的模糊聚类算法。Bensaid等[13]提出了一种半监督模糊聚类算法。Noordam等[14]在FCM聚类算法中加入了先验空间域几何信息以提高图像分割效果。Sun等[15-16]在反演中引入了模型约束机制,使反演结果更接近实际地下地质体和背景值。
但是,目前基于FCM聚类算法的地质属性解释主要针对单一反演结果,不能克服多解性。随着地球物理联合反演技术的发展,反演结果的不确定性得以降低[17-21],而利用多元地球物理信息进行综合定量解释方面尚缺乏相关的技术方法。因此,本文将引导FCM聚类方法应用于分析、评价地球物理联合反演结果,以获得一个更科学的综合解释结果,进而形成一套适用于多元地球物理反演信息的地质综合定量解释技术。
1、方法原理
FCM聚类是一种无监督的聚类技术,可以将一组对象自动分为几个子集。在FCM聚类算法中,聚类中心仅取决于数据对象之间的距离关系和初始类别的数量,因此所获取的聚类中心很难与地下真实的物性相匹配。上述问题可以通过对FCM聚类算法引入先验信息得到解决。Sun等[15]提出了一种将统计岩石物理数据纳入地球物理反演的方法,从反演目标函数中提取引导FCM聚类目标函数,进而将引导FCM聚类用于反演结果联合解释。引导FCM聚类目标函数可以表达为
式中:M为待聚类的目标个数;C为待发现类型的数量;xi为第i个目标数据单元;pk为第k个类型的聚类中心;tk为第k个先验约束聚类中心;η为加权系数;γi为拉格朗日参数[15];uim,k为第i个数据对象对第k个聚类中心的隶属度,其中m为模糊化参数[6]。
在目标函数最小化过程中项往往为零值,因此将该项舍掉后的目标函数为
式中最后一项称为引导项,即
更新后的聚类中心pk可以表达为
根据式(4),聚类中心pk受η和tk控制。当η趋向于0时,tk不起作用,算法回归为传统FCM聚类算法;当η趋向于无穷大时,tk成为影响聚类中心的主要因素,这种情况下需要首先明确聚类值。在式(2)中,选取适当的η值可以将等式右侧的两项调整为相同的量级。本文由L曲线法选取适当的η值[22]。
上述推导仅针对单一物性参数,当存在多种物性参数时,式(2)可以写为
式中:xi=(xi1,xi2,...,xiN)T,xi1为第一种物性参数(例如速度)的第i个目标数据单元,N为参与聚类的物性参数个数,以此类推;pk=(pk1,pk2,...,pkN)T,pk1为第一种物性参数(例如速度)的第k类聚类中心;tk=(tk1,tk2,...,tkN)T,tk1为第一种物性参数(例如速度)的第k个先验约束聚类中心。
聚类精度由解释结果的均方根误差定量描述
式中:为真实的聚类模型;为FCM聚类算法聚类结果;Nm为网格数。
2、简单模型测试
设计一个二维模型(图1)验证本文方法的效果。
首先,进行单一物性参数的引导聚类实验。以图1a为例,模型速度呈梯度变化,可以划分为四个聚类中心,其值分别为2.3、3.0、3.8和4.5,而矩形异常体的聚类中心值分别为3.0和4.0。速度模型的引导FCM聚类结果见图2所示。由图可见,异常体和速度背景不能完全区分,存在部分聚类结果不准确的问题,因此引导FCM聚类算法在单一物性参数中的应用效果并不明显。
其次,进行两种物性参数的引导聚类实验。将速度模型数据和磁化强度模型数据集成后分为六层,分别利用传统FCM算法和引导FCM算法计算聚类结果(图3)。由图3可见,传统FCM聚类算法在加入磁化强度属性后,效果依然不理想,异常体和背景不能完全区分,仍然存在聚类不准确的问题(图3a)。在引导FCM聚类结果中,背景和异常体能够清晰地区分,说明两种物性参数的引导FCM结果对异常体的识别能力较强(图3b)。
按照速度、磁化强度两种物性参数计算了两种聚类算法的模型聚类中心值。由表1可见,以速度为例,两种物性参数引导FCM聚类结果与模型参数最接近,且聚类结果优于单一物性参数。
图1 速度(a)和磁化强度(b)二维模型
模型横向尺度为10 km,纵向尺度为1.4 km,网格数为100×14,横向和纵向网格间距均为100 m。模型中设置两个矩形异常体:左侧异常体的速度为3.0 km/s,右侧异常体的速度为4.0 km/s,背景速度由浅到深线性增大(2.0~4.8 km/s)(图1a);左侧异常体的磁化强度为-1.0 A/m,右侧异常体的磁化强度为1.0 A/m,背景磁化强度设置为0(图1b)。
图2 速度模型引导FCM聚类结果
图3 速度和磁化强度模型不同算法聚类结果
最后,绘制速度、磁化强度两种物性参数聚类结果的交会图(图4)。由图可见,引导FCM聚类算法得到的各层聚类数比传统FCM聚类算法更接近真实值,可以有效地识别并区分两个矩形异常体。
表1 简单速度模型不同聚类方法的聚类中心值
图4 速度和磁化强度不同聚类方法结果交会图
3、复杂模型测试
通过复杂多层模型(图5)进一步对比传统FCM聚类算法和引导FCM聚类算法的效果。模型来源于前人的反演研究成果[19],模型物性参数见表2。三种物性参数反演结果见图6所示。根据三种物性参数的反演结果开展聚类分析,恢复真实的地下模型。
图5 复杂模型
横向尺度为30 km、纵向尺度为6 km,网格数为150×30,纵向和横向网格间距均为0.2 km。模型中央设置一个三角形异常体,物性特征为高密度、高磁化强度、高速度。
设置先验约束聚类中心的值与模型物性一致(表2),将模型分为8个层。首先,对单一密度反演结果开展聚类分析(图7),相应的先验约束聚类中心值、FCM聚类中心值和引导FCM聚类中心值见表3所示。随深度增加,引导FCM的结果逐渐向模型(先验聚类中心)靠近,说明先验地质信息起到了引导聚类的作用。
表2 复杂模型的物性参数表
图6 复杂模型不同物性参数反演结果
图7 密度反演的不同方法聚类结果
表3 复杂模型单一密度参数不同算法的聚类中心值
由图7可见,三角形异常体出现在模型底部,同时其下部产生部分异常值,水平层界面也出现较大起伏。
根据式(5),将密度、速度和磁化强度反演结果集成后开展聚类分析,分别得到两种聚类算法的结果(图8)及聚类中心值(表4)。
图8 三种物性参数反演结果的不同聚类结果
由图8可见,每层的厚度、深度在引导FCM聚类结果中与真实模型更相近。在传统FCM聚类结果中,第七层与异常体之间、异常体与第六层之间均存在不同程度的错误聚类(图8a);在引导FCM聚类结果中,各地层的边界划分效果更好,高速异常体的形状与真实模型间仅存在轻微的偏差,第七层的区分度更高,高速异常体轮廓与真实模型高度相似(图8b)。由表4可知,与块状模型类似,随着深度逐渐增加,引导FCM的结果逐渐向模型(先验聚类中心)靠近,说明先验地质信息起到了引导聚类的作用,深层更明显。
由图9可见,两种算法的物性统计结果均表现出较强的正态性。相比之下,引导FCM聚类算法中每一层的物性统计结果都更接近于真实物性值,更符合真实模型(图9b)。这证明了在反演结果的解释中,引导FCM聚类算法比传统FCM聚类算法效果更好。
表4 复杂模型三参数同时聚类下不同算法的聚类中心值
图9 三种物性参数不同聚类方法结果交会图
进一步分析不同物性数据的两种聚类结果的均方根误差。单一密度的聚类结果为:传统FCM的均方根误差为0.886,而引导FCM的均方根误差为0.621;三种物性参数的聚类结果为:传统FCM的均方根误差为0.604,而引导FCM的均方根误差为0.478。因此,多物性参数聚类结果明显优于单一物性,而引导FCM聚类的结果也明显优于传统FCM,即多物性参数的引导FCM聚类是相对最优的一种解释方案,其结果最接近实际模型。
4、实际数据分析
实际数据选自于南海珠江口盆地白云凹陷的一条二维测线。在前人岩石密度、速度和磁性特征相关成果[23-24]的基础上,统计研究区岩石密度和速度数据(表5),指导建立密度、速度和磁化强度三种参数初始模型,通过基于区域模型余弦相似度耦合方式的联合反演方法[19]得到了密度、磁化强度和速度的反演结果(图10)。根据表5确定重力、地震联合反演结果的先验约束聚类中心(考虑到目标区磁性规律研究程度略低,磁化强度先验约束聚类中心值为人为给定的参考值),开展聚类分析并提取结果聚类中心值(表6)。由表6可见,加入先验信息后,聚类中心值明显表现出以先验值为目标的导向性。
表5 白云凹陷地层密度和速度统计结果
表6 二维剖面不同物性参数的不同算法聚类中心值
图1 0 二维测线不同物性的反演结果
图11为两种算法的聚类效果。由图可见,在传统FCM聚类结果中,测线左侧的块状异常体被聚类为层状,上部地壳的厚度仅为2 km,而下部地壳整体被抬升了5~12 km(图11a);在引导FCM聚类结果中各地层的边界划分结果更准确,上部地壳的厚度约为7~8 km,下部地壳的深度范围约为12~20 km,且异常体的形态更加清晰(图11b)。由于实际应用中无法获得真实的地下信息,仅参考前人对靶区的认识对结果进行评价。据庞雄等[25]的研究成果,在白云凹陷北部,莫霍面深度约为30 km,至测线末端莫霍面深度抬升至19 km,表现出地壳的快速减薄和莫霍面的剧烈抬升特征,且上地壳平均厚度大于下地壳平均厚度,这与引导FCM聚类结果一致。
进一步绘制三种物性参数聚类结果的交会图(图12)。由图可见,与理论模型结果类似,使用先验约束信息引导的FCM聚类算法使每一层的聚类结果更接近相应的聚类中心,这表明先验约束对聚类结果具有引导作用,可准确认识地下结构。进一步证实了引导FCM聚类算法的精度高于传统FCM聚类算法。
图1 1 二维测线密度、速度、磁化强度联合反演结果的不同聚类结果
图1 2 三种物性的不同聚类方法结果交会图
5、结论
(1)本文在传统FCM聚类方法的基础上,通过加入先验约束信息,提出了引导FCM聚类算法,并应用于理论模型和实际数据的地球物理联合反演。定量化模型实验证明,对于单一物性参数而言,引导FCM聚类结果较传统FCM聚类结果的提升有限;而在多物性参数反演结果情况下,引导FCM聚类算法表现出了更出色的边界划分能力,说明随着样本类型的丰富,引导FCM聚类算法的精度提升更明显。
(2)实际二维剖面联合反演结果表明,引导FCM聚类算法能够为复杂地球物理数据的解释提供更加准确、客观的结果。
(3)所提方法在地球物理反演综合解释领域具有较好的参考意义。
参考文献:
[3]邹华胜,宁书年,杨峰,等.支持向量机在储层厚度预测和计算中的应用[J].地球物理学进展,2007, 22(5):1597-1601.
[4]马国庆,王泽坤,李丽丽.基于自注意力机制深度学习的重磁数据网格化和滤波方法[J].石油地球物理勘探, 2022, 57(1):34-42.
[5]王迪,张益明,张繁昌,等.利用先验信息约束的深度学习方法定量预测致密砂岩“甜点”[J].石油地球物理勘探, 2023, 58(1):65-74.
[11]刘佳成,张志勇,周钦渊,等.基于FCM聚类模型约束的二维初至旅行时反演[J].石油地球物理勘探,2023, 58(5):1115-1123.
[20]胡祖志,刘雪军,王志刚,等.时频电磁与大地电磁数据联合反演[J].石油地球物理勘探, 2023, 58(3):720-727.
[21]张志勇,易柯,谢尚平,等.基于模糊C均值聚类的二维直流电阻率与射频大地电磁联合反演[J].同济大学学报(自然科学版), 2023, 51(1):135-144.
[23]黄春菊,周蒂,陈长民,等.深反射地震剖面所揭示的白云凹陷的深部地壳结构[J].科学通报, 2005, 50(10):1024-1031.
[24]鲁宝亮,孙晓猛,张功成,等.南海北部盆地基底岩性地震—重磁响应特征与识别[J].地球物理学报,2011, 54(2):563-572.
[25]庞雄,任建业,郑金云,等.陆缘地壳强烈拆离薄化作用下的油气地质特征——以南海北部陆缘深水区白云凹陷为例[J].石油勘探与开发, 2018, 45(1):27-39.
基金资助:中国海洋石油有限公司“十四五”重大科技项目“潜山油气成藏理论与勘探关键技术”(KJGG2022-0302)和“地层岩性油气藏高效识别与精细评价技术”(KJGG2022-0303)联合资助;
文章来源:陈易周,刘江,涂齐催,等.引导模糊C均值聚类算法在联合反演综合解释中的应用[J].石油地球物理勘探,2024,59(04):865-874.
分享:
近年来,各种分类或聚类算法应用于地球物理资料处理和反演,主要包括模糊C均值(FCM)聚类[1]、支持向量机(SVM)[2-3]和神经网络(NN)[4-5]等。其中,SVM和NN算法均属于监督学习分类方法,需要足够数量的样本维持结果的稳定性;而FCM聚类算法是一种无监督学习方法,具有样本量需求少的优势[6-7],更适用于地球物理方法联合反演。
2024-08-05咸潮是发生在滨海河口地区的一种水文现象,它是由于太阳和月球对地表海水的引力作用,海水倒灌进入内陆河道,导致水体变咸。咸潮危害巨大,例如影响水厂供水安全及部分水生生物的正常生存。因此,加强对咸潮的监测,并据此及时制定应对措施,对当地防灾减灾和城市供水保障等具有重要意义。
2024-01-02在新时期背景下,对国土空间规划功能进行准确定位,全面落实各项规划方案,不仅可以保护周围生态环境,而且能够实现统筹治理目标。结合现阶段我国国土空间规划功能定位现状可知,环境修复难度不断增加,各项管控措施落实效果较差,严重影响生态环境质量。鉴于此,本文重点分析新形势下国土空间规划功能定位和实施途径。
2021-06-01日益严重的环境污染、自然资源无节制开发,不仅开始制约人类社会的发展,同时威胁人类的生存和繁衍,如何改变这种情况,成为当今人类亟待解决的问题。基于卫星遥感的国土空间监测的发展与应用可以帮助人类全面调查全球自然资源和生态环境,确保人类更合理的开发、分配、利用自然资源,使实现可持续发展成为可能。
2021-05-04文章围绕着国土空间规划中对地理信息大数据的有效应用展开充分讨论,首先简要介绍了地理信息大数据的概述,然后表明了国土空间规划的特点,最后着重探讨了地理信息大数据在国土空间规划中的具体应用,包括提供合理数据信息、优化国土空间规划、强化信息的数据源、明确空间具体位置,以此完善地理信息的内容,并形成重要的数据,促进国土空间规划的良好发展。
2021-04-27在当前这一社会与经济快速发展背景下,地震预警已经成为了人民群众关心的问题,因为地震为社会与经济带来的威胁远超于其他地质灾害,再加上地震的前期预兆不明显,所以就需要利用合理的方式进行监测预警,进而有效提高防控效率,降低灾害为人民群众生命财产带来的威胁。那么在当前这一社会背景下,信息技术成为了各行业广泛应用的技术之一。
2021-02-19受测量条件限制,激光扫描技术往往需要架设多站点进行扫描,并对获取的点云数据进行配准以消除不同站点的相对位置变化。目前点云配准算法主要分粗配准和精配准2个阶段。迭代最近点算法(iterativeclosestpoint,ICP)[1]为目前应用最广泛且十分有效的一种精配准方法,但计算成本大、易陷入局部最小值。
2020-12-05高铁列车可当做一种全新的震源类型,其确定的长度和荷载,固定的行驶路线以及近乎匀速运动的特性,使之具有可重复震源的特征,另外,地震仪记录的高铁震源记录,具有宽频带分立谱的特征,为高铁高架桥附近地表结构和物性高精度探测提供了条件.因此,近年来,以高铁列车震源为基础的高铁地震学已成为了一个新的研究热点.
2020-12-04第三极不同地区(如季风区和西风影响区)和不同冰川表面(如老雪区、新雪区、裸冰区)雪冰中高分辨率的碳质组分的观测与分析势在必行,特别是消融期开始后碳质组分在短时间尺度内的浓度、黑碳粒径以及有机碳组成变化对于模型的改进至关重要,可为我们全面认识碳质组分对青藏高原不同地区冰川消融影响的机制提供科学依据。
2020-10-24喜马拉雅地区的冰川是南亚地区许多大江大河的源头,如印度河、恒河和布拉马普特河(上游中国境内河段称雅鲁藏布江)。喜马拉雅高大的山体阻挡来自印度洋和阿拉伯海的湿润水汽,南坡温暖湿润,北坡寒冷干旱,剧烈的海拔梯度差异使得在短距离空间内水热急速变化,为各种动植物生存繁衍提供了场所,成为全球生物多样性最丰富的地区之一。
2020-10-24人气:1558
人气:1539
人气:1492
人气:1240
人气:872
我要评论
期刊名称:地球物理学报
期刊人气:3567
主管单位:中国科学院
主办单位:中国地球物理学会,中国科学院地质与地球物理研究所
出版地方:北京
专业分类:地质
国际刊号:0001-5733
国内刊号:11-2074/P
邮发代号:2-571
创刊时间:1948年
发行周期:月刊
期刊开本:16开
见刊时间:一年半以上
影响因子:0.435
影响因子:1.417
影响因子:0.700
影响因子:0.925
影响因子:1.760
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!