地球化学数据处理与分析–聚类分析

2013 年 1 月 27 日19:05:28 发表评论 832

聚类分析是一种多元统计的方法,最早运用于分类学中,形成数值分类学这个学科。以后,随着统计软件的发展,聚类分析被引进到统计分析中来,形成了聚类分析这样一种多元分析方法。

聚类分析主要用于辨认具有相似性的事物,并根据彼此不同的特性加以"聚类",使同一类的事物具有高度的相同性。说得简单一点,就是按照一定标准来鉴别地理区域或实体、现象之间的接近程度,并将相接近的归为一类的数学方法。

选择刻划对象间两两接近程度的要素和具体标定方法,是聚类分析的关键性基础工作。它主要依靠地理专业知识,具体标定方法很多,常用的有相关系数法、欧氏距离法、夹角余弦法及数量积法等。把彼此接近的归为一类的聚类方法也有多种,如一次性完成的系统聚类和逐步完成的动态聚类;基于分明(硬)划分的聚类和基于模糊(软)划分的聚类;具体实施上有通过矩阵运算实现的,也有应用图论方法实施的。

基于不同变量(元素)的统计规律,按照变量间的相关性(R型,Q型,将多个变量进行分类或分组,每一组代表不同类型的地质意义。

①研究成矿元素与伴生元素之间的关系,为选择指示元素提供依据

②通过不同元素的组合研究岩浆岩、地层、构造岩与矿化的关系,确定矿产类型或地质背景;

④了解各地质单元或景观环境的元素组合特点;

⑤对多元素异常进行分类。

方法原理: 

根据相关矩阵作R型聚类分析,采用逐步形成法(系统聚类法)。

①为便于计算相关矩阵,首先对原始数据作标准化标度,标准化数据具有均值为零,方差为1的统计特性,变量k和变量j的相关系数计算公式为

地球化学数据处理与分析--聚类分析

 

i=1,2, ,Nj,k=1,2, ,M

 

②按上式计算M个变量的初始相关矩阵R(0)

③从R(0)中选取相关系数最大的两个变量首先连结,并把这两个变量归并为一个新的组合变量,随之计算这个组合变量的原始数据(取这两个变量连结前标准化数据的平均值),变量总数减少一个。

④重新计算M-1个变量的相关矩阵R(1)

⑤从R(1)中再选取相关系数最大的两个变量进行连结,再构成一个新的组合变量,随之计算这个新变量的原始数据(取该组合变量所含全部原始变量标准化数据的平均值。这里强调“全部”两字是因为这两个变量在合并前可能已是组合变量),变量总数又减少一个。

⑥再计算M-2个变量的相关矩阵R(2),并从R(2)中挑选相关系数最大的一对变量进行连结,如此反复进行下去,直至全部变量连结为一群为止。

按上述步骤,把每次归并的一对变量,按相关系数大小逐步连结,即可绘出一张树枝状谱系图。

分析方法:

① 选择研究区分析单元;

② 确定分析元素(建议不少于10个);

③ 选择计算方法(针对元素分组和相关性分析,选择R型);

④ 绘制谱系图;

⑤ 确定分组相关系数下限(建议>0.5,并对元素分组;

⑥ 对元素分组结果进行地质与成矿因素的分析解释。

应用聚类分析的元素分组可确定矿床类型和元素的组合特征,也可通过已知成矿单元的类比,预测评价相关研究区内相关单元可能发现的矿床类型等。

温馨提示:请扫描下方二维码支持下我吧。我会继续为各位同行和爱好者提供优质的资源和文章。


分享到:
  • 欢迎扫码关注我的公众号
  • 一个可以获取淘宝内部优惠券的公众号
  • weinxin
  • 我的微信号
  • 欢迎扫码关注
  • weinxin
冰&太阳
mindmanager最新学习资料视频+安卓版本(超40G )
【正版包邮】中国区域大地构造学教程(葛肖虹)
3dmine2014.3企业版破解版下载地址
mindmanager 2016完美破解版(序列号注册码)下载

发表评论

您必须才能发表评论!