多元统计分析--聚类分析--主成份分析

帮助 dmadmin Founder • 于 2016-01-29 15:27:30 • 803 阅读

主成分分析

医学研究中经常遇到多指标的问题,例如描述牙槽弓形态特征的就有 22 个指标,衡量甲状腺机 能的有 21 个指标,鉴别阑尾炎病型的有 27 个指标等。指标多时不但增加收集数据的工作量,而且 对分析问题也往往带来不便,甚至增加分析问题的复杂性。事实上,不同指标之间往往有一定的相关性,因此有可能用较少的起支配作用的综合指标把存在于各原始指标中的主要信息分门别类地提取出来。这些为数较少的综合指标既能综合反映原始指标中所包含的主要的共同信息,而且相互之间又是无关的。即这些综合指标分别具有各自的独特含义,可以避免不必要的重叠。这种处理问题的方法就称为主成分分析,也称主分量分析,综合后的指标就称为是原始指标的主成分。也即各主成分都是原始指标的线性组合,主成分分析的首要任务就是要把上式中的各系数 bij 求 出来。理论上主成分数目最多可等于原始变量数 m,实际上往往只取少数几个主成分,即 p 远小于 m, 否则就背离了主成分分析的目的了。

主要功能

  1. 特征根及其贡献率,累计贡献率;
  2. 特征向量;
  3. 各主成分的系数;
  4. 各变量的公因子方差。
    • 注:最小累计贡献率范围为 0~100(%),通常,累计贡献率达 70%以上即认为比较满意。

例:

对某小学 10 名 9 岁男学生六个项目的智力测量的得分如下表。我们习惯用各项目得分之总 和(合计)来表示学生的智力,这种做法实际上是将各变量等同地看待,各变量赋于相同的权重。试对 此资料进行主成分分析。

file

数据输入

按照表格输入到云表格即可。

file

操作步骤

在[多元统计分析]菜单中,选择[主成分分析], 屏幕出现[主成分分析]对话框。在此对话框中,将数据单元格范围输入到对话框中,[最小累计贡献率%]选 95,点击[计算],便可得到分析结果。

file

file

结果解释

由特征表知前3个特征根的累计贡献率为93.5193%<95%,前4个特征根的累计贡献率为97.8004>95%,故取前4个主成分。它们是:

C1=0.4504z1+0.4584z2+0.4082z3+0.4527z4+0.315z5+0.3409z6

C2=-0.2887z1+0.0046z2-0.4481z3-0.1187z4+0.747z5+0.379z6

C3=-0.0001z1-0.4235z2-0.0437z3+0.1499z4-0.4036z5+0.7958z6

C4=-0.2657z1-0.0117z2+0.7102z3-0.6056z4+0.1215z5+0.2084z6

其中zi是相应的Xi的标准化变量。从特征向量来看:第一特征向量的各分量之大小大致相当,说明第一特征向量是一综合大小指 标;第二特征向量在X5上有较大的系数,说明第二特征向量反映的是动手操作能力;第三特征向量在X6上有较大的负荷,说明第三特征向量反映的是归纳演绎能力;第四特征向量在X3上有较大的负荷,说明第三特征向量反映的是理解能力。某个变量的公因子方差表示所有主成分可提取该变量中所含信息量的百分比,如 X1 的公因子方差为 0.9313,表明用 C1、C2、C3、C4 四个主成分可提取 X1 中所含信息的 93.13%。

回复数量: 0
暂无评论~~