题目:
C 题 古代玻璃制品的成分分析与鉴别
问题 1:
对这些玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析;结合玻璃的类型,分析文物样品表面有无风化化学成分含量的统计规律,并根据风化点检测数据,预测其风化前的化学成分含量。
分析:
这题相对简单一些,分析关系可以有相关性分析和差异性分析。
需要注意:这四个指标都是定类变量,并非连续变量,因此对于相关性分析,不能直接使用皮尔逊相关分析,可以采用斯皮尔曼相关系数分析(Spearman相关系数),并且需要转换成定量变量。
对于差异性分析,不能采用方差分析或T检验,应当采用卡方检验。(因为是定类变量)
解答:
卡方检验
变量:
变量 X X X:{表面风化}
变量 Y Y Y:{颜色,纹饰,类型}
- 分析卡方检验是否呈现显著性(P<0.05):
上表展示了模型检验的结果,包括数据的频数、频数百分比、卡方值、显著性P值。
我们解析来要分析的事情:
1.分析模型是否呈现出显著性(P<0.05)。
2.若呈现显著性,拒绝原假设,则说明各样本之间存在显著性差异。具体根据类别的差异百分比进行描述。反之数据不存在显著性差异。
根据上面的检验结果,我们可以得到的结论为:
基于表面风化和颜色,显著性P值为0.507,水平上不呈现显著性,接受原假设,因此对于表面风化和颜色数据不存在显著性差异;
基于表面风化和纹饰,显著性P值为0.056*,水平上不呈现显著性,接受原假设,因此对于表面风化和纹饰数据不存在显著性差异;
基于表面风化和类型,显著性P值为0.020**,水平上呈现显著性,拒绝原假设,因此对于表面风化和类型数据存在显著性差异。
卡方交叉热力图:
上图展示了热力图的形式展示了交叉列联表的值,主要通过颜色深浅去表示值的大小。
1. 表面风化-颜色热力图
2. 表面风化-纹饰热力图
3. 表面风化-类型热力图
效应量化分析:
上表展示了效应量化分析的结果,包括phi、Crammer’s V、列联系数、lambda ,用于分析样本的相关程度。
- 当呈现出显著性差异(前提),结合分析效应量指标对差异性进行量化分析。
- 效应量化指标反映的是变量之间的相关程度。
- 根据交叉类型的不同,可以选用不同的效应量指标(交叉类型表示:交叉表横向格子数×纵向格子数)。
- phi系数:phi相关系数的大小,表示两样本之间的关联程度。当phi系数小于0.3时,表示相关较弱;当phi系数大于0.6时,表示相关较强(用于2×2交叉类型表)。
- Cramer’s V:与phi系数作用相似,但Cramer’s V系数的作用范围较广。当两个变量相互独立时,V=0,当数据中只有2个二分类变量时,Cramer’s V系数的结果与phi相同(若m≠n,建议使用Cramer’s V )。
- 列联系数:简称C系数,用于3×3或4×4交叉表,但其受行列数的影响,随着R和C 的增大而增大。因此根据不同的行列和计算的列联系数不便于比较,除非两个列联表中行数和列数一致。
- lambda:用于反应自变量对因变量的预测效果,一般情况下,其值为1时表示自变量预测因变量效果较好,为0时表明自变量预测因变量较差(X或Y有定序数据时,建议使用lambda)。
结果显示,颜色 Cramer’s V值为0.341,因此颜色和表面风化的差异程度为中等程度差异;
纹饰 Cramer’s V值为0.326,因此纹饰和表面风化的差异程度为中等程度差异;
类型 Cramer’s V值为0.316,因此类型和表面风化的差异程度为中等程度差异。