1 C题:古代玻璃制品的成分分析与鉴别
丝绸之路是古代中西方文化交流的通道,其中玻璃是早期贸易往来的宝贵物证。早期的玻
璃在西亚和埃及地区常被制作成珠形饰品传入我国,我国古代玻璃吸收其技术后在本土就地取
材制作,因此与外来的玻璃制品外观相似,但化学成分却不相同。
玻璃的主要原料是石英砂,主要化学成分是二氧化硅(SiO2)。由于纯石英砂的熔点较高,
为了降低熔化温度,在炼制时需要添加助熔剂。古代常用的助熔剂有草木灰、天然泡碱、硝石
和铅矿石等,并添加石灰石作为稳定剂,石灰石煅烧以后转化为氧化钙(CaO)。添加的助熔
剂不同,其主要化学成分也不同。例如,铅钡玻璃在烧制过程中加入铅矿石作为助熔剂,其氧
化铅(PbO)、氧化钡(BaO)的含量较高,通常被认为是我国自己发明的玻璃品种,楚文化
的玻璃就是以铅钡玻璃为主。钾玻璃是以含钾量高的物质如草木灰作为助熔剂烧制而成的,主
要流行于我国岭南以及东南亚和印度等区域。
古代玻璃极易受埋藏环境的影响而风化。在风化过程中,内部元素与环境元素进行大量交
换,导致其成分比例发生变化,从而影响对其类别的正确判断。如图 1 的文物标记为表面无风
化,表面能明显看出文物的颜色、纹饰,但不排除局部有较浅的风化;图 2 的文物标记为表面
风化,表面大面积灰黄色区域为风化层,是明显风化区域,紫色部分是一般风化表面。在部分
风化的文物中,其表面也有未风化的区域。
现有一批我国古代玻璃制品的相关数据,考古工作者依据这些文物样品的化学成分和其他
检测手段已将其分为高钾玻璃和铅钡玻璃两种类型。附件表单 1 给出了这些文物的分类信息,
附件表单 2 给出了相应的主要成分所占比例(空白处表示未检测到该成分)。这些数据的特点
是成分性,即各成分比例的累加和应为 100%,但因检测手段等原因可能导致其成分比例的累
加和非 100%的情况。本题中将成分比例累加和介于 85%~105%之间的数据视为有效数据。
请你们团队依据附件中的相关数据进行分析建模,解决以下问题:
问题 1 对这些玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析;结合玻
璃的类型,分析文物样品表面有无风化化学成分含量的统计规律,并根据风化点检测数据,预
测其风化前的化学成分含量。
问题 2 依据附件数据分析高钾玻璃、铅钡玻璃的分类规律;对于每个类别选择合适的化
学成分对其进行亚类划分,给出具体的划分方法及划分结果,并对分类结果的合理性和敏感性
进行分析。
问题 3 对附件表单 3 中未知类别玻璃文物的化学成分进行分析,鉴别其所属类型,并对
分类结果的敏感性进行分析。
问题 4 针对不同类别的玻璃文物样品,分析其化学成分之间的关联关系,并比较不同类
别之间的化学成分关联关系的差异性。
附件
表单 1 玻璃文物的基本信息
表单 2 已分类玻璃文物的化学成分比例,其中
(1) 文物采样点为该编号文物表面某部位的随机采样,其风化属性与附件表单 1 中相应文
物一致。
(2) 部位 1 和部位 2 是文物造型上不同的两个部位,其成分与含量可能存在差异。
(3) 未风化点是风化文物表面未风化区域内的点。
(4) 严重风化点取自风化层。
表单 3 未分类玻璃文物的化学成分比例
2 解题思路
从整体上来看
A题 波浪能最大输出功率设计
此题属于传统的物理类题目,需要过硬的专业技能和计算能力。需要模拟仿真的能力,此题建议相关专业同学选择,由于所有指标都给的很明确,所以存在最优解(可能是一个范围值)。建议在最后对对答案,答案的正确与否会对最终成绩产生较大影响。推荐物理学、电气工程、数学等相关专业选择。难度较高,开放度较低。
B题 无人机遂行编队飞行中的纯方位无源定位
题型比较常见,在过去的数模竞赛中,已经出现了很多次关于无人机的调度等问题,这次是关于定位的问题。问题的核心在于如何以更少的信号源(无人机发射信号),使得实现无人机的有效定位,建议使用仿真模拟的方式,逐一增加信号源,计算其定位。这道题目中,由于各个无人机是在持续运动的,所以应该设计一个预判优化模型,使得目标值最小。这道题目适合数学、统计学相关专业的同学选择,难度适中,由于数值都已给定,所以开放度也较低,存在最优解(可能是一个范围值)。建议在最后对对答案,答案的正确与否会对最终成绩产生较大影响。
C题 古代玻璃制品的成分分析与鉴别
这道题就是很多同学在训练的时候经常做的题目类型了,属于大数据、数据分析类题目。需要对玻璃制品的成分进行分析,这里就涉及到需要建立一些评价模型,需要做因子分析、主成分分析等常用的机器学习算法,同时需要一些可视化图来进行支撑。后面更新的C题思路,将会有详细的分析。这道题目推荐所有专业同学选择,门槛较低且开放度也相对较高。
C题最简单
第一问可以用关联分析算法解答
第二问做主成分分析,对数据进行聚类
第三问根据第二问的聚类分析计算中心距离来进行分类
第四问A君认为核心是差异性,那么就得找到一个效果明显的特性提取算法
详细内容会更新到思路中
四问思路都已经更新
预处理
1、首先进行数据预处理工作,根据题目要求:将成分比例累加和介于85%~105%之间的数据视为有效数据,根据分析编号15和编号17的总成分小于85%因此在接下来的计算中不考虑编号15和编号17两组错误数据,将其进行剔除处理。
2、附件表单1中颜色列中的数据中,我们发现有四个空值,通过观察数据变化情况发现颜色的深浅程度与风化程度呈现正相关变化,因此我们将四个空值进行填补,填补为“黑色”。
3、附件表单2给出了相应的主要成分所占比例,空白处表示未检测到该成分,而不是缺失值,因此我们将未检测到的数据进行补“0”处理,方便接下来的计算。
针对表面风化情况进行卡方检验
首先使用Excel中的VLOOKUP函数将表单1和表单2中的数据进行合并,方便接下来的统计,通过观察数据发现纹饰、类型、颜色、表面风化均为定类变量,针对多组定类变量之间的差异性分析我们采用卡方检验。
卡方检验主要是比较定类变量与定类变量之间的差异性分析。通过统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。
变量X:表面风化;变量Y:纹饰,类型,颜色,使用SPSS软件进行交互分析,得出如下表
不同玻璃的类型表面有无风化统计规律分析
接着,我们筛选出铅钡玻璃以及高钾玻璃风化前后相对重要的化学成分频率分布直方图的对比分析,使用Matlab编程求解,得出结果如下图
由频率分布直方图可以直观的看出高钾玻璃在风化后主要化学成分含量呈下降趋势;铅钡类玻璃在风化后主要化学成分含量呈上升趋势。