人类大脑在整个生命周期中经历复杂的结构变化。这些变化包括从生命早期到青春期发生的大规模突触修剪、髓鞘形成以及神经退行性过程,其过程和程度在大脑中的分布并不均匀。然而,研究大脑结构与实际年龄之间对应关系的研究结果并不一致。这种不一致可能再加上样本量相对较小和统计程序的不同所带来的差异,共同阻碍了人们尝试描述衰老与大脑结构变化之间关系的努力。研究大脑衰老对于区分典型衰老和病理性衰老具有重要意义。阿尔茨海默病(Alzheimer's Disease ,AD)是最常见的痴呆类型,影响着约22%的75岁以上人群。伴随AD出现的认知衰退和记忆缺陷等行为表现,在没有AD的衰老过程中也显而易见。为了更好地区分这两种情况,可靠地评估典型大脑衰老的特征可能是有益的。
2020年8月15日,由以色列比尔谢巴内盖夫本古里安大学认知与脑科学系的Gidon Levakov博士及研究团队在Human Brain Mapping(IF=3.5)上发表了题为“From a deep learning model back to the brain—Identifying regional predictors and their relation to aging”的文章,研究开发了一种推理方案,用于跨受试者组合这些解释图。利用该推理方法发现,先前被视为普遍萎缩标志的脑脊液腔隙对年龄预测的贡献最大。
研究从各种开放数据库(n = 15)中收集了10176个年龄在4到94岁之间的个体的T1w MRI脑部扫描样本。预处理流程包括四个阶段:进行90°旋转,使所有体积在左-右(L–R)、前-后(A–P)、上-下(S–I)方向上呈现相似的方向(使用FSL的fslreorient2std工具),使用颅骨去除工具(ROBEX),将体积调整到标准大小(90, 126, 110),以及进行体积标准化(μ = 0, σ = 1)。CNN模型是使用Keras和 TensorFlow后端实现的。其中,每个3D CNN模型都被单独训练以预测T1 MRI的年龄。每个网络的输入是一个3D体积,大小为[90,126,110],输出是一个代表实际年龄(岁)的标量。
用于年龄预测的网络架构。(a)用于3D T1 MRI体积年龄预测的网络的详细架构。BatchNorm =批量归一化,Conv =卷积层,ReLU =整流线性单元,FC =全连接层。(b)使用线性回归组合10个单独训练CNN的输出以创建最终年龄预测的集成过程
研究借鉴了现有研究的卷积神经网络(CNNs)从原始大脑结构成像中预测实际年龄方面的进展(Cole & Franke, 2017),并通过模型集成的方法实现了显著改进。研究分别训练了10个随机初始化的CNN。这些网络的平均绝对误差(MAE)为3.72年(±0.17),预测年龄与实际年龄之间的皮尔逊相关系数为0.97(±0.001)。接下来,研究人员在每个网络的输出上训练了一个简单的线性回归模型,以找到它们之间的最优线性组合,从而得出的平均绝对误差(MAE)为3.07,与实际年龄的皮尔逊相关系数为0.98。目前尚不清楚从单个样本中得出的解释图在多大程度上确实代表了整个群体。为了检验这个问题,研究用从两个独立的组中获得的逐渐增加的样本量来检验解释图的分裂样本相似性,并报告了这些图之间的骰子相似性和磁流体动力学,作为从中抽取样本大小的函数。结果表明,无论是由于噪声还是由于受试者特异性图谱的基本差异,从单个样本而不是总体中得出的解释具有低重复性。
实际年龄与模型对测试集的预测值的回归图。
在估计了10个CNN的不同解释图之间的相似性之后,研究通过对所有网络中的每个体素取中值来创建一个基于群体的整体图。通过测试每种组织类型的体积归一化贡献,研究发现,含有脑脊液(CSF)和脉络丛的空腔贡献最大(35.62%),其次是皮层下灰质(subcortical GM,27.66%)、白质(WM,19.49%),最后是皮层灰质(cortical GM,17.23%),其贡献最小。对年龄预测贡献最大的结构是脑室、蛛网膜下腔及其边界。最后,双侧丘脑和右侧中央前回是对预测贡献最大的GM区域。这两项分析都支持当前模型中的年龄预测主要基于含有CSF 的空腔中与年龄相关的形态变化。
跨100名受试者和10个网络的聚合解释图。阈值解释图显示在正中矢状面(左上)、冠状面(顶行左)和3个轴向(底行)切片上。
预测误差可能是由于模型无法捕捉大脑老化过程的复杂性,或者是由于人群中大脑形态的自然变异性。当前分析旨在研究预测误差是否与特定大脑区域的体积变异性相关。具体来说,通过使用Freesurfer应用Desikan-Killiany图谱,测试了推断方案突出显示的脑室和脑池的年龄控制体积是否与CNN集成预测误差相关。发现年龄标准化体积与脑室(不包括第四脑室、脉络丛和非脑室CSF)的预测误差之间存在显著相关性。这种相关性在这些区域中比在包裹中的任何其他脑区域中更高,支持结果对使用基于群体的解释图获得的区域的特异性。有趣的是,当检查区域体积和实际年龄之间的相关性时,这种特异性不明显,在几乎所有区域都可以看到这种显著相关性。这表明,当前的推断方案不仅检测到在老化中改变的区域,而且还检测到对当前预测具有最高贡献的不同区域,证明了该方法对所应用的模型的高特异性。
体积与年龄标准的偏差和预测误差
研究在包含10176名受试者的全生命周期样本中,提出了一个深度学习框架,通过原始T1脑图像来预测受试者的年龄。研究将跨受试者组合解释图的一种推理方案应用于一个CNN集成模型,从而创建了基于人群的而非特定于受试者的解释图。在未经训练的测试集上评估该模型,得出的平均绝对误差为3.07年,实际年龄与预测年龄之间的相关系数为0.98。利用该推理方法,研究发现,先前被视为普遍萎缩标志的脑脊液腔隙对年龄预测的贡献最大。通过比较该集成模型中不同模型所得出的解释图,可以评估模型所利用的大脑区域的差异和相似性。研究证明,该方法显著提高了解释图的可重复性,与基于体素的形态学年龄研究结果相一致,并突出了体积变异性与预测误差相关性最高的大脑区域。
参考文献:
Levakov G, Rosenthal G, Shelef I, Raviv TR, Avidan G. From a deep learning model back to the brain-Identifying regional predictors and their relation to aging. Hum Brain Mapp. 2020 Aug 15;41(12):3235-3252. doi: 10.1002/hbm.25011. Epub 2020 Apr 22. PMID: 32320123; PMCID: PMC7426775.