标题:基于LC-MS的血清代谢组学分析在肾癌诊断、分期和生物标志物发现中的应用
Title: LC-MS based serum metabonomic analysis for renal cell carcinoma diagnosis, staging, and biomarker discovery
Journal:Journal of Proteome Research
影响因子:4.78
Published: December 28, 2010
Doi:10.1021/pr101161u
研究背景
肾细胞癌 (Renal cell carcinoma,RCC) 全球确诊率每年新增约20.8万人,在所有泌尿生殖系统肿瘤中最为致命。早期诊断通常是通过其他原因进行的成像而发现疾病,五年存活率普遍较高(95%),但超过50% 的患者在确诊时已表现为局部晚期或转移性肾癌,预后较差 (五年生存率 <2%)。由于化疗和放射治疗对晚期肾癌的治疗结果不理想,目前尚无针对第四期RCC的治疗方案。因此,早期诊断和发现潜在的肾癌生物标志物具有重要的临床意义。
进一步的遗传学研究发现肾细胞癌是一种代谢性疾病。已知的七个肾癌基因中每一个都与代谢压力或营养刺激的通路相关。因此确定了使用非靶代谢组学方法研究肾细胞癌的可行性。
目前大多数肾癌的诊断通过尿液样本的代谢标志物确定,但血清及血浆样本中同样存在应用空间:血液样本在正常生理条件下表现出较小的变异性,并且含有反映系统范围分解代谢和合成代谢所导致的全球变化的复杂的代谢物混合物,因此是代谢物筛选的更好的选择。
方法选择及研究设计
血清的高含水量使得血清样本中含有较多极性代谢物。为了全面找到更多代谢物,本研究采用反相层析(RPLC) 和亲水作用层析 (HILIC) 相结合的LC-MS方法,旨在更高效分离极性化合物。结合多变量数据分析,对肾细胞癌(RCC)患者和健康对照组的血清总谱进行了鉴定。
思路归纳
我们用三个大阶段来概括此类单一代谢组学的研究历程:
① 研究目的前期调研,样本类型选择,样本收集,实验处理及QC设置
②峰提取,数据处理及归一化,各类统计分析模型验证,得到初步差异代谢物结果
③结合疾病背景与原理,筛选可靠的疾病标志物,建立符合研究目的的标志代谢物诊断方案
研究对象选取方面,作者选择厦门市某医院33例肾癌患者和25例健康志愿者为研究对象。所有患者均经组织病理学检查确诊,且没有病人在采集样本前接受过化疗、放疗或肾切除术。根据2002年肿瘤结节转移(TNM)分期系统建立的RCC分期的判别中,33名患者中12名为早期(T1-2),21为晚期(T3-4)。为保证结果尽量少受病人其他体征影响,研究员对取样对象做了多种参数的控制变量:年龄范围相似,性别选取平均,BMI指数类似(见表1)。所有血样的采集均于早餐前完成,后续使用相同的处理方式及样本保存方式。
检测细节
RPLC使用2.1*150-mm Acclaim C18 3-μm 色谱柱,HILIC使用2.1* 150-mm Atlantis HILIC 3-μm 色谱柱。尽管分离方式及洗脱梯度都不同,研究人员使用了相同的总运行时间、流速及进样量。从不同的分离方式中发现(表2),一些无法在RP柱上被分离的化合物在HILIC柱上可以被很好分离,反之亦然。两种分离技术的综合利用可以克服单一方法对个别物质检测不准的问题,增强了分析方法的稳定性及结果的覆盖面
数学模型分析-PCA
经过峰提取和数据归一化处理后,RPLC和HILIC的归一化数据集分别包含1384和756个变量。
首先,我们使用无监督性统计分析模型PCA来检测QC样本的聚集性及样本数据的任何固有趋势。如图可见,圈中的6个蓝色QC样本在两种分离模式下的聚集程度好,说明样本上机过程中的数据可重复率较高。同时,黑色标点RCC疾病组与红色标点对照组之间有明显的分离趋势,可见RCC患者相对于对照组存在固有的代谢变化。
数学模型分析-PLS-DA
对于代谢类多参数组学而言,非监督的PCA模型对数据的差异分析有限,故引入了监督性分析模型PLS-DA。
PLS-DA模型采用R2Y (cum)和Q2 (cum)参数对模型进行评价,分别表明模型的适应度和预测能力。图1.3的三张PLS-DA模型都表现出了较好的组间分类预测结果。同时,图1.3-d展示了进行100次迭代的排列检验:所有排列在左边的R2 (cum)和Q2 (cum)值都低于右边的原始点,并且Q2 (cum)点的蓝色回归线有负截距,说明原始PLS-DA模型有效,确认该分析内容在统计学层面上可信。
总结
至此,我们确定该研究的结果通过了两种常规统计学分析验证,这样,就可以将同时满足监督性分析模型的VIP值(Variable Importance in the Projection)>1,且T检验P值<0.01的代谢物确认为差异代谢物,剔除病人组与健康组间无显著差异的参数,进行后续的功能研究及biomarker确定。
Biomarker发现
通常,仅在肾脏的肾细胞癌 (T1-2,无转移) 被认为是早期,而肾脏以外的肾细胞癌 (T3-4,有转移) 被认为是晚期。为了确定Biomarker更好的分类方式,研究人员先对不同分期的病人样本进行了PLS-DA分析。如图2.1, T1-2及T3-4的病人样本表现出的组间差异趋势非常大,说明存在可以区分不同分期并贡献于疾病预后研究的biomarker。
根据统计学上的差异物质及差异倍数FC共同筛选,可初步确认潜在biomarker:11种溶血磷脂酰胆碱(LPCs),鞘磷脂(SM)、血栓烷、苯乙酰甘氨酸、神经节苷脂GM3、鞘氨酸、乙酰苯丙氨酸、糖胆酸、甘油磷胆碱、肉碱、四氢脱氧皮质酮(THDOC)、溶血磷脂酰乙醇胺(LPEs)、色氨酸和酪氨酸。
但由于本研究的样本量有限,远不及人群大样本量的研究,以上候选biomarker的代谢物变化可能来自于与肾癌患者的药物治疗相关的因素影响,而非由于疾病本身导致的代谢物差异——因此,在biomarker的进一步确认阶段,我们不仅需要考虑统计层面的物质,还要根据代谢物的具体功能和所处通路做病理分析。
以溶血磷脂酰胆碱 (LPCs) 及鞘脂为例:
LPC是磷脂酶A2或卵磷脂-胆固醇酰基转移酶(LCAT) 通过水解磷脂酰胆碱形成的。它调节细胞增殖、肿瘤细胞侵袭等与肿瘤相关的重要生物过程。本研究结果中,多数LPC的显著下降表明磷脂分解代谢紊乱。同时,联系肾癌的几种已知机制(如磷脂酶A2或LCAT的活性受抑制,溶卵磷脂酰基转移酶的活性受干扰),我们可以大概率确定:血清LPC浓度可作为此类恶性疾病的常规指标。
图4中我们用红蓝两色标出了研究结果中显著上调/下调的鞘脂相关代谢物质:
鞘磷脂下调,而鞘氨酸和神经节苷脂均上调(P value <0.01)。本研究中的鞘脂参与了神经酰胺的合成代谢通路,下游即参与了糖基神经酰胺、乳基神经酰胺和神经节苷脂的合成。神经节苷类是常见的参与肿瘤生长和转移的调控因素,这一结果说明很大程度上鞘磷脂也可作为肾癌在血浆中的Biomarker之一。
同理,其他代谢物如乙酰苯丙氨、酪氨酸、色氨酸等具有显著差异的代谢物也可通过他们各自在生物合成及代谢等通路中发挥的作用,结合上下游物质和疾病病理来分析其作为biomarker的价值与关联程度。
此外,真正做研究时,还有很多细节是需要注意的,包括文中提到的样本收取控制变量、多种代谢物分离方式、数据处理方法、biomarker从初筛到确认的验证等。最后,项目不分大小,研究不分优劣。开学季即将到来,祝各位老师找到心仪的课题,研究顺利,获得理想结果!