记录下最近阅读的一篇于2024年5月在Nature Communications上发表的文章"Single-cell and spatial transcriptomics analysis of non-small cell lung cancer",记录下翻译过程,以备后期随时翻阅。
摘要
肺癌是第二大常见的癌症,也是全球癌症相关死亡的主要原因。肿瘤生态系统包含多种类型的免疫细胞,其中髓系细胞尤为常见,并在促进疾病方面发挥了重要作用。在本项研究中,通过单细胞和空间转录组学,对来自 25 名未接受治疗的腺癌和鳞状细胞癌患者的约 90 万个细胞进行了分析。我们注意到抗炎巨噬细胞与 NK 细胞/T 细胞之间存在逆相关关系,且肿瘤内 NK 细胞的细胞毒性降低。虽然在腺癌和鳞状细胞癌中观察到类似的细胞类型组成,但我们发现各种免疫检查点抑制剂的共表达存在显著差异。此外,我们揭示了肿瘤中巨噬细胞的转录“重编程”证据,使它们转向胆固醇输出并采用类似胎儿的转录特征,从而促进铁外排。我们的多组学资源提供了肿瘤相关巨噬细胞的高分辨率分子图谱,增强了我们对其在肿瘤微环境中作用的理解。
结果
NSCLC 样本的 scRNA-seq 和空间图谱
为了确定 LUAD 和 LUSC 中免疫和非免疫细胞状态的异质性及其空间分布,我们收集了 25 名未接受治疗的 LUAD(n=13)、LUSC(n=8)或未确定肺癌(LC,n=4)患者的肺组织切除样本,以及两名健康的已故捐赠者的样本(图 1A,B 和补充数据 1)。我们收集了肿瘤和匹配的正常非肿瘤组织(即背景),分离了 CD45+ 免疫细胞(补充图 1A)以及肿瘤和其他非免疫群体(使用 CD235a 柱去除红细胞),并进行了 scRNA-seq。此外,来自上述 25 名患者中的 8 名患者的肿瘤和背景组织切片被用于使用 10x Genomics Visium 平台进行空间转录组学处理(总共36 个切片)。
A. 研究概述。对切除的肿瘤组织、邻近未受影响的组织(背景)和已故捐赠者的健康肺进行单细胞悬浮液处理,富集 CD45+ 或 CD235− 细胞并进行单细胞 RNA 测序(scRNA-seq)。将新鲜、快速冷冻的肿瘤、背景和健康组织的冷冻切片用于 10x Visium 空间转录组学分析。 B. 队列概述。符号代表个体患者和进行的分析 C. 肿瘤和组合的背景 + 健康数据集的 UMAP 投影。 D. 用于肿瘤样本中广泛细胞类型注释的代表性基因的点图。 E. 等高线图显示 AT2 细胞(44,399 个细胞)、CAMLs(2520 个细胞)和 AIMɸ(16,120 个细胞)中髓系(LYZ, CD68, MRC1)和上皮(EPCAM)基因的共表达。基因表达已归一化、缩放和对数转换。 F. 箱线图显示 AT2 细胞、CAMLs 和 AIMɸ 中髓系(LYZ, APOE, CD68, MRC1)和上皮(EPCAM, KRT8, KRT19)基因的归一化、缩放和对数转换后的基因表达。箱子表示四分位数,须线表示 1.5 倍的四分位距。 G. 计算在 CD235− 富集中的肿瘤和背景中的非免疫细胞亚群的相对比例。箭头表示肿瘤相对于背景的增加(↑)或减少(↓)。通过双侧 Wilcoxon 秩和检验和 Bonferroni 校正进行成对比较。**P < 0.01。没有星号的箭头表示该细胞类型仅在肿瘤或背景中发现 H. 计算在 CD235− 富集中鉴定的所有免疫细胞中的肿瘤和背景中的广泛免疫细胞的相对比例。箭头表示肿瘤相对于背景的增加(↑)或减少(↓)。通过双侧 Wilcoxon 秩和检验和 Bonferroni 校正进行成对比较。*P < 0.05,**P < 0.01,**P < 0.001。没有星号的箭头表示该细胞类型仅在肿瘤或背景中发现。 I. 计算在 CD235− 富集中的肿瘤和背景中的广泛注释中的 NK、DC、B、T 和巨噬细胞亚群的相对比例。箭头表示肿瘤相对于背景的增加(↑)或减少(↓)。通过双侧 Wilcoxon 秩和检验和 Bonferroni 校正进行成对比较。**P < 0.001。没有星号的箭头表示该细胞类型仅在肿瘤或背景中发现。
肿瘤相比于邻近肺组织表现出更高的免疫和非免疫细胞多样性
A. 热图显示每种免疫细胞类型的相对细胞类型丰度之间的 Pearson 相关性(在 CD235− 富集中计算)。颜色表示 Pearson 相关值,星号表示基于 Pearson 乘积矩相关系数计算的双侧关联检验的显著性水平(*P < 0.05,P < 0.01,*P < 0.001)。
B. 热图显示在 LUAD(左)和 LUSC(右)中所有细胞类型之间的 LR(配体 - 受体)相互作用数量,按广泛细胞注释总结。行使用欧几里得距离的完全链接法进行层次聚类。
C. Sankey 图显示 CellphoneDB 检测到的 LUAD 和 LUSC 中特定肿瘤的选定 ICIs(免疫检查点抑制剂)相互作用。线条颜色表示 LUAD 中发现的 LR 相互作用(橙色)、LUSC 中发现的 LR 相互作用(绿色)或两种肿瘤类型中均发现的 LR 相互作用(蓝色)。
D. ICI 基因和(C)中突出显示的细胞类型的点图,按肿瘤类型分割。每个点大小表示簇中表达基因的细胞百分比,颜色表示每组中每个基因的平均归一化、缩放和对数转换表达。
E. Sankey 图显示 CellphoneDB 检测到的 LUAD 和 LUSC 中 VEGFA/B 相互作用的肿瘤特异性相互作用。线条颜色表示 LUAD 中发现的 LR 相互作用(橙色)、LUSC 中发现的 LR 相互作用(绿色)或两种肿瘤类型中均发现的 LR 相互作用(蓝色)。
F. Sankey 图显示 CellphoneDB 检测到的 LUAD 和 LUSC 中 EGFR 相互作用的肿瘤特异性相互作用。线条颜色表示 LUAD 中发现的 LR 相互作用(橙色)、LUSC 中发现的 LR 相互作用(绿色)或两种肿瘤类型中均发现的 LR 相互作用(蓝色)。
LUAD 和 LUSC 具有相似的细胞组成但利用不同的细胞间相互作用网络
A. 空间图像显示通过 cell2location 估算的 AT2 细胞、AIMɸ 和 Tregs 在代表性肿瘤切片上的细胞丰度。 B. 基于 cell2location 对肿瘤和背景切片中细胞丰度估算的免疫(左)和非免疫(右)细胞类型的相对比例。免疫细胞根据其广泛注释进行分组。箭头表示肿瘤中相对于背景的增加(↑)或减少(↓)。使用双侧 Wilcoxon 秩和检验和 Bonferroni 多重比较校正进行配对比较。*P < 0.05,**P < 0.01,***P < 0.001。没有星号的箭头表示该细胞类型仅在肿瘤或背景中发现。请参阅补充数据 13 和 14 以获取确切的 P 值。 C. 空间 LR 共定位的热图。在所有切片中,每个点估计 LR 基因对的共表达,并使用 χ² 检验比较肿瘤和背景中共定位与非共定位点的频率,随后进行 Bonferroni 多重比较校正。深灰色方块表示肿瘤和背景切片中共定位基因对频率显著不同。绿色列注释表示在至少八名患者中四名中显著的 LR 对。行注释表示肿瘤类型。 D. 箱线图显示每个分析切片中肿瘤与背景中显著不同的共定位 LR 对的频率。N = 8 名患者。箱线图使用 Python Seaborn 包中的默认设置绘制,即,箱线显示四分位数,须长为四分位距的 1.5 倍。源数据作为源数据文件提供。 E. 空间图像显示在肿瘤(上)和背景(下)中找到的共表达 LR 对的位置,对于 NRP1-VEGFA、NECTIN2-TIGIT、PD1-PDL1、CD96-NECTIN1 和 HAVCR2-LGALS9。来自一名患者的代表性切片。
肿瘤和背景组织中不同细胞类型的分布
A. CNA 分析。该图显示了通过 CopyKat 估算的每条染色体臂中不同细胞类型和肿瘤数据集中患者的染色体增益(红线)和损失(蓝线)。为了绘图目的,所有免疫细胞类型被归为一组。
B. PAGA 图覆盖在肿瘤中非免疫细胞类型计算的扩散图(力导向布局—FLE 嵌入)上。
C. 前三个面板——合格病理学家的代表性盲注释,显示肿瘤浸润区域(左),Visium 点上的肿瘤区域分区(中)和通过 QC 的点(右)。后三个面板——在同一切片上,cell2location 对 AT2 细胞(左)、循环 AT2 细胞(中)和非典型上皮细胞(右)的估计,覆盖了病理学家对肿瘤浸润的注释(绿色轮廓)。
D. 使用 clusterProfiler R 包对基因本体论—生物过程(GO:BP)和 REACTOME 数据库进行过度表现分析,使用肿瘤 vs 背景中 AT2 细胞上调的 DEGs。源数据作为源数据文件提供。
E. 来自一名代表性患者肿瘤的 AT2 和 CAMLs 的 CNA 详细概述。条形图显示了在特定染色体区域中具有染色体增益(红条)或损失(蓝条)的细胞频率。
F. 散点图显示了肿瘤数据集中每种细胞类型的损失(x 轴)和增益(y 轴)的 KL 散度,使用它们的增益和损失分布计算。为了绘图目的,所有免疫细胞类型被归为一组。
G. 空间图像显示了 cell2location 估计的三个代表性肿瘤切片上的 AT2 细胞和 CAMLs 的细胞丰度。
H. 在所有肿瘤切片中,通过 QC 的点上(cell2location 估计的)细胞类型组成计算的相关距离的层次聚类。
I. 在所有肿瘤切片中,通过 QC 的点上(cell2location 估计的)细胞类型丰度的 q05 估计上建立的非负矩阵分解。
TAMs 在肿瘤中促进胆固醇和铁的外流
A 火山图展示了肿瘤 vs 背景中 AIMɸ 的差异表达基因(DEGs,红色),使用 py_DESeq2 包提取。
B 对基因本体——生物过程数据库的过度代表性分析,使用 clusterProfiler R 包,对在肿瘤 vs 背景中上调的肺泡 Mɸ 和 AIMɸ 的 DEGs 进行分析。数据来源提供于 Source Data 文件中。
C 肿瘤和背景组织切片上的 CD68 和中性脂质(BODIPY 493/503)的免疫组织化学染色。Z 轴堆叠的最大强度投影。比例尺 50 µm。
D 肿瘤和背景切片中 BODIPY 信号覆盖的面积。BODIPY 面积覆盖差异由配对、双侧 t 检验确定,匹配来自同一患者的肿瘤和背景切片。N = 5 名患者。数据来源提供于 Source Data 文件中。
E 肿瘤(左)和背景(右)组织切片上的 CD68 和 STAB1 的免疫组织化学染色。Z 轴堆叠的最大强度投影。插图显示了单个细胞的详细放大图。比例尺 20 µm。
F CD68+ 巨噬细胞群体内 STAB1+ 细胞的定量。显示为总 CD68+ 区域的百分比的 STAB1 + CD68+ 区域的比例。数据以平均值和标准差表示(n = 3 个生物复制)。数据来源提供于 Source Data 文件中。
G 肿瘤组织切片上的 CD68、STAB1 和 PanCK 的染色。Z 轴堆叠的最大强度投影。插图显示了单个细胞的详细放大图。比例尺 20 µm。
H NSCLC 中 CD68+ 巨噬细胞群体内 STAB1 + CD68+ 细胞的定量。数据以平均值和单个数据点表示(n = 2 个生物复制)。数据来源提供于 Source Data 文件中。
I 点图显示了肿瘤中所有巨噬细胞亚群和 CAMLs 的“STAB1 特征基因”的表达。
J 火山图展示了肿瘤中肺泡 Mɸ vs STAB1 Mɸ 的差异表达基因(DEGs,红色),使用 py_DESeq2 包识别。
K 对基因本体——生物过程数据库的过度代表性分析,使用 clusterProfiler R 包,对肿瘤中肺泡 Mɸ vs STAB1 Mɸ(顶部)和 AIMɸ vs STAB1 Mɸ(底部)的 DEGs 进行分析(左——STAB1 Mɸ 上调;右——肺泡 Mɸ 或 AIMɸ 上调)。数据来源提供于 Source Data 文件中。
讨论
本项研究整合了来自 25 名未接受治疗的患者的肿瘤切除和相邻非恶性组织中的近 90 万个细胞的 scRNA-seq 数据,并结合空间转录组学,构建了肺癌中免疫和非免疫成分的图谱。
LUAD 和 LUSC 是最常见的两种 NSCLC 亚型,它们表现出显著不同的预后结果,并显示出针对亚型的治疗潜力。尽管细胞类型组成相似,但我们观察到 LUAD 和 LUSC 在若干 ICIs 和抑制分子的共表达方面存在显著差异,突显了治疗机会。
TME 在调节 Mɸ的群体和行为方面起着关键作用。我们发现,与相邻的非肿瘤组织相比,肿瘤切除物中单核细胞比例较低,但单核细胞来源的细胞比例较高,如 mo-DC2 和抗炎 Mɸ,表明 TME 中单核细胞分化增强。抗炎 Mɸ,包括 STAB1 + Mɸ的普遍性,与肿瘤环境中 NK 细胞和 T 细胞的丰度呈负相关;肿瘤中的 NK 细胞表现出较低的细胞毒性活动。我们的结果与最近的研究一致,该研究发现肺 Mɸ清除肿瘤细胞碎片会导致其转化为免疫抑制表型,从而阻碍 NK 细胞向 TME 的浸润。
在肿瘤中的 Mɸ群体中,我们还鉴定了表现出最高免疫抑制标记物水平的 STAB1 + Mɸ。这些 STAB1 + Mɸ展示了类似于胎儿肺 Mɸ的基因表达模式,并表现出铁代谢的改变,标志着在 TME 中与铁释放相关的基因表达增加。因此,我们假设 STAB1 + Mɸ可能在通过维持高循环肿瘤细胞的铁需求来支持肿瘤进展中起关键作用。综上所述,我们的综合数据集帮助识别了肺肿瘤微环境中 Mɸ群体的多种分子变化,这将有助于开发针对 NSCLC 的治疗策略。
数据可用性
本研究中生成的 scRNA-seq 和 Visium 数据集可在 BioStudies 公开获取(https://www.ebi.ac.uk/biostudies/),登录号分别为 E-MTAB-13526 和 E-MTAB-13530。其余数据可在本文、补充信息或源数据文件中获取,源数据随本文提供。
代码可用性
用于所有分析和生成本文所有图表的脚本可在以下网址获取: https://gitlab.com/cvejic-group/lung https://github.com/sdentro/copykat_pipeline