前沿生物大数据分析(24)Nature | 2658个癌症的进化史
原创 偲忳 图灵基因 今天
关注“图灵基因”,获取更多权威资讯
撰稿:偲忳
责编:文迪
IF=43.07
推荐度:⭐⭐⭐⭐⭐
亮点:
1.提出建立了癌症进化史的首次大规模全基因组测序,重建了突变进程和驱动突变的演变。
2.发现癌症的进化,主要与驱动突变和拷贝数改变有关。
近日,来自泛癌症全基因组分析合作项目(Pan-Cancer Analysis of Whole Genomes Consortium)的研究者们在Nature上发表了题为‘The evolutionary history of 2,658 cancers’的文章。作为全球癌症基因组协会(ICGC)和癌症基因组图谱计划(TCGA)的泛癌症全基因组分析合作项目(PCAWG)的一部分,对2658种癌症进行了全基因组测序分析,重建了38种癌症的生命史以及突变进程和驱动突变的演变。
此项研究提出了癌症进化史上首次大规模全基因组重建,同时重建了38种癌症的早期和晚期。研究得到的数据使得能够绘制大致时间表,总结每种癌症类型的典型进化史,包括大肠腺癌,鳞状细胞癌,卵巢腺癌和胰腺癌。利用了点突变和拷贝数改变的定性时序,以及特征活动,这些特征活动可以与全基因组复制(WGD)的时间估计和最近共同祖先(MRCA)的出现交织在一起。
研究者们利用PCAWG数据集来描述来自2658个捐赠者的2778个癌症样本的38种癌症类型。推断染色体进化的时间和模式,并学习每种癌症类型样本的典型突变序列。然后,定义了肿瘤进化的广泛时期,并研究了驱动因素和突变特征在这些时期之间的变化。利用类时钟的突变过程,将突变时序估计映射到近似实时。结合这些分析,可以勾勒出癌症典型的进化轨迹,并实时绘制出与诊断点相关的图。
癌细胞的基因组是由其进化过程中累积的体细胞畸变形成的,而这段历史的一部分可以从全基因组测序数据中重建出来。最初,每个点突变发生在单个细胞的单个染色体上,这就产生了一个具有相同突变的细胞谱系。如果该染色体位点随后被复制,则该等位基因在增益之前的任何点突变都将随后出现在两个产生的等位基因拷贝上,与增益之后的突变或其他等位基因的突变不同。由于测序数据能够测量等位基因拷贝的数量,可以定义早期和晚期克隆变异的类别,之前或之后的拷贝数增益,以及未指定的克隆变异,这些是所有癌细胞共有的。最后,确定亚克隆突变,这些突变只存在于细胞的一个子集中,并且发生在肿瘤样本中所有癌细胞的MRCA之后。分析如图中所示,在随后的时间点,样本经历了一次全基因组复制(WGD)事件,在一次事件中复制了包括衍生染色体在内的所有等位基因,这一点的证明是,所有拷贝数增益的突变时间估计值都聚集在一个时间点上,与拷贝数的确切状态无关。
点突变可以定性地分配到不同的时期,从而允许驱动突变的时间。在2583个样本中的4700万个点突变中,22%是早期克隆,7%是晚期克隆,53%是非特定克隆,17%是亚克隆。在453个肿瘤驱动基因中,共鉴定出5913个癌基因点突变,其中29%为早期克隆,5%为晚期克隆,56%为非特定克隆,8%为亚克隆。因此,常见的驱动因子在早期克隆和未指定克隆类别中富集,在晚期克隆和亚克隆类别中耗尽。随着时间的推移,聚集所有驱动点突变的克隆状态揭示了在肿瘤发育后期突变的驱动基因的多样性:所有50%的早期克隆驱动器突变发生在9个基因中,而50%的晚期和亚克隆突变发生在大约35个不同的基因中,几乎增加了四倍。这些结果表明,与以往对单个肿瘤类型的研究一致,一般来说,癌症进化的早期事件发生在一组受限制的共同驱动因素中,并且更多的驱动因素参与了晚期肿瘤的发展。
虽然单个事件的时序估计反映了不同样本之间的进化周期,但它们在一定程度上定义了每个样本中发生驱动突变和拷贝数改变的顺序。在许多癌症类型中,先前尚未详细确定癌症进展过程中的事件顺序。图中显示了聚合单一样本顺序揭示的驱动突变的典型时序。
癌症基因组在其生命周期中受到各种变异过程的影响,这些变异过程源于外部和细胞内的DNA损伤,以及容易出错的DNA复制,留下了特征性的变异谱,称为变异信号。根据克隆等位基因状态对突变进行分层,在29%(1852个样本中的530个)的信息样本(P<0.05,Bonferroni校正似然比检验)中发现了突变谱在早期和晚期克隆时间点之间变化的证据。同样,30%的信息样本(2387个样本中的729个)在克隆状态和亚克隆状态之间显示出突变谱的变化,中位数差异为21%(范围3-72%)。综合来看,40%的样本(2688个样本中的1069个)的突变谱在整个肿瘤演化过程中都发生了变化。图中是早期和晚期克隆肿瘤进化过程中的动态突变过程。
研究阐明了在体内肿瘤发展的典型时间表,最初的驱动事件似乎发生在诊断前几十年,展示了癌症基因组是如何通过体细胞进化的终身过程,具有正常衰老和癌症演变之间的流动界限。正因为这种具有如此长潜伏期的基因变异的存在,使人们有希望在变异克隆体达到完全恶性之前,尽早发现它们。这一发现有助于进行肿瘤早期诊断,了解肿瘤进化以及生物标志物的开发。
参考文献
1. Gerstung, M., Jolly, C., Leshchiner, I. et al. Theevolutionary history of 2,658 cancers. Nature 578, 122–128(2020).
【前沿生物大数据分析】同主题推文
DeepMind颠覆大脑学习主流理论: 分布TD算法
Nature Cancer | 预测免疫检查点的阻断结果,根据多模式基因组学
Nature comm | AI设计活性化合物,针对指定靶标
Lancet Oncology | 前列腺癌AI诊断系统实现早筛和格里森(Gleason)分级
Nature Medicine | 蛋白质扫描+临床大样本量单一来源的健康检查?
Nature Biomedical Engineering | 深度学习眼底图像筛查贫血
本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。
如果侵犯了你的权益请来信告知我们删除。邮箱:dacesmiling@qq.com