I期肺腺癌的线粒体基因组图谱和临床结局

Landscape of Mitochondria Genome and Clinical Outcomes in Stage 1 Lung Adenocarcinoma6.162

I期肺腺癌的线粒体基因组图谱和临床结局

. 2020 Mar; 12(3): 755.
Published online 2020 Mar 23. doi: 10.3390/cancers12030755


Abstract

Risk factors including genetic effects are still being investigated in lung adenocarcinoma (LUAD). Mitochondria play an important role in controlling imperative cellular parameters, and anomalies in mitochondrial function might be crucial for cancer development. The mitochondrial genomic aberrations found in lung adenocarcinoma and their associations with cancer development and progression are not yet clearly characterized. Here, we identified a spectrum of mitochondrial genome mutations in early-stage lung adenocarcinoma and explored their association with prognosis and clinical outcomes. Next-generation sequencing was used to reveal the mitochondrial genomes of tumor and conditionally normal adjacent tissues from 61 Stage 1 LUADs. Mitochondrial somatic mutations and clinical outcomes including relapse-free survival (RFS) were analyzed. Patients with somatic mutations in the D-loop region had longer RFS (adjusted hazard ratio, adjHR = 0.18, p = 0.027), whereas somatic mutations in mitochondrial Complex IV and Complex V genes were associated with shorter RFS (adjHR = 3.69, p = 0.012, and adjHR = 6.63, p = 0.002, respectively). The risk scores derived from mitochondrial somatic mutations were predictive of RFS (adjHR = 9.10, 95%CI: 2.93-28.32, p < 0.001). Our findings demonstrated the vulnerability of the mitochondrial genome to mutations and the potential prediction ability of somatic mutations. This research may contribute to improving molecular guidance for patient treatment in precision medicine.

Keywords: EGFR-activating mutations; lung adenocarcinoma; mitochondria; prognosis; somatic mutations.

数据和方法
数据
研究所用的61名ILUAD患者配对的肿瘤和邻近正常组织来自台湾的台中退伍军人综合医院,所有患者均接受治疗手术,无辅助治疗。然后,分离、提取了这些组织的线粒体DNA并进行双端测序。
作者从cBioPortalICGC和已发表的文章收集了多种癌型的体细胞和生殖系突变,肺癌样本的临床数据以及LUAD的核基因组突变数据下载自GDC
EGFR基因分型
首先用MALDI-TOF MS检测了EGFR突变,然后PCR扩增含有EGFR基因的区域,并用检测探针进行单核苷酸扩增,接下来进行MALDI-TO FMS分析。突变频率 =(突变型height)/(突变型height+野生型height)×100heightType4软件计算所得,对每个样品进行24次重复,并使用平均突变频率。
生物信息学分析
对于获得的测序数据,作者利用FastQC进行质量评估,通过NGSQCToolkit过滤掉低质量的读段,然后用BWA将高质量的读段比对到人类线粒体Cambridge参考序列(考虑了D-loop区域),并用SAMtools将结果转换成BAM文件。Picard-Tools’MarkDuplicates模块被用来去除PCR和光学重复,GATK-Haplotype caller用来识别生殖系突变,贝叶斯分类器结合intoGATK-Mutect2用来识别体细胞突变,PhyMer用于从正常组织的测序数据中识别单倍体,突变注释及预测用的是Variant Effect Predictor,最后,通路信息来源于KEGG
统计分析
对于每个样本,单个基因/基因组区域的突变频率计算方法为,基因/基因组区域的突变数除以长度,平均突变负荷是所有样本的平均突变百分比。
Fisher精确检验或Wilcoxon-Mann-Whitney检验用于对分类或连续数据进行比较;Kaplan-Meier法用于估计生存曲线,并用对数秩检验评估曲线之间的差异;单变量Cox比例风险回归估计的风险比(HR)用以评估预后效果;此外,用多因素Cox比例风险回归模型分析与OS(总生存期)RFS(无复发生存期)显著关联的变异(协变量为年龄、性别、EGFR突变、肿瘤大小和吸烟状况)
风险得分计算方法是加权系数乘以相应突变状态(无突变为0,突变为1)的线性组合,加权系数来源于D-环区及复合物IV和复合物V中基因的单因素Cox比例风险回归系数,并根据中位数将患者分为高、低风险组。所有分析都是在SASR中完成的,所有检验均采用双尾,显著性P值为0.05
结果
线粒体突变图谱
作者共识别了线粒体基因组中469处位置上的2180个生殖系突变(1.a),其中D-环区是最容易发生突变的,其次是CYTB基因。在蛋白编码基因中,突变率最低的是ND4LATP8,而且研究发现编码区的大多数生殖系突变是同义的。

根据整个线粒体基因组的生殖系突变,作者将患者分成了两种单倍群:单倍群M和N,如图1.b所示,单倍群M的突变率高于单倍群N。在携带EGFR激活突变的患者中,rRNA基因高度突变,而没有突变的患者其CYTB和复合物III基因高度突变。在分别以年龄、性别和吸烟与否划分的组别中,并未发现突变的显著差异。

1. 早期LUAD患者的线粒体生殖系突变
为了评估LUAD患者线粒体基因组的变异性,作者根据其中56个患者的突变谱识别出了284个线粒体基因组中的体细胞突变(2.a)。平均的体细胞突变频率为0.28kbp,平均每个患者有4个体细胞突变,大多数突变发生在编码区,而D-环区、tRNA和rRNA基因的突变较少,但突变率最高的是D-环区、线粒体编码的OXPHOS(氧化磷酸化)复合物I基因,基因ND5高度突变,其次是COX1OXPHOS复合物基因的体细胞变异约64%是错义的,复合物I的基因突变数最多,而复合物V的基因突变最少。

对于两个单倍群,作者发现他们的体细胞突变模式是相反的,且单倍群N的总突变频率较高,其D-环区的体细胞突变频率也显著高于单倍群M(2.b)。在EGFR激活突变的患者中,基因ND4的突变率较高。此外,研究发现体细胞突变率与年龄相关,但未发现与性别或吸烟有关。

图2. I期LUAD患者的体细胞突变
线粒体突变的核苷酸替换谱
作者绘制了LUAD23种其他癌症的生殖系线粒体核苷酸替换谱,发现最常见的是A:TG:CC:GT:A(3.a)LUAD和其他34种癌症的体细胞线粒体核苷酸替换谱,则表现出了不同的模式,在所有癌症中,C:GT:A最常见,而在LUAD中更多的是C:GA:T(3.b)

3. 线粒体突变的核苷酸替换谱
值得注意的是,LUADs中线粒体基因组和核基因组的体细胞核苷酸替换图谱是不同的,在两个基因组中,大部分突变都是C:GA:T转换引起的,但是相较于核基因组,线粒体基因组中的C:GA:T较多,C:GT:A较少,且C:GG:C转换几乎是缺失的 (4.a)

在不同的临床分组中,吸烟者和不吸烟者线粒体体细胞突变的核苷酸替换谱在男性和女性中有着显著差异;EGFR激活突变的患者,其线粒体基因组中有更多的C:GA:T体细胞替代,并且观察到较少的C:GT:A替换(4.b)。作者进一步分析后,发现C:GT:A替换在无EGFR激活突变的女性患者的线粒体基因组中完全缺失。

4. 核苷酸替换的比较
肺腺癌线粒体体细胞突变与预后
该研究分别分析了单基因、复合物和D-环区的体细胞突变与LUAD预后的关系,D-环区突变的患者有较长的RFS(图5.a),未发现与OS的显著关联;线粒体编码的复合物IV和复合物V基因发生突变的患者,其RFS较短(5.c-d),同样未发现与OS的显著关联;对复合物IV和复合物V联合作用的分析结果,表明它们的基因突变与较短的RFS有显著关联(5.e)

最后,作者利用COX比例风险回归分析(协变量为年龄、性别、肿瘤大小、吸烟与否、EGFR激活突变状态)评估了线粒体体细胞突变的独立预后价值。结果表明,D-环区、复合物IV和复合物V的突变与RFS独立相关,其中,D-环区突变具有保护作用,而复合物IV和复合物V的突变以及二者的联合作用都会增加风险。

5. 早期LUAD患者的RFS
作者利用二代测序绘制了LUAD的线粒体突变图谱,并通过进一步分析,发现D-环区发生体细胞突变的患者无复发生存期更长,而线粒体复合物IVV中的基因突变则与较短的无复发生存期相关。


分享