潘多拉测序与非编码小RNA标志物开发研究方案:液体活检新星—tsRNA、rsRNA、piRNA

非编码RNA即不编码蛋白质的RNA,它们从基因组上转录而来,但是不翻译成蛋白,在RNA水平上就能行使各自的生物学功能。根据长度,我们将小于50nt的非编码RNA称为非编码小RNA(sncRNA),这就包括了miRNA、piRNA、rsRNA、tsRNA等小RNA。miRNA自千禧年以来吸引了大批的研究者,取得了很大的研究进展,相信大家也比较熟悉,因此接下来我将重点给大家介绍一下另外3种sncRNA。

tsRNA


tsRNA(tRNA-derived small RNA)是近年发现的一类非编码小RNA, 由不同的酶精确切割不同的tRNA或者tRNA前体产生,也称tRF、tiRNA、tRNA halves等。已有研究表明,tsRNA的生物学功能丰富,包括调节应激反应、肿瘤发生和表观遗传调控等。

知识卡片:tsRNA的生物学功能

1. 调节mRNA 稳定性:tsRNA 具有microRNA 类似的作用,通过靶向mRNA调节其稳定性;

2. 调控蛋白质的翻译

(1)通过影响核糖体的生物发生增强翻译: 在小鼠和人类的研究中已证实tsRNALeuCAG可以结合核糖体蛋白RPS28 的mRNA 增强其翻译;

(2)通过与核糖体结合抑制翻译:tsRNA 能与核糖体成分(小亚基16S rRNA)结合,使翻译整体抑制;

(3)调控翻译起始过程:tsRNA能够形成分子间RNA G 四聚体(RG4)来代替翻译起始因子eIF4 复合物,抑制翻译;RG4 结构还能与YB-1 结合,抑制翻译起始复合物形成;

3. 作为表观遗传调控因子:tsRNA 可以影响不同的表观遗传过程来调节基因的表达,比如可以与PIWI 蛋白相互作用,促进H3K9 甲基化;

4. 调控转座子:HeLa细胞18-nt-3' tsRNA 与成熟tRNA竞争性地结合到反转录转座子的引物结合位点,阻断其逆转录。

图片
图片

图1. tsRNA 分类与作用机制[1]

A:tRNA 前体由RNase Z 或ELAC2 剪切3'端形成tRF-1;B:Dicer 酶剪切D 环生成tRF-5,ANG 或Dicer 酶剪切T 环生成tRF-3,RYN1 或ANG 剪切反密码子环生成tiRNA,tRF-2 和i-tRF 对应中间序列;C:结合AGO 蛋白抑制mRNA 翻译;D:调控rRNA 的形成;E:竞争性结合核糖体;F:调控翻译起始。

tsRNA 携带了从tRNA继承而来的多种RNA修饰,增加了RNA 结构和功能的多样性,但它们会干扰RNA-seq文库的制备,使得普通的RNA-seq无法完全检测到这类tsRNA 的存在,这为其功能研究带来了障碍。

知识卡片:tsRNA与疾病标志物

1. 病毒感染:在HBV或HCB病毒感染的组织细胞中,tsRNA 的丰度发生明显改变;

2. 应激:外周循环中的tsRNA对急性炎症、衰老、能量限制、急性肾脏疾病和组织损伤等具有敏感性, 可能是一类有用的非侵入性生物性标志物;

3. 肿瘤:已有研究表明tsRNA在多种癌症中被异常调节,这些发生异常调节的tsRNA可能是疾病诊断、靶向治疗和预后等的生物标志物。

图片

表1. 近年来与tsRNA相关的NSFC项目


图片

(点击放大)





表2. 与疾病相关的tsRNA



[1]
图片
(点击放大看原图)



表3. tsRNA 与蛋白质/RNA 相互作用的研究方法[1]
图片

(点击放大看原图)

piRNA


PIWI 蛋白相互作用RNA (PIWI-interacting RNA,piRNA)是一类长度为24~31 个核苷酸的小RNA,通过与PIWI蛋白结合改变肿瘤表观遗传学特征,调控转录后mRNA水平及蛋白质稳定性,参与恶性肿瘤的增殖、侵袭、转移等发生发展过程,有望成为恶性肿瘤早期诊断及预后评估的生物标志物和新型治疗靶点[3]
相对于tsRNA来说,关于piRNA的已发表研究更多,它最为人熟知的经典功能就是参与转座子沉默的调控和生殖发育的调控:
图片

图2. piRNA 抑制基因转座的途径[2]

A:组蛋白修饰途径。piRNA 能引起组蛋白修饰,导致染色质紧缩,从而抑制转座子转座;B:DNA 甲基化途径。piRNA 能引起H3K9甲基化和H3K4 去甲基化,随后招募DNA 甲基化转移酶,引起LINE-1 DNA 的甲基化而抑制LINE-1 的转录;C:乒乓循环途径。次级piRNA 扩增的同时,转座子mRNA 作为底物被大量消耗,导致转座被抑制;D:DNA 消除途径。四膜虫接合期间,在母体小核中产生的scnRNA 与Twi1p 复合体能介导収育中的大核IESs 区域的整体删除;尖毛虫接合期间,母本大核中形成的模板RNA 迚入収育中的大核,作为模板指导IESs 删除和乱序的MDSs 重新排序。两种方式都能删除转座子基因序列,导致转座被抑制。

表3. PIWI在多种癌症类型中的表达[3]

图片

rsRNA


rRNA作为细胞中另一种重要 housekeeping RNA,是否也能产生类似tsRNAs 的小RNA?2017年,张永莲研究团队[4]发现了来源于 28S rRNA,序列特点上与已知 tsRNAs 十分相似的 sncRNA(rsRNA-28S,rRNA-derived small RNAs-28S)。在此前利用RNA-seq对小鼠精子小RNA的研究中,rsRNA-28S 序列因为无法比对而作为垃圾序列而丢弃。而对数十例人源精子样品的筛查发现,生殖道炎症病人白细胞增多症精子中的 rsRNA-28S 发生了显着变化。这项研究发现了一个和已知 tsRNAs 十分类似的 rsRNA,揭示了现有 genome mapping 方法在小 RNA 测序分析中的不足。rsRNA作为一种在成熟精子中大量表达的sncRNA,且对环境敏感,具有与tsRNA相当的预测能力。

cfRNA与液体活检


cfRNA,全称是cell-free RNA,也就是细胞外RNA。在外周血等体液中游离的细胞外RNA,包括了小RNA(miRNA、tsRNA、rsRNA等)、mRNA、lncRNA等,来自于正常细胞或肿瘤细胞的代谢与凋亡,研究表明,肿瘤细胞会向循环系统中释放细胞外RNA(cfRNA)。除此以外,cfRNA还可能通过细胞凋亡以外的机制释放到血液中,比如活细胞也可以通过胞外囊泡释放cfRNA。

表4. FDA近年许可和批准的实体肿瘤液体活检项目

图片


(此表为转载,侵删)


2017年,《世界经济论坛》全球十大新兴技术榜单液体活检荣膺榜首。表格中是近年来FDA许可和批准的实体肿瘤液体活检项目,主要还是以cfDNA为主。我们来比较一下这四大液体活检家族:循环肿瘤细胞,拥有细胞结构,包含的信息量也更多,但缺点是肿瘤患者每mL血仅有1-10个循环肿瘤细胞,样本量太少;而ctDNA与cfDNA不容易区分,特别是在癌症早期,癌细胞死亡数量少,ctDNA的水平很低难以检测,因此二者应用于早期筛查和诊断比较难。
而cfRNA在血液中含量非常高,还具备其他生物标志物所缺乏的几个优点:1. 敏感性和功能性:RNA主动分泌到细胞外, cfRNA生物标志物可在癌症早期就出现在患者的血浆,提供更多功能学信息。2. 组织特异性:cfRNA具有组织特异性、肿瘤特异性;3. 低成本:cfRNA 测序相对于cfDNA及其甲基化测序来说成本要低很多,对早筛早诊的普及更有利。

表5. 四种液体活检生物标志物的对比

图片

PANDORA-seq


传统的小RNA测序建库技术主要检测miRNA、piRNA等,无法检测到含有特殊修饰的小RNA,比如前文提到的tsRNA还有rsRNA都是具有高度修饰的小RNA。PANDORA-seq[5](克服RNA修饰中止的全景RNA展示测序)通过对15-50nt区段的小RNA进行酶学处理(AlkB和T4PNK酶),去除影响测序的修饰,能够完整地呈现包括tsRNA/rsRNA在内的小RNA图谱。结合专用注释工具SPORTS1.1进行生信分析,可全面解析样品中各类sncRNA,包括miRNA、piRNA,尤其是tsRNA 和rsRNA 的信息,为这些sncRNA 未知的细胞和分子功能研究奠定基础。

表6. 不同RNA测序技术的适用范围

图片

图片

图3. 适合PANDORA-seq分析的样本类型

潘多拉测序非编码小RNA标志物研究方案


在PANDORA-seq的研发者、专注于非编码小RNA研究的陈琦老师看来,tsRNA研究是一片“蓝海”。现在我们已经拥有了研究它的工具,我们做的事情可以有很多。接下来我就结合研究案例,给大家介绍一下利用PANDORA-seq进行非编码小RNA标志物研究的方案。
图片

图4. 液体活检千亿蓝海市场(来源:华经产业研究院)

相较于功能机制研究,疾病相关分子标志物研究的方案比较简单明了, “干实验”为主——测序、生信分析、机器学习算法构建模型。而“湿实验”主要是qPCR验证候选的标志物。

样本设置


绘制sncRNA图谱的工具PANDORA-seq已经有了,那么于研究者来说,很关键的一步就是样本的设置。我们建议的是50例患者VS 50例正常的样本起,这样的研究数据较为有说服力。

· 研究案例一   ·

Cell Discovery:精子sncRNA作为体外受精的精子质量评估标志物[6]

图片

划重点

样本类型:接受体外受精治疗的患者精子样本

样本数量:87例(23例 VS 64例)

样本设置:高质量胚胎率组(H-GQE)VS 低质量胚胎率组(L-GQE)

图片

在这项研究中,研究人员收集了87例接受体外受精治疗的患者精子样本,把优质胚胎率≥75%的列为高优质胚胎率组,有23例;优质胚胎率≤25%的列为低优质胚胎率组,有64例。



· 研究案例二   ·

Mol Cancer:外周血sncRNA作为肺癌生物标志物[7]
图片

划重点

样本类型:PBMC

样本数量:59例

样本设置:13例健康 vs 10例肺结核 vs 36例肺癌患者

图片
图片

图5. 样本设置部分研究路径归纳



潘多拉测序预测差异表达的分子标志物


收集好样本,上机测序,获得了潘多拉测序数据,那我们重点要看什么呢?看组间差异表达的基因,候选的疾病预测/诊断分子标志物往往就出现在这里啦。

· 研究案例一   ·

此研究中通过对sncRNA的深度测序分析,鉴定了tsRNA和rsRNA的差异表达情况,初步证明以tsRNA作为生物标志物区分高胚胎率与低胚胎率的精子,提高体外受精的成功率的可能性。
图片

图6. 87例精子样本中各种sncRNA的比例,比例最高的是tsRNA和rsRNA


图片

图7. 小RNA测序显示tsRNA的表达总量


图片

图8. 两组(H-GQE和L-GQE)之间10个差异表达的tsRNA的热图


图片

图9. 成熟tRNA序列中10个差异表达的tsRNA的示意图(tsRNA序列用红色标出)


图片

图10. 两组间10个差异表达tsRNA的条形图


该研究也检测了rsRNA作为标志物的潜力。为了探索rsRNA与精子质量之间的关联,研究者分析了rsRNA的表达并鉴定了28S-58(破折号后面的数字表示rsRNA的长度)等7种差异表达的rsRNA。实验数据表明,只有28S-58在低优质胚胎率组中表达上调,其余6个rsRNA都是下调。

图片

图11. 两组间差异表达的rsRNA,可能成为评估精子质量的生物标志物


通过这7种rsRNA也可以有效区分高优质胚胎率组和低优质胚胎率组,表明这些rsRNA具有与tsRNA相当的预测能力,可作为评估体外受精精子质量的潜在生物标志物。


· 研究案例二   ·

此研究检测了tsRNA在健康样本,肺结核样本以及肺癌患者样本中的差异表达情况,发现tsRNA-Ala等5种tsRNA在肺癌样本中表达上调。

图片

图12. tsRNA-Ala等6种tsRNA在对照组、肺癌和肺结核受试者(TB)中的表达谱。


图片

图13. 潘多拉测序预测差异表达的分子标志物部分研究路径归纳



RT-qPCR验证


在潘多拉测序获得了候选的sncRNA疾病分子标志物之后,我们可以通过qPCR实验进一步验证这些sncRNA的表达情况是否与测序结果一致。

· 研究案例三   ·

Mol Cancer:外泌体tsRNA有望成为肿瘤诊断标志物[8]
图片
外泌体中的sncRNA,也是sncRNA疾病分子标志物的重要来源。在此研究中,研究人员分别对从SK-Hep1肝癌细胞培养基分离的外泌体、肝癌患者以及健康人的血浆外泌体进行了小RNA-seq,发现46种tsRNA在组间中差异表达;随后,研究者再通过qPCR对这些差异表达的tsRNA进行验证,发现tRNA-ValTAC-3等4种tsRNA在肝癌患者血浆外泌体中显著高表达, 提示血浆外泌体tsRNA可以作为一种新的癌症诊断的生物标志物。
图片

图14. 外泌体sncRNA疾病标志物研究,需要从血液/细胞培养基等样本中先提取出外泌体,再进行PANDORA-seq。


图片

图15. 血浆外泌体tsRNA差异表达热图, 35种在肝癌患者中上调,11种下调

(N1-N5:5位健康人对照组;T1-T5:5位肝癌患者)


图片
图片

图16. RT-qPCR对显著差异表达的tsRNA进行鉴定


图片

图17. RT-qPCR验证部分研究路径归纳



基于机器学习算法构建疾病诊断/预后评估模型


最后,利用基于机器学习算法(lasso回归模型、随机森林、SVM、梯度树提升等)的疾病诊断或预后评估模型构建工具,结合临床大样本,可以充分发挥PANDORA-seq的sncRNA测序数据整体优势,构建精准的sncRNA疾病诊断或预后评估模型,推动疾病早期诊断、预后评估液体活检分子标志物的研发,助力个性化和精准化疾病治疗。

· 研究案例四   ·

Mol Cancer:唾液外泌体tsRNA作为食管癌预测生物标志物的多中心前瞻性研究[9]
图片
此研究探索了食管癌患者唾液来源的sncRNA作为管癌诊断生物标志物的应用价值。在试验集(Pilot cohort)设置了患者3例VS 健康对照3例进行外泌体小RNA测序,鉴定出32个在患者中显著高表达的小RNA,其中差异最显著的5个小RNA做进一步分析;在发现集(Discovery cohort)设置了患者33例 VS健康对照33例,对上述5个小RNA进行qPCR验证,发现其中一个tsRNA(tRNA-GlyGCC-5)和一个未注释的小RNA(命名为sRESE)表达显著上调:
图片
在构建诊断模型部分, CHSUMC队列(CHSUMC即汕头大学医学院附属肿瘤医院,训练集)包括患者200例,健康对照120例;ATH队列(ATH即安阳肿瘤医院,验证集)包括患者140例,健康对照60例。
图片
图片
qPCR验证发现tRNA-GlyGCC-5和sRESE在两个队列的患者唾液外泌体中显著高表达:
图片

图18. 差异small RNA在训练队列和验证队列的验证


通过CHSUMC队列(训练集)构建诊断模型,ROC分析tRNA-GlyGCC-5和sRESE各自的以及联合使用的AUC和灵敏度。


图片

图19. 两个sncRNA在训练集的诊断效能


通过ATH队列(验证集)验证诊断模型,ROC分析发现联合使用的AUC达到0.933:


表7. 两个sncRNA以及联合使用在两个队列的诊断效能

图片

PPV:阳性预测值;NPV:阴性预测值


随后,研究者还利用两个队列构建了预后、疗效的评估模型,发现两个sncRNA联合应用可用于食管癌的诊断、预后评估和辅助治疗获益预测。
图片

图20. 基于机器学习算法构建疾病诊断/预后评估模型部分研究路径归纳



写在最后

液体活检,千亿蓝海;非编码小RNA,乍露锋芒。tsRNA、rsRNA等sncRNA,作为一种更有潜力的液体活检生物标志物,以往囿于其修饰干扰RNA-seq文库制备而无法检测;而现如今我们拥有了检测它们的利器PANDORA-seq,我们可以探索这片星辰大海,去挖掘更多疾病诊断、预后、疗效评估液体活检生物标志物。千亿癌症早筛市场,亟需更多的好产品,把肿瘤扼杀在摇篮中。下一个明星标志物,或许就出现在非编码小RNA中。
图片

图21. PANDORA-seq进行非编码小RNA疾病标志物研究路径

参考文献

[1] 马剑峰,甘麦邻,朱砺等人. 转运RNA 衍生的小RNA 功能及其研究方法. 遗传[J]. 2021 年12 月, 43(12): 1107―1120

[2] 刘启鹏,安妮,岑山等人. piRNA 抑制基因转座的分子机制. 遗传[J] 2018 6 , 40(6): 445―450

[3] 许瑞雪,毛奕文,马洋洋等人. PIWI/piRNA在妇科恶性肿瘤中的研究进展. 海南医学2022年2月第33卷第3期

[4]   Chu C,   Yu L,   Wu B,   Ma L, et al. A sequence of 28S rRNA-derived small RNAs is enriched in mature sperm and various somatic tissues and possibly associates with inflammation. J Mol Cell Biol 2017 06 01;9(3)

[5] Shi J, Zhang Y, Tan D, et al. PANDORA-seq expands the repertoire of regulatory small RNAs by overcoming RNA modifications. Nat Cell Biol 2021 04;23(4).  

[6] Hua M, Liu W, Chen Y, et al. Identification of small non-coding RNAs as sperm quality biomarkers for in vitro fertilization. Cell Discov. 2019 Apr 9;5:20.

[7] Gu W, Shi J, Liu H, et al. Peripheral blood non-canonical small non-coding RNAs as novel biomarkers in lung cancer. Mol Cancer. 2020 Nov 12;19(1):159.

[8] Zhu L, Li J, Gong Y, et al. Exosomal tRNA-derived small RNA as a promising biomarker for cancer diagnosis. Mol Cancer. 2019 Apr 2;18(1):74.

[9] Li K, Lin Y, Luo Y, et al. A signature of saliva-derived exosomal small RNAs as predicting biomarker for esophageal carcinoma: a multicenter prospective study. Mol Cancer. 2022;21(1):21. Published 2022 Jan 18.

分享