FLIbase数据库-破解癌症难题

癌症研究一直是生命科学领域中的重中之重。近年来,RNA转录水平的调控机制成为癌症研究的重要方向,影响着转录组多样性和蛋白质组的构成,与人体的生理和疾病状态息息相关。今天为大家介绍一款对癌症研究有重大帮助的数据库-FLIbase数据库这一数据库由我们助力复旦大学何祥火课题组开发。2023年,该数据库发表于Nucleic Acids Research期刊上,整合了长读长和短读长RNA测序数据,注释全长异构体,推动了RNA诊断和治疗癌症策略的发展。

该数据库可访问地址:http://www.flibase.org

图片

图1 FLIbase数据库网站主界面


图片

图2 FLIBase数据库中数据收集和处理的分析过程


FLIbase数据库利用了短读长加长读长RNA测序技术,填补了之前全长转录本特征分析的空白,提供了全长转录本的准确和全面的表达,在鉴定大量以前未发现的同种型和肿瘤特异性RNA转录本方面表现出显著的优势。这些肿瘤特异性RNA转录本有可能成为免疫原性复发性新抗原的来源。为推进针对各种类型的人类癌症的基于RNA的诊断和治疗策略的发展带来了巨大的希望。


01

丰富的数据

FLIBase整合了大量来自多种人体正常和癌组织及细胞的RNA测序数据,包括351个长读长样本和12,469个短读长样本。目前,数据库中包含983,789个全长剪接异构体,其中188,248个已被注释,795,541个尚未注释。


02

严谨的数据处理流程

在构建数据库时,对数据进行了严谨处理。长读长测序数据来自多个公共数据库,经过复杂处理流程,如PacBio数据要经过Iso - Seq流程处理,ONT数据则要用TALON流程处理。短读长RNA测序数据来自TCGA和GTEx数据库,用于辅助注释和表达定量。对于异构体的注释和筛选也有严格标准,保留在至少5个样本中都能检测到所有剪接连接的转录本,去除可能由RNA降解等原因产生的ISM转录本。


03

功能模块

图片

分析模块

分析界面提供四个关键功能模块:“Specific RNA Transcripts” 可查询肿瘤和组织特异性 RNA 转录本;“Differential Expression Analysis” 用于研究肿瘤和相邻正常组织间差异表达的异构体;“Survival Analysis” 能找出与患者总生存期和无进展生存期显著相关的转录本;“Stage” 模块用于探索和肿瘤分期相关的转录本。


图片

搜索页面

搜索界面为用户提供了三个不同的搜索选项:基因名称、基因组位置和转录组信息。进入转录本详情页,能获取转录本 ID、相关基因符号、转录本类型等丰富信息。

该数据库将定期更新,收录更多的数据,并且免费访问,在不久也将纳入单细胞全长RNA-seq数据,探索不同细胞类型和状态的同种型异质性。相信随着 FLIbase数据库功能的不断强大,我们对癌症的理解将会更深。



参考文献:

图片

FLIBase: a comprehensive repository of full-length isoforms across human cancers and tissues.Nucleic Acids Research,2024.


分享