RNA-seq报告解读:参考基因组比对

1、测序reads基因组比对结果

我们利用hisat2将Clean Reads与指定的参考基因组进行序列比对,获取在参考基因组或基因上的位置信息,以及测序样品特有的序列特征信息。

表格说明:
(1)Total reads:测序序列经过测序数据过滤后的数量统计(Clean reads);
(2)Total mapped:能定位到基因组上的测序序列的数量的统计;一般情况下,如果不存在污染并且参考基因组选择合适的情况下,
这部分数据的百分比大于70%
(3)Multiple mapped:在参考序列上有多个比对位置的测序序列的数量统计;
(4)Uniquely mapped:在参考序列上有唯一比对位置的测序序列的数量统计;
(5)Read-1,Read-2:分别为left reads和right reads比对到参考基因组上的数量统计;
(6)Reads map to '+',Reads map to '-':测序序列比对到基因组上正链和负链的统计;
(7)Splice reads:Uniquely mapped reads中,分段比对到两个外显子上的测序序列(也称为Junction reads)的统计,Non-splice reads为整段比对到外显子的测序序列的统计,Splice reads的百分比取决于测序片段的长度;
(8)Reads mapped in proper pairs:双端比对上的测序序列数量统计。

2、reads在参考基因组上的分布

该分析主要以图形方式给出reads在参考基因组各个位置的分布情况,以及该位置基因的分布情况。

reads在参考基因组上的分布

图片说明:Number_of_Genes表示每个窗口中所含的基因数;Number_of_Reads则是每个窗口的平均测序深度。在y坐标轴上取值分别为log2(Number_of_Genes),log2(Number_of_Reads)。

分享