手把手带你搞定细胞器基因组上传NCBI

Bankithttps://www.ncbi.nlm.nih.gov/WebSub/)工具不一样的风采——细胞器基因组在线上传NCBI

常见错误

  • fasta基因组序列和tbl注释文件序列ID必须保持一致;

  • *.tbl注释文件中,基因翻译的transl_table(也就是gcode)必须选择准确,再次附上NCBItransl_table选择分类网址:https://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html/index.cgi?chapter=tgencodes#SG2;

  • 叶绿体和植物线粒体基因组中有部分基因包含内含子,如果出现序列内部包含终止密码子情况,那么就需要重新对该基因进行校正,可参考同属参考基因;

  • 需要注意反式剪接基因,如叶绿体的rps12,植物线粒体的nad1nad2nad5,基因中CDS的顺序和方向要正确,并在tbl文件中标注“trans_splicing”,如果校正错误会提示内部终止子的错误。

  • 注意起始密码子和终止密码子的缺失情况,这里需要考虑三种情况:

    1,基因校正是否准确;2,通过添加note字段加以注释说明,例如note="start codon is created by C to U RNA editing"3,动物线粒体会出现终止子只有一个T的情况,需要加一行注释note="TAA stop codon is completed by the addition of 3' A residues to the mRNA"

  • 动物线粒体中D-loop区域可通过misc_feature分类添加。

研究示例

01

香菇线粒体基因组特征揭示中国两种香菇类型Mitogenome types of two Lentinula edodes sensu lato populations in China. Scientific Reports, 2019.中国有两个香菇种群:香菇和未挖掘的形态学物种,分别命名为AB。已有研究发现这两个种群的核基因类型不同。本文选择了20种具有不同ITS2类型的香菇菌株进行重测序研究。对L135菌株完整线粒体基因组进行测序,作为参考基因组,通过对19ITS2类型不同的菌株线粒体基因组进行重新测序,研究了中国两个香菇种群的线粒体基因组类型;研究不同线粒体基因组类型之间的SNP和插入缺失多样性,筛选合适的标记物以鉴定不同的线粒体基因组类型。文章阅读:香菇线粒体基因组特征揭示中国两种香菇类型

1 ITS220个菌株的线粒体基因组的群体分析。a使用ITS2数据构建NJ树。每个菌株的不同ITS2序列分别标记为c1c2c3c4b使用SNP数据构建NJ树。(cPCA分析。(d)群体结构分析,群体A:紫色;群体B:蓝色。

02

五味子科叶绿体基因组的动态演化和系统发育分析Dynamic evolution and phylogenomic analysis of the chloroplast genome in Schisandraceae. Scientific Reports, 2018.

植物叶绿体基因组在基因顺序和基因含量方面都是高度保守的,并且具有较低的进化速率。本研究以五味子科为例,通过系统发育学分析,对叶绿体基因组的整体进化动力学进行深入了解,并建立了基于叶绿体基因组的五味子科的系统发育关系。

文章阅读:叶绿体基因组|五味子科叶绿体基因组的动态演化和系统发育分析

2 五味子科IR的扩增和收缩。与其他植物叶绿体谱系相比,五味子科中的IR具有10kb的收缩。IRa / SSC边界延伸到ycf1,导致三种Schisandraceae叶绿体基因组中的存在ycf1假基因。

03

线粒体基因组测序揭示小龙虾(Procambarus clarkii)的全球入侵路线Unravelling the global invasion routes of a worldwide invader, the red swamp crayfish (Procambarus clarkii). Frenshwater Biology, 2019.本研究从全球范围一共收集了1062个样本,来自全球72个地区。其中15个小龙虾的原生栖息地,57个非原生栖息地(来自中国的样本,共计35个地区,占全部数量的近一半)。利用线粒体基因组上细胞色素C氧化酶I亚型的基因扩增子进行核苷酸多样性(π)检测,以说明小龙虾中群内和不同地域种群间的多样性。并通过单倍型多样性(Hd)研究,深度了解小龙虾群体的遗传多样性.

文章阅读:线粒体基因组 | 麻辣小龙虾,一段历史

3 小龙虾的细胞色素C氧化酶亚基ICOI)序列的单倍型网络。每个圆圈代表一个单体型,其大小与单体型频率成正比。在网络中,单倍型之间的每条线代表突变,小黑点表示从数据推断出的未采样单倍型。来自同一地理区域的地区具有相同的颜色。具有非同义变化的单倍型用*表示

分享