近日,Nature Genetics以Articles形式在线发表了浙江大学张天真教授团队牵头完成的一篇题为Gossypium barbadense and Gossypium hirsutum genomes provide insights into the origin and evolution of allotetraploid cotton的研究论文,报道了棉花两个重要的栽培种陆地棉和海岛棉的参考基因组,为棉花海陆差异形成的遗传机制提供新证据。
棉花是当之无愧的“纤维作物之王”,棉纤维具有优越的透气性、舒适性、保暖性,是纺织工业最重要的原料。如今栽培的棉花中,最常见的是棉属中的陆地棉(Gossypium hirsutum L.)和海岛棉(G. barbadense)两个种培育的品系。
陆地棉和海岛棉有明显的基因组分化,两者是同一起源、独立驯化的关系。陆地棉具有皮棉产量高,纤维较细长,多在21~33厘米,纤维品质一般、适应性广等特点,其产量占世界棉花总产的90%以上;海岛棉,又称长绒棉,最突出的特点就是纤维品质优良,其纤维长度为33-39毫米。同时,海岛棉纤维作为‘棉中极品’,也是国内顶尖纺织衣物以及出口的高附加值纺织品和服装的关键材料。在我国,海岛棉仅在新疆等少数地区种植,产量仅占棉花总产的5%左右。因此,陆地棉和海岛棉差异形成的遗传基础解析,是整合海陆优异性状的提前,也是我国棉花育种的重要目标。
本成果利用以色列NRGene公司的 DeNovoMAGIC组装技术,结合Bionano光学图谱、高密度遗传图谱、Hi-C辅助基因组组装技术(图1),对陆地棉遗传标准系TM-1的基因组重新进行了组装,并获得了海岛棉Hai7124高质量的基因组序列。此次获得的海岛棉和陆地棉基因组,Scaffold N50最终分别达到了23.44 Mb和15.5 Mb,组装指标较之前发表版本提高了20~90倍(图2),尤其在重复序列富集的着丝粒区域组装完整性有了明显改善(图3)。
图1 基因组组装策略
图2 TM-1基因组新版本与旧版本的比较
(a)基因组总大小及N区比较. (b) 去除N区后的染色体长度比较.
图3 来自着丝粒区域标记的比对情况
海陆比较基因组研究发现,特异性的基因表达、结构变异和基因扩增是海陆间存在显著的差异。在纤维发育方面,与膜转运、糖合成、碳水化合物代谢通路相关基因的富集在海陆之间存在显著差异。同时,相比陆地棉,蔗糖转运、离子转运、液泡转化酶等与液泡中渗透物质调节相关的基因在海岛棉纤维发育中表达时间显著延长(图4)。在冷、热等逆境响应方面,相比海岛棉,陆地棉中有更多的参与乙烯信号、ABA信号调控的基因被激活,这可能与陆地棉的广适性密切相关(图5)。以上发现为探寻陆地棉和海岛棉基因组的进化和驯化历史以及棉花遗传改良奠定了基础。
图4 纤维发育机制解析
图5 冷热逆境响应机制解析
该研究是继张天真教授团队主导完成棉花陆地棉基因组测序组装(Nature Biotechnology, 2015) 和全基因水平鉴定纤维品质和产量性状关联位点(Nature Genetics, 2017)等研究完成之后,在基因组学研究领域取得的又一项突破性成果。
论文以胡艳、陈杰丹、方磊、张志远、马卫博士以及牛永超为第一作者,张天真教授为通讯作者。