媒体聚焦

上海交大

成功构建中国汉族人泛基因组分析流程

《中国科学报》报道 本报讯(记者黄辛)上海交通大学生命科学技术学院韦朝春课题组和医学院附属瑞金医院于颖彦课题组,通过数年的协作科技攻关,开发了一套针对大规模人类基因组深度测序数据的全新分析系统——人类泛基因组分析系统(HUPAN)。该方法学的建立为解析人类基因组中尚未被发现的“暗物质”提供了重要研究工具。相关研究成果近日在线发表于《基因生物学》。

随着对人类基因组测序研究的广泛开展,尚有很多未知序列(或者说暗物质)有待科学家通过不断的深化研究加以发现。

泛基因组是指某个群体中所有个体基因组的总和。随着测序技术的进展,针对人类某个群体的多个个体基因组的测序数据不断积累增加,给泛基因组研究提供了前所未有的契机。然而,人类全基因组测序数据量庞大,现有针对如此大型基因组数据进行拼接研究的方法学有限,如果研究方法不加以创新,在分析过程中容易引入较多的拼接错误,且分析速度缓慢。

为此,该联合团队进行了分析方法的创新,研究人员对原有真核生物泛基因组分析流程进行了改进,包括引入节约内存的拼接方法,可直接对每个个体的所有测序数据进行拼接以降低拼接错误,优化了泛基因组分析步骤,明显提高了海量测序数据的分析速度和准确率。

新型分析方法对185个中国汉族人的全基因组进行深度测序分析,同时对开放数据库内90个中国汉族人全基因组深度测序数据测试显示,在中国汉族人全基因组测序数据中至少存在29.5Mb不同于人类参考基因组的新序列,暨人类基因组参考序列中漏掉的序列。

“通过新基因预测分析,发现188个新基因,且新序列中约40%仅见于中国汉族人群。”该论文共同通讯作者韦朝春表示,该新型方法的创立不仅仅为深入研究人类进化、人类迁徙规律、种族基因组差异以及新基因与人类疾病相关性提供了重要工具,还为其他具有较大基因组的高等动物泛基因组研究提供了重要分析工具。

相关论文信息:https://doi.org/10.1186/s13059-019-1751-y

《中国科学报》 (2019-08-09 第3版 综合)


黄辛
新老藏宝图诗句记录