西安交通大学团队发现基因注释研究新方法
陕西
陕西 > 全景 > 正文

西安交通大学团队发现基因注释研究新方法

原标题:服务国家生物安全战略西安交通大学团队发现基因注释研究新方法

3月12日,记者从西安交通大学获悉,学校的叶凯教授团队在基因注释核心方法上实现重要突破,其成果在国际顶级期刊《自然·方法》在线发表。

基因注释是连接“测出基因组”和“读懂基因组”的核心环节,是基因组研究走向功能解析和应用转化的重要基础。随着国际大型基因组计划持续产出海量数据,如何实现高质量基因注释已成为后基因组时代亟待突破的重要瓶颈。

据叶凯教授介绍,传统方法通常依赖RNA测序、同源蛋白等外部证据,存在数据需求高、计算开销大、对数据匮乏物种适用性受限等问题。

针对这一挑战,叶凯教授团队提出了一种基于混合专家架构的基因组语言模型 ANNEVO。该方法能够同时学习不同生物类群的进化规律和长距离序列上下文关系,在无需RNA测序和同源蛋白等外部证据的条件下,仅凭DNA序列即可实现高精度从头基因注释,打破国外团队在该领域的技术垄断,推动我国在基因注释核心方法上实现重要突破,对于服务国家生物安全战略、AI+生命交叉融合发展具有重要意义。

叶凯教授团队长期围绕“人工智能驱动基因组解析”开展系统布局,此前已相继取得一系列成果,此次成果进一步完善了团队在“AI驱动基因组解析”方向上的系列工作布局,形成了从基因组变异识别到基因功能注释的连续方法链条,已在国际旗舰基因组计划场景中展现出重要应用价值。

这一成果既是团队十年深耕“人工智能+基因组”交叉前沿的重要阶段性总结,也是西安交通大学持续加强基础研究、推动学科交叉、服务国家重大需求的生动体现。研究过程中,团队与数学学院孟德宇教授团队开展密切合作,体现了学校推动学科交叉融合的良好成效;西安交通大学珠峰计划本科生张奕哲积极参与相关研究,展现了学校在拔尖创新人才培养方面的积极探索。该成果也是西安交大持续推进“人工智能+生命医学”交叉融合的重要进展。