据中国农科院最新消息,该院生物技术研究所汪海博士与美国康奈尔大学爱德华·巴克勒(Edward Buckler)院士团队合作,开发出从基因组DNA序列预测基因表达调控模式的人工神经网络模型,它在分子育种领域的作用相当于谷歌的“AlphaGo”之于围棋,为人工智能(AI)辅助定向育种开辟了新方向。相关研究成果在线发表于《美国科学院院刊》。
汪海表示,AI技术在基因组学研究中尚未得到广泛应用,缘于生物中具有许多序列高度相似性的基因家族,在训练神经网络模型时将基因随机分配到训练集和测试集中,会导致该模型优先学习DNA序列中跟基因家族或进化相关的基序,而不是真正决定基因表达调控的基序。
该研究以基因家族代替单个基因为单位随机分配训练集和测试集数据,成功建立了预测二元化基因表达量的卷积神经网络模型;进一步利用多种算法进行解析,获得了调控基因表达的关键DNA基序。在此模型基础上,科研人员利用进化上亲缘关系较近的两个物种,成功预测了同源基因的相对表达量,并进一步获得了调控同源基因相对表达量的关键DNA基序。 (科技日报)