北京雁栖湖应用数学研究院联合北京林业大学发布“个性化全基因组互作组网络”模型,开启植物精准育种新时代
2026-01-04
复杂性状(如植物的生长速度、产量等)究竟由多少基因控制?它们分布在染色体什么部位?基因之间又是如何相互影响的?这些是现代生物学最难回答的问题, 而不弄清楚这些问题,我们就无法实现通过基因对植物产量与品质的改良。
近日,北京雁栖湖应用数学研究院(BIMSA)应用统计方向邬荣领教授团队,联合北京林业大学孙丽丹教授团队与其他机构的合作者,在国际主流期刊《Horticulture Research》 (中科院一区,影响因子8.5)上发表了题为 "An omnigenic interactome model to chart the genetic architecture of individual plants" 的突破性研究论文,受到国内外学者的高度关注。
打破传统:超越“还原论”与“群体平均”的桎梏
长期以来,全基因组关联分析(GWAS)是解析复杂性状遗传基础的主流方法。然而,该研究团队指出,传统方法存在两大核心局限:
- 受限于还原论思想:传统GWAS往往试图孤立地寻找单个显著的SNP位点,只能评估基因的边缘效应,而忽略了基因作为复杂系统的一部分,是如何通过与其他基因的相互作用来共同决定性状的。
- 忽视个体差异:现有分析通常基于群体水平来估算遗传效应。这种平均化的处理方式掩盖了通过基因互作产生的个体间变异,无法满足精准育种或精准医疗中针对某个特定目标个体进行遗传解析的需求。
核心突破:当idopNetworks遇上功能作图
为了解决上述难题,研究团队创造性地将邬荣领教授早年发明的功能作图(Functional Mapping)方法与其团队加入 BIMSA 后发明的idopNetworks相结合,彻底革新了 GWAS 解析复杂性状遗传结构的能力。在该框架中,功能作图作为核心计算引擎,精确捕捉了植物生长发育的连续动态轨迹,并计算出每个基因位点每个基因型的动态遗传效应值,为 idopNetworks 在个体水平上绘制基因间复杂的动态互作图谱提供了关键的数据支撑 (图1)。两大模型通过数学理论的成功对接,能在个体水平上绘制基因与基因之间复杂的动态互作图谱,为动植物的精准育种乃至人类精准医疗提供了全新的理论工具。

图 1 基于功能作图与idopNetworks的个体水平动态互作网络解析框架。本图展示了研究团队提出的创新性整合分析框架。功能作图通过拟合生长动态曲线,计算出每个基因位点的时变遗传效应。这些动态的遗传效应值随后作为关键输入,驱动idopNetworks模型在个体水平上重构基因间互作网络。
idopNetworks是一个集全信息 (Informative)、动态性 (Dynamic)、全方位 (Omnidirectional) 及个性化 (Individualized) 于一体的互作网络模型, 由邬荣领教授带领 BIMSA 团队在国际上首次提出,成为解析复杂系统的重要统计工具。idopNetworks的具体特点包括:
- 全信息:能够捕捉基因间双向、有符号(正/负调控)及加权的互作信息。
- 动态性:基于时间函数,解析基因之间互作随时间的变化。
- 全方位:覆盖基因组中所有基因。
- 个性化:针对单一个体重构其独有的遗传网络。
功能作图利用数学函数将动态的生物发育过程整合到遗传作图中,解析控制复杂性状发育轨迹的数量性状位点(Quantitative Trait Loci, QTL),由邬荣领教授早年提出,现成为现代统计基因组学的主流分析工具。不同于传统方法将性状视为静止的数值,功能作图利用生物学原理(如逻辑斯蒂生长方程)将数学模型嵌入到基因定位中,能够连续地估算每一个基因位点在发育全过程中的动态遗传效应。
揭秘梅花“快长”与“慢长”的博弈
研究团队利用该模型分析了木本观赏植物——梅花(Prunus mume)的全基因组数据与株高地径表型数据,选取了具有代表性的快长树(FGT)与慢长树(SGT),系统解析了这两个个体在树干高度与直径协同生长机制上的显著差异 (图2)。

图 2 左侧为快长树右侧为慢长树
通过对比快长树和慢长树的基因网络,研究发现:
- 互作模式迥异:在快长树的基因网络中,正向促进作用占据主导地位,比例高达 85%;相反,在慢长树中,负向抑制作用更为普遍,占比约为 62% (图3)。
- 解锁隐藏潜力:基于对基因型效应的精准分解,研究揭示了慢长树中某些关键基因表现不佳,并非其内在潜能不足,而是受到了其他基因网络的强烈抑制。模型预测,若利用基因编辑技术精准敲除这些负调控因子,被压制的优良基因有望被唤醒,从而释放植株的生长潜力,使其生长表现达到甚至超越快长树的水平 (图4)。

图 3 idopNetworks 介导 FGT 与 SGT 的株高和地径生长。顶层为模块-模块相互作用网络,底层为SNP-SNP相互作用网络。红色与蓝色箭头线分别代表正向与负向调控,线条粗细与调控强度成正比。

图 4 基因型效应曲线(蓝线)随时间变化的分解模式:FGT和SGT的三个QTL(A图)与一个SNP(B图)基因型效应曲线被分解为独立效应曲线(红线)以及受其他基因影响产生的依赖型效应曲线(绿线)。等位基因以A/a表示,下标字母L(母本柳瓣丹)与S(父本三轮玉蝶)标示其亲本来源。
未来展望:精准育种的导航图
这项研究不仅在理论上填补了数量遗传学中从群体到个体解析的空白,更具巨大的应用价值。该模型提供了一张详细的基因导航图,能够揭示控制作物产量、抗病性、抗逆性等复杂性状的关键基因及其互作网络,使育种专家可以依据个体基因型设计高度定制化的基因改良方案。该研究利用群体数量遗传学理论,实现了对个体性状遗传机制的解读与探究,从而为高效的遗传转化奠定了坚实基础。
该研究论文由北京雁栖湖应用数学研究院访问学生法昌健为第一作者,北京林业大学园林学孙丽丹教授为论文通讯作者,BIMSA与北京林业大学许多研究人员参与了这项工作。该研究工作得到了以下项目的资助:国家自然科学基金项目(No.32572116)、中央高校基本科研业务费(QNTD202503),以及上海数学与交叉学科研究院交叉学科项目(SIMIS-ID-2024-WN)。
北京雁栖湖应用数学研究院邬荣领教授领导的“应用统计团队”,联合BIMSA“应用拓扑团队”,领导成立“复杂系统拓扑统计理论及应用北京市重点实验室”。 实验室研究特色是,把代数拓扑与统计物理镶嵌入大数据分析的统计框架,创立新型图统计学理论与方法,与生物、医药、人工智能等学科深度交叉,开创中国特色的统计理论与应用之路,引领世界统计学发展方向。
论文链接: https://academic.oup.com/hr/advance-article/doi/10.1093/hr/uhaf345/8381148