全球首个百亿级人类基因组基础模型 在西湖发布
浙江
浙江 > 资讯 > 正文

全球首个百亿级人类基因组基础模型 在西湖发布

ICG-20启幕

全球生命科学力量汇杭城

10月23日,第二十届国际基因组学大会(ICG-20)在杭州召开,这场被誉为基因组学领域“风向标”的盛会,吸引了全球各地的科研机构、领军企业代表及顶尖专家学者齐聚一堂。

作为持续二十载的国际学术交流平台,本届大会以“生命前沿与智能计算的融合创新”为核心议题,围绕基因组解读、精准医学应用、生物大数据分析等热点方向展开深入研讨,现场氛围热烈,各类前沿观点碰撞交融。

“这是一次全球生命科学领域的‘头脑风暴’,从基础研究到产业转化,从技术突破到临床应用,大会覆盖的全链条议题让我们看到了基因组学发展的无限可能。”一位参会企业代表表示。

据了解,本次大会不仅设置了多场主题论坛,还搭建了成果展示与合作对接平台,为行业内的资源整合与协同创新提供了重要载体。

重磅发布

Genos破解“读懂生命”难题

在大会核心成果发布环节,华大生命科学研究院与之江实验室联合发布的全球首个百亿参数人类基因组通用基础模型——Genos引发全场轰动。

这款针对人类基因组深度优化的基础模型,实现了百万碱基对超长上下文分析与单碱基分辨率精准识别的双重突破,标志着基因组研究从“读出”序列向“读懂”逻辑的关键转折。

“基因组序列极长且复杂,要同时满足超长序列长度、单碱基精度和百亿级参数三个需求的平衡,是巨大的技术挑战。我们在正式训练前做了至少50次不同架构与技术方案的对比,最终依托混合专家(Mixture-of-Experts, MoE)架构实现了突破。”之江实验室Genos研发组长李兆融介绍道。

该架构通过“按需激活”机制,让模型在保持强大能力的同时降低资源消耗,真正实现“既强大,又好用”。无论是在基因组元件识别,还是在突变致病性预测等经典评测任务中,Genos在超过一半的任务中表现优于所有现有模型。这也意味着Genos不仅具有科研价值,更将成为临床诊断的强大工具。

华大生命科学研究院领域首席科学家、Genos研发组长刘石平表示:“生命科学已发展20多年,但如何理解基因组与疾病的关系始终是挑战。我们的初衷就是找到更先进的方法去整合和理解这些数据。”

据了解,Genos整合了636个T2T级别高质量基因组数据,覆盖全球不同人群。在临床致病性突变解读中,其准确率达92%,结合021科学基础模型后更是升至98.3%。

值得一提的是,未来Genos模型将全面、彻底地开源开放,同时提供12亿和100亿参数两个版本,满足不同应用场景的需求。同时,将提供10万次免费推理服务,极大程度上降低了基因组智能分析的门槛。

生态护航

西湖区打造创新“沃土”

Genos模型的诞生,离不开杭州数字经济与生命科学的交叉融合,更得益于西湖区、紫金港科技城长期的陪伴与支持。

“从项目落地到模型研发,我们每一步都能感受到细致入微的服务。”华大集团相关负责人表示。

这份“细致入微的服务”,体现在硬件保障与后勤服务的全方位落地中。自华大入驻西湖区以来,紫金港科技城便成立专项工作专班,通过周例会机制全程跟进项目进展。从核定二期预算、推进环评安评,到协调高管子女入学、落实公寓与食堂保障,全方位解决企业后顾之忧。目前,华大一、二期累计超3万方研发及配套场地已投用,全球单体数据通量最高的生命组学大数据平台等核心设施顺利建成。

除了解决企业“后顾之忧”的基础保障之外,紫金港科技城管委会更着力为Genos模型研发搭建资源链接的桥梁与生态协作的平台。在此之前,管委会打造的环紫金港创新创业联盟,便聘任华大为生命健康(合成生物)子联盟盟主,每月支持举办基因组论坛,目前已连续开展25期。通过联动浙江大学、西湖大学等高校资源,协助举办创新联合体大会,吸引近50家机构加入,构建起“政产学研医”协同网络。

无论是硬件支撑、资源整合还是政策扶持,最终都需要核心人才转化为技术突破,西湖区在人才培养体系上的持续发力,为Genos模型的关键突破提供了根本支撑。在地方支持下,华大研究院获批省级新型研发机构及多个重点实验室,与浙大联合开展博士后培养,在站博后达27人,并联合之江实验室开设“大模型种子班”,为Genos研发输送了核心人才,通过跨界人才培养与生态支持,实现了关键突破。

从大会的全球瞩目

到Genos的技术突破

再到地方政府的精准服务

西湖区正以紫金港科技城为核心

编织起一张“创新有平台、

发展有政策、服务有温度”的科创网络

为生命健康产业高质量发展

注入不竭动力

来源:美丽西湖