基因

全球首个百亿级可布置基因组根底模型诞生

来源:bob官网下载    发布时间:2025-11-28 13:56:37

  23日,华大生命科学研究院与之江实验室联合发布全球首个百亿参数可布置的基因组通用根底模型Genos。该模型支撑多达百万碱基对的超长上下文剖析,并完成单碱基分辨率的精准辨认。

  人类基因组由30亿对碱基组成。“人类基因组方案”破译了序列,但序列上碱基的详细功用仍需求精准辨认和解析。

  现有模型大多根据1—2个参阅基因组展开练习,难以表现人类遗传资源的多样性。而Genos整合了人类泛基因组参(HPRC)、人类基因组结构变异图谱方案(HGSVC)等多个威望揭露资源,初次将全世界内636个“端粒到端粒”等级的高质量人类基因组作为练习数据。这一些数据覆盖了全球不同人群,有助更全面了解人类遗传多样性。

  算法架构方面,Genos经过“混合专家”架构,精准调度强相关“专家”算法协同处理,在汇总百亿级巨大参数时成功下降推理本钱和资源耗费,让模型既强壮、又好用。

  测验成果为,Genos在直接面向临床使用的致病性骤变解读使命中,准确率达92%;结合科学根底模型后,准确率高达98.3%。多项归纳评测成果也显现,Genos逾越现有最佳水平模型。

  华大生命科学研究院相关负责人说,Genos模型已在HuggingFace(抱抱脸)、魔搭等渠道全面开源敞开,供给12亿和100亿参数两个版别,满意多种需求。

返回顶部