新闻动态

国产生物医药大模型SWBind发布

2024-11-13 14:21

2024年11月10日,由中国计算机学会主办的“2024物博会专题活动—第15届CCF太湖论坛—自主可控人工智能创新技术大会暨2024山水东路科创谷对话”在我市隆重召开。



在本次会议中,国家超级计算无锡中心副主任赵文来发表了主旨演讲《异构众核架构计算芯片加速大模型落地》。他表示,异构众核架构在运行效率上的纸面数据领先,且在实际应用中,由于架构的差异,众核的实际效率相较于传统的x86+GPU组合表现出更大的优势同时,对于实时推理和跨学科协作研究,对并行计算能力和灵活云端算力的需求也在不断增加。因此,异构集群和算力基础设施建设已经成为推动科技发展进步不可或缺的基础支撑。



此外,神威数智(无锡)科技有限公司联合国家超算无锡中心发布了业界首个对标DeepMind发布的AlphaFold3的国产大模型—SWBind。SWBind在常规的小分子配体、核酸分子(包括DNA和RNA)以及蛋白质的结构预测精度上能与AlphaFold3相媲美,并在模型置信度上达标。当前应用已正式发布并进入公测试用阶段,为用户提供了充分的机会来测试模型的性能,评估其在实际研究中的适用性和价值,截至目前,已获得数十家国内院校、研究院所的密切关注并反馈良好。



SWBind是国内首个成功复现AlphaFold3的成果,其性能与AlphaFold3相媲美。SWBind可以对蛋白质、DNA、RNA等大分子及小分子进行建模,并模拟其化学修饰。通过扩散方法,模型从原子噪声图像逐步降噪,最终生成分子结构的3D坐标,从而实现对分子结构的精准预测。SWBind采用成对残基关系编码器,处理成对表示和单一表示,大幅提升了对复杂生物分子相互作用的建模能力。



在数据方面,SWBind的训练数据来源广泛,涵盖了蛋白质、核酸、小分子和金属离子等多种结构数据,并结合了我们自主研发的高质量大规模数据集 BindingNet,使得模型具备了卓越的生物分子系统处理能力。

SWBind模型在实际成果展示中表现突出。在小分子配体复合物结构预测方面,使用 PoseBusters 数据集进行测试,其成功率甚至超过了依赖已知蛋白质结构的方法,预测结果与 Alphafold3 不相上下;在评估分子内部和分子之间合理性指标时,通过率在几乎所有任务上都超过了 90%。在核酸复合物结构预测领域,尤其是在 CASP15 的 RNA 样本测试中,SWBind模型在无人为干预的情况下,平均精度超越了 AlphaFold3。在蛋白质复合物结构预测任务中,与同类模型对比,其 Docka 分值表现优异,展现出强大的竞争力。






SWBind 应用模式场景


学术界的应用——蛋白质结构预测:


研究人员可使用SWBIND模型对已知和未知的蛋白质序列进行结构预测,验证模型的准确性和可靠性;药物靶点筛选:通过预测蛋白质与小分子化合物的结合模式,研究人员可以快速筛选出潜在的药物靶点,加速新药研发过程;疾病机理研究:了解特定蛋白质的结构有助于揭示疾病的发病机制,为疾病的预防和治疗提供理论依据。例如,阿尔茨海默病的发生与β-淀粉样蛋白的异常聚集有关,通过预测该蛋白的结构,可以为开发治疗阿尔茨海默病的药物提供重要的线索。


工业界的应用:
新药研发:制药公司可利用SWBIND模型快速筛选潜在的药物靶点,缩短药物发现周期,降低研发成本;
个性化医疗:通过精准预测个体化的蛋白质结构,可以为患者提供更加个性化的治疗方案,提高治疗效果;
生物技术革新:蛋白质结构预测技术的应用促进了生物工程技术的发展,如合成生物学、基因编辑等领域。合成生物学旨在设计和构建新的生物系统,而蛋白质结构预测技术可以用于设计具有特定功能的蛋白质。基因编辑技术如CRISPR-Cas9也受益于蛋白质结构预测,通过预测Cas9蛋白与目标DNA的结合模式,可以提高基因编辑的精确性和效率。

研究人员借助SWBind高性能计算线上服务,仅需几步简单的点击操作,就可以通过SWBind对蛋白质、DNA、RNA、选定配体等组成的复杂生物分子结构进行建模,预测蛋白质与细胞内其他分子的相互作用,协助研究者制定新的研究假设与验证,加速研究与开发流程。即便是没有广泛计算资源或深厚机器学习背景的研究者,也能轻松上手。


神威数智依托国家超级计算无锡中心强大的异构算力基础,构建了NSCCWX 新药研发平台。该平台结合了太湖之光 A+ 超算平台的卓越计算能力,以及高效的软件和数据资源,形成了完整的创新研发环境。平台包含基于物理学原理的层级虚拟筛选策略(SW - DOCK)、自研的SWBind AI大模型,以及包含约80亿分子的超大规模虚拟化合物库,涵盖公共和自建数据库。


SWBind是神威数智在依托国家超级计算无锡中心“太湖之光A+”智能超算系统提供的强大计算资源支持上,基于生物计算方向上的最新工作,很荣幸与大家分享现阶段性的成果。SWBind团队秉持着开放与合作的精神,已经将该模型的试用版本发布,诚挚欢迎各科研机构的专家学者、企事业单位的研发人员前来试用反馈,共同推动AI生物计算领域迈向新的辉煌。