联系方式
总机:0510-85195508
业务:0510-85162150
人事:0510-85102511
邮箱:info@mail.nsccwx.cn
传真:0510-85167598
邮编:214000
地址:江苏省无锡市滨湖区吟白路1号研创大厦
关注我们
导读:
如何具象化一个天文量级的数字?银河系中约 4000 亿颗恒星,便是最直观的参照。当 “亿” 成为计量基准,人类得以触摸宇宙尺度的宏大。SWDOCKP² 计算框架与“神威”超级计算机深度耦合,实现了虚拟筛选性能的量级式跃升 — 其筛选规模从早期的十万、百万、千万级别,跨越至宇宙尺度,日筛 1.9万亿配体,这一数值相当于 5 个银河系的恒星总量!
依托国产神威超级计算机系统的强大算力,北京生命科学研究所/清华大学生物医学交叉研究院黄牛课题组联合山东大学、清华大学和国家超级计算无锡中心协同攻关,成功构建并运行了新一代性能可移植虚拟筛选框架SWDOCKP²。该框架实现了每日1.9万亿个蛋白质-配体分子对接的理论计算速度,将基于结构的虚拟筛选能力推向了接近整个人类蛋白质组的覆盖规模。此项里程碑成果已在高性能计算领域顶级学术会议——第 37 届超级计算国际会议(SC25: The International Conference for High Performance Computing, Networking, Storage and Analysis)上报告,并获得广泛关注。
新药研发耗时漫长、投入巨大,而虚拟筛选技术已成为缩短早期发现流程的关键。然而,随着“按需合成”虚拟化合物库规模从百万级爆发式增长至百亿甚至千亿级,计算压力呈指数级上升。据估算,在传统算力平台上,对370亿规模的化合物库进行一次筛选,需耗费数周时间和数千万元成本,这构成了技术普惠的核心瓶颈。
面对这一全球性挑战,国家超级计算无锡中心主动布局,致力于将超级计算的极致性能转化为解决生命科学重大问题的实际能力。
联合团队以经典软件UCSF DOCK3.7为基础,针对 “神威” 超级计算机架构进行深度移植、重构与优化,开发了全新的虚拟筛选软件SWDOCK。实测表明,其单核组性能可达商用CPU单核的13倍。借助新一代神威超算15% 的算力,SWDOCK 仅用 663 秒便完成 5.4 亿配体分子的虚拟筛选,理论对接速度达每日 700 亿配体,跻身国际同类工作领先水平。
然而,面向未来,人类蛋白质组规模的筛选需求与化合物库的指数增长,呼唤着进一步的突破。为此,联合团队持续攻关,在SWDOCK的基础上,推出了全面升级的SWDOCKP²框架。2025 年 11 月,在美国圣路易斯召开的 SC25 会议上,团队以论文《Trillion Ligands per Day: Performance-Portable Virtual Screening via Compound Database Optimization and Multi-Target Docking》作专题报告,系统介绍性能可移植的跨平台虚拟筛选框架SWDOCKP²。该框架可调度新一代神威超级计算机系统,同时对接 8 个蛋白质靶标结构,实现每日 1.9 万亿个蛋白质–配体对的理论筛选速度,较此前领先水平提升一个数量级。
1. 多靶标并行:能量网格融合结合三线性 SIMD 插值算法优化
针对蛋白质组规模筛选中 “多同源蛋白、多功能构象” 的并行对接需求,SWDOCKP² 创新提出 “多靶标并行处理 ” 策略。通过“能量打分网格对齐融合”即将多个受体的能量打分网格在空间上对齐,融合为 “4D 网格”,深度挖掘 SIMD 并行能力,大幅提升数据局部性与 DMA 通信效率。相较于逐个靶点独立对接,该方案显著降低 I/O 与构象匹配的计算开销,同时严格保持对接结果一致性;优化三线性 SIMD 插值算法,在保障精度的前提下进一步提升计算效率,目前已支持最多 8 个受体结构或构象的同步对接。
2. 构象系综重构使能“早淘汰” 机制
在配体小分子侧,团队对化合物构象系综数据库进行精细化重构。通过对构象基础单元(confs)的排序与归并,将对接打分阶段的迭代量降低近一半。同时,引入 “早淘汰” 机制,在对接过程中实时识别并剔除存在明显空间冲突的高能量构象,避免无意义的高开销冗余计算;提出构象打分缓存方案,将高频访问的 confs 打分预存于本地设备存储器(LDM),进一步加速对接流程。受体与配体双重优化,有效压缩冗余计算并提升计算效率,为万亿级筛选奠定坚实基础。
3. 跨平台兼容:从神威走向通用 CPU
SWDOCK 最初专为神威异构架构深度优化,但药物设计与计算化学领域大量研究依赖通用对称多处理器(SMP)平台(如 x86 服务器)。为打破平台壁垒,团队在 SWDOCKP² 中引入基于 OpenMP 的 AthreadS 兼容层。通过 pthread 启动CPE 集群线程,其上运行 OpenMP 线程模拟 CPE ;利用线程栈与线程本地存储模拟 LDM,以编译器内置数据复制函数替代 DMA 指令,在通用处理器上模拟神威平台的编程模式。该设计使得针对神威架构优化的应用可快速移植至通用 CPU 平台,大幅提升代码性能可移植性,为开源学术社区贡献核心技术支撑。
本研究由山东大学软件学院段晓辉研究员、清华大学计算机系/北京生命科学研究所联合培养博士后沈成、北京生命科学研究所/清华大学生物医学交叉研究院博士生陈高伟共同作为第一作者。段晓辉研究员、清华大学/国家超级计算无锡中心主任杨广文教授、山东大学刘卫国教授以及北京生命科学研究所/清华大学生物医学交叉研究院黄牛研究员为共同通讯作者,团队还包括多位高校学者、博士后及研究生。
2025年,相关工作已由段晓辉研究员在中国计算机学会全国高性能计算学术大会(CCF HPC China 2025)作大会特邀报告,并入围“CCF HPC China 2025 超算年度最佳应用”;由沈成博士在SC25会议、“探索计算化学、生物物理与生物科学的前沿交叉”研讨会以及第三届高性能计算青年论坛暨科学智能大模型研讨会上作报告。历次报告均收获与会专家的热烈讨论与高度认可。
在SWDOCKP²框架实现万亿级筛选能力的背后,是国家超级计算无锡中心运维团队对“神威・太湖之光”系统长达近十年的持续优化与坚实保障。在蛋白质组数据集的生产任务中,面对计算任务带来的极端计算与数据压力,运维团队通过精细化算力调度与任务管理,实现了对超大规模计算资源的动态分配与高效利用,保障了长期、高负载作业的稳定执行。
在存储与I/O层面,团队针对虚拟筛选中频繁的大规模文件读写场景,设计了高性能并行文件系统优化方案,显著提升了化合物库加载与结果写入效率。同时,通过全链路性能监控与调优,运维团队与研发团队紧密协作,持续优化从计算节点到存储系统的整体性能,确保系统在极端负载下仍保持高可用性与低延迟。
此外,运维团队还提供了跨平台部署支持与系统级容错保障,为SWDOCKP²在神威超算及未来扩展至其他计算平台奠定了坚实的运行基础。这些底层系统保障与性能优化工作,不仅是项目顺利推进的关键支撑,也为超算在生命科学等领域的深度应用树立了运维标杆。
目前,国家超级计算无锡中心已初步向国内外科研学术机构及药物研发企业开放以SWDOCKP² 虚拟筛选为核心的药物发现计算平台,旨在打破算力资源与技术壁垒,汇聚全球创新力量,加速潜在治疗靶点的挖掘与先导化合物的筛选进程,助力攻克各类疑难疾病,推动全球创新药物研发进入高效、普惠的新阶段。未来,中心将继续与国内优势单位共建联合机构,为气象气候、生命科学、新材料、人工智能等领域提供定制化解决方案,推动科技创新和产业创新深度融合,为经济社会发展注入强劲科技动力。