新闻动态

喜报 | 国家超级计算无锡中心入选《长三角科技创新共同体协同创新典型实践案例名单》

2023-10-24 14:17

国家超级计算无锡中心

“超算互联网”

入选

长三角科技创新共同体协同创新

十佳典型实践案例名单




近日,上海市科学技术委员会、江苏省科学技术厅、浙江省科学技术厅、安徽省科学技术厅共同发布了《长三角科技创新共同体协同创新典型实践案例名单》。国家超级计算无锡中心《超算互联网》创新案例成功入选。

让我们一起来了解下吧!


关于“超算互联网”




NO.1
示范意义
国家超算互联网工程以“四个面向”(面向世界科技前沿,面向世界经济主战场,面向国家重大需求,面向人民生命健康)为需求和价值导向,致力于构建起支撑创新驱动发展战略的先进计算基础设施网络和生态系统,广泛连接算力、算法、数据、模型、应用、人才等资源要素,促进各类创新要素交叉协同,促进超算软硬件技术生态自立自强,促进科技创新范式在千行百业普及应用,助力产业高质量发展。




NO.2
基本情况
超算互联网是一种通过专用的高速互联网络将各超算中心的计算资源聚合在一起的先进计算基础设置。作为一种先进计算基础设施,超算互联网将超级计算机所提供的强大计算能力抽象为更加本质的计算服务,并以一种标准化的形式提供给计算服务的使用者,从而实现超算算力的互联互通。简单地讲,我们可以将超算互联网与电力网相类比。电力网制定标准的发电、传输、用电规范,构建基本的电力传输和交易平台,将来自于火电、水电、风电、核电、光伏等不同来源的电力整合到一起,为工业、农业、居民、科研等各种电力用户提供即用即得的电力服务。
与电力网类似,超算互联网通过制定资源接入、共享、交易等规范,构建具备资源共享与交易能力的公益性资源平台,将来自各级超算中心、云计算企业、科研机构等不同来源的算力、数据、软件、应用等抽象为统一的超算资源并整合到一起,为科研、生产、生活等提供高效专业的超级计算服务,实现超算算力的互联互通与有效整合。
2020年开始,国家超级计算无锡中心联合多家国家级超算中心、高校和科研院所共同承担国家“十三五”重点研发计划高性能计算专项国家高性能计算环境领域应用平台及服务体系研究与构建”项目,开展了超算互联网技术体系和应用模式研究,探索了超算互联网建设与运营的模式与机制,为促进超算中心从提供算力到提供服务的重大转变,提升超算对科技创新、经济建设、社会发展的推动能力提供了基础性的实践支撑。
与此同时,国家超级计算无锡中心与之江实验室合作研发“超算互联网系统集成与服务平台构建及应用”项目具有全国示范性意义:
一是将超算中心碎片化的算力和其他资源有效整合,提高算力的利用率和均衡性;
二是建立超算计算资源管理和业务平台服务体系。提供跨超算中心的统一服务和评价标准;
三是建设面向领域性的应用平台。充分利用超算资源,为终用户提供领域性的应用服务。




算力网架构


和传统的超算应用相比,超算互联网的最大特点是:变提供超算算力为提供超算应用服务,这将带来超算互联网在应用模式上的巨大变化,不仅为国家实验室等大型研究机构提供超大算力支撑,也为国家“东数西算”战略提供有益探索和先行示范。




NO.3
应用场景
超算互联网应用服务平台是支撑超算基础设施网络化服务化产业化发展的核心运行载体,以“互联互通、异构融合、应用引领、产业升级、开放合作”为建设思路,旨在打造一个类京东、类淘宝的算力应用电商平台。超算互联网应用服务平台的构建涉及资源接入、资源调度、用户自服务、交易结算、应用服务、超算社区、运营推广、安全管理、标准规范等方面。
面向超算互联网的多场景应用需求,构建一体化的服务编排机制和服务发布标准,实现高性能计算、人工智能计算、云计算、大数据等不同业务的融合调度。支持按不同场景制定组合策略和可视化的工作流编排,以实现服务的高效管理和弹性扩展,提高计算效率。基于算力原生技术屏蔽异构硬件差异,减少用户跨架构编程的重编译和迁移代价,使得应用只需关注计算表达,无需关注计算在硬件上的具体实现。平台对全网算力资源进行统一纳管,实现算力跨域多级调度;通过网络编排器对接跨域、跨专业的连接网络,实现网络端到端拉通。

超算互联网应用商城与服务

根据不同类型应用,制定应用封装、发布标准,包括应用环境依赖、安装打包、环境部署等,支撑应用一键安装、订阅即享。应用封装完成后,平台在不同的硬件测试环境下进行功能测试与安全性验证,确保其安全性和可用性。在应用封装过程中,需将计算环境划分成预装软件区或动态部署区。预装软件区,主要用于部署公共的、开源的或者使用频度高的软件,以提高软件安装部署效率,减少用户工作量;动态部署区,主要用于部署使用频率相对较低、个性化需求较大的软件,简化用户自行安装软件的复杂性,实现“开箱即用”。





跨超算中心的工作流定制与开发




NO.4
建设目标
超算互联网平台的建设目标并不是要把全国的超级计算机聚集起来做成一个超大型的计算机——事实上,多数的应用并不需要调动各地的超算中心一起来做。面向国家重大发展战略,超算互联网致力于解决从以下几方面内容:

01
构建先进算力网络

通过高速网络实现各超算中心的计算资源、存储资源和软件资源的互联互通与共享,搭建超算互联网算力及服务平台,实现高度智能化的任务调度和资源分配。未来,超算互联网有望实现国家超级计算中心之间每秒千亿字节的高速网络互联互通,聚合每秒几百亿亿次的运算能力,为实现我国的高质量发展和科技自立自强作出历史性的贡献。


02
降低超算使用门槛
采用类似淘宝、京东的线上交易模式,为广泛用户带来便捷、高效、智能、安全的算力获取与使用体验,降低算力使用成本,实现算力普惠。同时,超算互联网也有望降低超算应用的复杂性,通过屏蔽底层硬件架构的差异性,让超算应用可以像Java程序一样,实现“一次编程,到处运行”,降低超算软硬件适配优化的难度与成本,让算力像电力一样走进千家万户,赋能千行万业。

03
促进超算普及应用
促进高性能计算的普及性应用,让用户使用超级计算机就像今天网民在线购物一样方便。超算互联网不仅要支撑千百万核超大规模并行应用,也要支持各行业领域大量的小规模并行计算应用,帮助我国数百万科研人员使用超级计算进行数值模拟、仿真设计、模型训练和数据分析。

04
引领超算产业升级

超算互联网将超算机器研制单位、超算资源提供单位、超算应用单位紧密联系在一起,强化产业链上下游协作,促进软件硬件协同发展与应用创新,进而提升我国的超级计算机以及超算应用水平,带动超算服务市场空间向百亿级规模拓展,形成一个健康、活跃的超算产业生态圈。


05
支持新兴应用创新
构建领先、安全、高效的计算资源共享平台,推动高性能计算技术与人工智能、区块链等新技术的融合创新,推动科技进步和经济发展。支持数据的大范围协同,实现跨地域协同计算,处理更大规模、更复杂的计算任务,也可以支持新兴科技领域的创新,如AI for Science、生成式大模型等,推动数据驱动的创新范式变革。未来的超算互联网有望成为一个高效、智能、安全的计算资源共享平台,力争实现全球范围内超算资源的高效利用和协同计算。



NO.5
展望与呼吁
超算互联网是国家级战略工程、系统工程,其健康发展离不开中央和地方政府的大力支持。针对“卡脖子”关键核心技术,发挥新型举国体制,超前部署,强化跨部门、跨领域、跨学科、跨区域的协同协作机制,通过重点研发计划长期、持续支持超算互联网关键技术攻关与机制创新。希望地方政府可积极引导和支持超算产业与地方经济社会紧密融合,鼓励开发一批具有地方特色、产业特色的超算应用服务,推动超算技术在地方科学研究、经济发展、社会治理等领域的广泛和深入应用,支持建设超算互联网区域结点,打造有利于超算创新创业、人才培养的文化氛围和营商环境。