随着智算网络的筹备、建立和使用,需要加快推进智算网络标准化建设,使得异构的算力、网络、数据、模型等资源可以基于标准接入到智算网络,并依据相应标准规范实现统一的资源调度、安全保护、数据传输、服务运营等功能。2021年12月,在AITISA联盟AI标准工作组第17次大会上,智算中心和智算网络专题组正式成立,统筹推进智算中心和智算网络的标准化研制工作。
鹏城实验室联合华为技术有限公司、北京大学、国防科技大学等多家单位在AITISA联盟AI标准工作组-智算专题组提出了《人工智能算力网络技术规范》系列标准规划,并提交了多份相关需求提案、草案提案,具体标准体系及提案情况如下:
功能层 | 标准名称 | 标准内容 | 参与单位 | 负责人 |
---|---|---|---|---|
总体 | 第1部分: 总体要求 |
智算网络术语、参考架构、总体功能要求 及接口要求 |
鹏城实验室 北京大学 国防科技大学 华为技术有限公司 |
张叶红 zhangyh02@pcl.ac.cn |
资源层 | 第2部分: 异构资源统一标识 |
数据、算力、模型、存储、网络等异构资 源统一抽象标识的方法与转换要求 |
||
第3部分: 云际数据统一存储应用接口 |
定义全局共享数据存储的统一技术架构, 定义功能、接口、性能及可靠性要求 |
鹏城实验室 北京大学 中国科学技术大学 清华大学 |
张水勇 zhangshy@pcl.ac.cn |
|
适配层 | 第4部分: 调度适配器南向接口规范 |
定义调度适配器与各智算中心云化管理调 度系统之间的接口,实现智算中心资源获 取和作业下发 |
鹏城实验室 北京大学 中国科学技术大学 合肥综合性国家科学中心人工智能研究院 华为技术有限公司 中科寒武纪科技股份有限公司 横琴先进智能计算中心 中原人工智能计算中心 合肥中科类脑智能技术有限公司 |
郑歆慰 xwzheng@ustc.edu.cn |
第5部分: 资源感知路由协议接口 |
定义通过智算网络资源感知路由协议获取 资源动态信息的接口 |
|||
调度层 | 第6部分: 云际管理与调度 |
定义异构云互联的云际资源管理与调度系 统功能模块及智能优化调度技术与策略 |
鹏城实验室 北京大学 国防科技大学 华为技术有限公司 中科寒武纪科技股份有限公司 |
林冯军 linfj@pcl.ac.cn |
网络层 | 第7部分: 网络设施互联 |
规定智算中心网络互联需要的网络种类、 网络规格、网络功能等 |
||
应用层 | 第8部分: 应用层接口 |
定义运营层、调度层为应用层提供的服务 功能及接口 |
鹏城实验室 北京大学 国防科技大学 华为技术有限公司 |
徐春香 xuchx@pcl.ac.cn |
第9部分: 协同计算 |
定义协同计算应用场景,抽象建模协同计 算作业,定义作业流程、作业评估及协同 计算参考架构 |
鹏城实验室 北京大学 国防科技大学 华为技术有限公司 北京百度网讯科技有限公司 广西梯度科技有限公司 依瞳科技 |
王进 wangj05@pcl.ac.cn |
|
运营层 | 第10部分: 基础运营服务 |
定义运营层基础功能,包括用户/智算中心 认证与授权、行为审计、运维监控等 |
||
第11部分: 算力运营 |
定义算力资源使用计量和费用结算方法, 算力统一度量,算力运营分析等 |
|||
第12部分: 数据资源流通交易统一规范与接口 |
定义运营层数据市场与模型市场资源流通 交易过程中的技术需求,包括数据资源发 布、确权、计量计费、运营分析等 |
鹏城实验室 北京大学 国防科技大学 华为技术有限公司 中科寒武纪科技股份有限公司 |
慕鑫 mux@pcl.ac.cn |
|
安全机制 | 第13部分: 通信网络安全 |
定义智算网络中通信网络认证、传输等过 程中的安全技术需求 |
||
第14部分: 数据与模型安全 |
定义智算网络运营及应用中数据与模型隐 私安全技术需求 |