中国移动研究院黄宇红：突破新型智算原创技术，赋能人工智能纵深发展

2025-05-27朱文凤

107阅

人工智能时代，智算产业不仅是技术竞赛，更是一场关乎未来的生态共建。5月17日，2025世界电信和信息社会日智算产业创新发展论坛在南昌举办。中国移动研究院院长黄宇红出席并作主题演讲，探讨如何通过超万卡智算集群技术创新突破，赋能人工智能纵深发展。

智算已成为人工智能时代发展的关键驱动力。黄宇红指出，当前通往通用人工智能（AGI）的道路上存在两条路径：一条是通过“大模型+大算力+大数据”探索模型能力上限；一条是“模型算法+智算设施”深度融合优化，探索成本下限。“这两条路径不仅推高算力需求，也对智算集群的设计提出新要求。”

随着算力需求的增长，智算集群发展呈现三大趋势：一是预训练和后训练技术推高算力需求，智算集群规模向超万卡演进，推动算力形态和互联架构创新发展，实现极致算效提升；二是DeepSeek引领AI普惠发展，推理算力需求和流量持续激增，加速智算设施的算力形态从单一向多元转变，智算布局从集中式向“集中+分布”转变；三是模型算法、训推框架等基础软件深层次优化和创新，深度挖掘硬件潜能，提升计算效率，开辟大模型全新发展路径。

“近年来，中国移动基于“N+X”智算布局积极推进智算中心建设，已建成两大技术领先的万卡集群，并实现了AI基础设施的一体化供给和服务。”黄宇红表示，面向人工智能时代发展新要求，中国移动将前瞻布局超万卡集群的原创技术体系，攻关构建超万卡集群的系统工程难题和科学技术难题。

在算效提升方面，通过互联技术解决集群有效算力无法随规模线性提升的问题，突破超万卡集群的“算效瓶颈”。当前，开放互联技术缺失导致GPU无法向超节点演进，为此，中国移动原创提出全向智感互联OISA、全调度以太网GSE，助力国产智算集群效能跃升。其中，OISA通过定义协议栈、报文、流控及重传等机制，使互联规模提升16倍、点对点带宽提升约14倍、时延缩短约10倍，在国内形成了广泛的互联生态。全调度以太网GSE实现分发粒度、发流模式、转发和可靠机制等四大机制转变，构建无损的高性能、高可靠机间网络，并立足两大场景，围绕两颗芯片，携手产业伙伴持续攻关GSE关键技术，加速构建GSE产业生态，满足超万卡甚至未来超十万卡智算集群的建设需求。

在生态融通方面，打造基础软件系统将成为驱动算法和基础设施深层次协同的关键。针对国内各厂商智算软件生态多而不强、相互割裂，应用难以跨架构迁移，制约整体训练和推理效能的问题，中国移动提出算力原生原创技术体系（CAMA）并自研“芯合”算力原生基础软件系统，实现多样算力一体适配，应用一次开发，跨芯一键部署迁移，目前已支持7家GPU跨架构高效推理。同时，中国移动联合业界提出异构混训技术，开辟了以软补硬引领生态发展的全“芯”发展路径，目前已构建原创技术体系和原型系统1.0，实现百亿级参数大模型在5家智算芯片上交叉混训能力，加速比超94.5%。

最后，黄宇红表示，新型智算原创技术突破道阻且长，中国移动愿与产学研一起努力，共同助力我国智算产业蓬勃发展。

阅读全文

点个赞(0)

收藏本文

责任编辑：王力