人工智能时代,智算产业不仅是技术竞赛,更是一场关乎未来的生态共建。5月17日,2025世界电信和信息社会日智算产业创新发展论坛在南昌举办。中国移动研究院院长黄宇红出席并作主题演讲,探讨如何通过超万卡智算集群技术创新突破,赋能人工智能纵深发展。

智算已成为人工智能时代发展的关键驱动力。黄宇红指出,当前通往通用人工智能(AGI)的道路上存在两条路径:一条是通过“大模型+大算力+大数据”探索模型能力上限;一条是“模型算法+智算设施”深度融合优化,探索成本下限。“这两条路径不仅推高算力需求,也对智算集群的设计提出新要求。”
随着算力需求的增长,智算集群发展呈现三大趋势:一是预训练和后训练技术推高算力需求,智算集群规模向超万卡演进,推动算力形态和互联架构创新发展,实现极致算效提升;二是DeepSeek引领AI普惠发展,推理算力需求和流量持续激增,加速智算设施的算力形态从单一向多元转变,智算布局从集中式向“集中+分布”转变;三是模型算法、训推框架等基础软件深层次优化和创新,深度挖掘硬件潜能,提升计算效率,开辟大模型全新发展路径。
“近年来,中国移动基于“N+X”智算布局积极推进智算中心建设,已建成两大技术领先的万卡集群,并实现了AI基础设施的一体化供给和服务。”黄宇红表示,面向人工智能时代发展新要求,中国移动将前瞻布局超万卡集群的原创技术体系,攻关构建超万卡集群的系统工程难题和科学技术难题。
在算效提升方面,通过互联技术解决集群有效算力无法随规模线性提升的问题,突破超万卡集群的“算效瓶颈”。当前,开放互联技术缺失导致GPU无法向超节点演进,为此,中国移动原创提出全向智感互联OISA、全调度以太网GSE,助力国产智算集群效能跃升。其中,OISA通过定义协议栈、报文、流控及重传等机制,使互联规模提升16倍、点对点带宽提升约14倍、时延缩短约10倍,在国内形成了广泛的互联生态。全调度以太网GSE实现分发粒度、发流模式、转发和可靠机制等四大机制转变,构建无损的高性能、高可靠机间网络,并立足两大场景,围绕两颗芯片,携手产业伙伴持续攻关GSE关键技术,加速构建GSE产业生态,满足超万卡甚至未来超十万卡智算集群的建设需求。
在生态融通方面,打造基础软件系统将成为驱动算法和基础设施深层次协同的关键。针对国内各厂商智算软件生态多而不强、相互割裂,应用难以跨架构迁移,制约整体训练和推理效能的问题,中国移动提出算力原生原创技术体系(CAMA)并自研“芯合”算力原生基础软件系统,实现多样算力一体适配,应用一次开发,跨芯一键部署迁移,目前已支持7家GPU跨架构高效推理。同时,中国移动联合业界提出异构混训技术,开辟了以软补硬引领生态发展的全“芯”发展路径,目前已构建原创技术体系和原型系统1.0,实现百亿级参数大模型在5家智算芯片上交叉混训能力,加速比超94.5%。
最后,黄宇红表示,新型智算原创技术突破道阻且长,中国移动愿与产学研一起努力,共同助力我国智算产业蓬勃发展。