10月15日,OPPO ColorOS 16发布会暨OPPO开发者大会在深圳隆重召开,大会现场除发布OPPO最新技术外,还举办了多场论坛,与业界领袖共同探讨科技创新与人工智能(AI)新生态构建。在大会上,Arm受邀发表了主题演讲,分享端侧AI的演进趋势及Arm最新的Lumex AI计算平台如何助力技术突破、应用创新及生态合作。
端侧AI实现“从可选到必需”的跃迁,个性化成核心方向
“仅一年时间,端侧AI就已从‘可选功能’变为用户‘基础期待’。”Arm终端事业部智能手机市场高级总监Steve Raphael在演讲中指出,2024年行业还在探讨端侧AI的落地可能性,2025年实时智能就已成为移动设备的“必需品”。AI不仅能力更强,也变得更具“个性化”,能为每个人提供专属服务。
这种转变的核心在于快速演进的用户“个性化”需求与AI“主动协作”能力。依托大语言模型(LLM)与智能体AI (agentic AI)的发展,当前端侧AI已经可以自主完成推理、规划与任务执行:从梳理工作流、实时翻译,到预判用户潜在需求,甚至主动生成旅行方案、会议纪要,整个过程丝滑流畅。这种更懂用户的“无感化智能交互”,正是端侧AI的终极目标。
SME2 + KleidiAI技术,加速端侧AI性能优化
如今,智能手机已成为端侧AI的核心入口,深度承载着用户生活、工作中的海量任务。与此同时,智能系统对“即时响应、随时可用、隐私安全、低功耗”的需求日益迫切,传统计算模型在应对这类实时化、个性化的智能诉求时,已逐渐显现出适配短板。为助力合作伙伴突破行业挑战、匹配产业发展核心需求,Arm最新推出“AI优先”的Lumex计算平台。该平台通过硬件、软件及工具等层面的协同创新,帮助开发者更高效地实现端侧AI功能突破,最终为智能手机用户带来更优质的体验升级。
硬件层面,作为智能手机的智慧中枢,CPU在端侧AI中发挥着关键作用,得益于其强大的“通用计算”特性,开发者更倾向于将工作负载保留在CPU上,仅将真正需要的部分迁移到其他硬件。Arm Lumex计算平台搭载了Arm最新C1系列CPU——也是首批基于Armv9.3架构的CPU系列产品。作为Lumex平台最亮眼的技术之一,SME2技术为C1 CPU带来颠覆性提升:处理AI工作负载的速度较前代提升5倍,能效提升3倍,在耗时低于100毫秒的轻量任务中,其性能甚至超越了传统GPU。值得关注的是,SME2技术在实现性能突破的同时,并未增加开发者的技术适配门槛,反而有效降低了端侧AI功能的开发与落地成本。
软件层面,Arm于2024年推出了KleidiAI轻量级软件,这是一款面向AI框架开发者的轻量级内核库,能够在无可比拟的规模下,为广泛的技术市场以及各类基于Arm架构的设备——从早期搭载Neon技术的设备到最新Lumex平台——提供AI模型和工作负载的无缝性能优化。目前,KleidiAI已集成至所有主流移动操作系统及AI框架中,包括PyTorch ExecuTorch、谷歌LiteRT、阿里巴巴MNN及微软ONNX Runtime,并已在Android与iOS系统中广泛应用。借助KleidiAI,开发者无需修改任何代码,即可自动取得SME2的加速能力,为Arm生态中2,200万开发者提供高效便捷的端侧AI开发支持,并显著降低技术应用门槛与开发成本。
此外,Arm Lumex平台通过“自顶向下”的方法和工具,帮助开发者快速定位不同CPU的性能问题,实现跨平台的一致体验优化。
支付宝、淘宝等应用率先落地,解决端侧AI真实用户痛点
对开发者而言,技术最终要落地到实际应用场景。演讲中,Steve Raphael分享了SME2技术在国内应用场景的落地案例,印证了端侧AI“从技术到价值”的转化路径。在支付宝应用中,SME2为“回忆视频”功能提供强大的支持,可自动将用户相册照片生成为动态视频集锦;在淘宝应用场景下,SME2助力实现“端侧实时电商重排序”,通过LLM精准匹配用户偏好,同时支撑“拍照购物”功能——用户拍下商品图片后,可即时检索同款,大幅缩短购物链路。
此外,Arm与谷歌合作优化Android AICore组件(赋能Gemini Nano模型),将智能回复等功能的安全模型延迟降低20%;与Stability AI联合开发的Stable Audio Open音频生成模型,通过CPU混合浮点与整数数据处理的优势,在手机端实现“文本生成音频”,且功耗远低于GPU方案。
与生态伙伴协同创新,端侧AI进入“共生时代”
端侧AI的下一个阶段,已不是性能参数的比拼,而是生态协同的较量。Arm的技术探索始终以“开放协作”为核心,与硬件、软件和应用领域的生态伙伴紧密协作,充分释放端侧AI在实际场景中的应用潜力,其中与OPPO的合作便是业界典范。目前,Arm已与OPPO深度合作,将SME2技术集成至OPPO的AI框架中,在显著提升AI性能优化和开发效率的同时,有效降低了OPPO生态开发者的技术门槛。
SME2已在端侧AI领域产生了实际影响——无论是性能还是准确率,都实现了显著提升。目前,Arm正积极将SME2技术扩展至每一个CPU平台。预计到2030年,SME与SME2技术将为超过30亿台设备新增超100亿TOPS的计算能力,持续降低端侧AI的部署成本与隐私风险。回应OPPO开发者大会“共建AI新生态”的理念,Steve Raphael表示,Arm将持续以SME2、KleidiAI等技术为支点,与生态伙伴携手,推动端侧AI从“单点创新”走向“生态共生”,最终让端侧AI体验惠及每一位用户。
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。