Arm Lumex CSS 平臺支持實時端側 AI 用例,覆蓋智能助手、語音翻譯及個性化服務;依托搭載全新 SME2 技術的 Arm CPU,該平臺可實現(xiàn)高達五倍的 AI 性能提升。
開發(fā)者可借助 KleidiAI 調用 SME2 技術帶來的性能優(yōu)勢;目前 KleidiAI 已集成至所有主流移動操作系統(tǒng)及 AI 框架中,包括 PyTorch ExecuTorch、谷歌 LiteRT、阿里巴巴 MNN 及微軟 ONNX Runtime。
針對旗艦級設備,Arm Lumex CSS 平臺創(chuàng)造了前所未有的成就——連續(xù)六年締造兩位數(shù)的每時鐘周期指令數(shù) (IPC) 性能提升。
全新 Mali G1-Ultra 專為游戲玩家設計,可帶來兩倍的光線追蹤性能提升,重新定義移動娛樂體驗。

Arm 控股有限公司今日宣布推出全新 Arm® Lumex™ 計算子系統(tǒng) (Compute Subsystem, CSS) 平臺,這是一套專為旗艦級智能手機及下一代個人電腦加速其人工智能 (AI) 體驗的先進計算平臺。Lumex CSS 平臺集成了搭載第二代可伸縮矩陣擴展 (SME2) 技術的最高性能 Arm CPU、GPU 及系統(tǒng) IP,不僅能助力生態(tài)伙伴更快將 AI 設備推向市場,還可支持桌面級移動游戲、實時翻譯、智能助手及個性化應用等多樣的豐富體驗。

Arm 高級副總裁兼終端事業(yè)部總經理 Chris Bergey 表示:“AI 已不再僅僅是一項技術功能,它已成為下一代移動與消費技術的支撐底座。依托 Arm Lumex 平臺,我們持續(xù)提升端側 AI 體驗,以滿足用戶日益增長的需求與期待。為此,我們正積極將 SME2 技術擴展至每一個 CPU 平臺。預計到 2030 年,SME 與 SME2 技術將為超過 30 億臺設備新增超 100 億TOPS 的計算能力,為端側 AI 性能帶來指數(shù)級躍升。”
合作伙伴可靈活選擇使用 Arm Lumex 的方式,為其打造系統(tǒng)級芯片 (SoCs)。例如,他們可直接采用 Arm 交付的平臺,并借助為其需求定制的先進物理實現(xiàn)方案,從而獲得縮短產品上市時間和快速兌現(xiàn)性能價值等雙重優(yōu)勢;或者,合作伙伴也可根據(jù)他們的目標市場,對平臺寄存器傳輸級 (RTL) 設計進行配置,并自行完成核心模塊的硬化工作。
全新 Arm Lumex 平臺包含以下核心組件:
- 新一代搭載 SME2 技術的 Armv9.3 CPU 集群:包括 Arm C1-Ultra 和 Arm C1-Pro,為旗艦設備提供支持
- Arm C1-Premium:專為次旗艦市場打造,可提供一流的面積效率
- Arm Mali™ G1-Ultra GPU:配備新一代光線追蹤技術,在實現(xiàn)先進的圖形和游戲體驗同時,還可提升整體 AI 性能
- Arm C1-DSU:Arm 迄今為止最靈活、高能效且具多種電源模式的 DynamIQ Shared Unit (DSU)
- 針對三納米工藝節(jié)點優(yōu)化的物理實現(xiàn)
- 跨軟件棧的深度集成,為使用 KleidiAI 軟件庫的開發(fā)者提供無縫的 AI 加速體驗
搭載 SME2 技術的 CPU:助力實現(xiàn)全場景 AI 加速
搭載 SME2 的 Arm C1 CPU 集群,為實際場景中的 AI 驅動型任務帶來了顯著的 AI 性能提升,包括:
- AI 性能提升高達五倍
- 語音類工作負載延遲降低 4.7 倍
- 音頻生成速度提升 2.8 倍
全新的 Arm CPU 在 AI 計算能力上的飛躍,讓實時的端側 AI 推理成為現(xiàn)實,為用戶在音頻生成、計算機視覺及情境助手等多種交互場景中帶來更流暢、更快速的體驗。
在實際場景中,SME2 技術將響應速度與運行效率提升至全新水平。例如,在“智能瑜伽教練”演示應用中,得益于 SME2 技術,該應用的文本轉語音生成速度提升了 2.4 倍,這意味著用戶能即時獲得姿勢反饋與指導,且全程不用擔心設備的電池續(xù)航問題。此外,通過 Arm、支付寶與 vivo 的三方合作下,將大語言模型 (LLM) 的交互響應時間縮短了多達 40%,充分證明了 SME2 可為終端設備帶來更快速的實時生成式 AI 體驗。
SME2 技術的價值不僅在于速度的提升,更在于釋放出傳統(tǒng) CPU 無法企及的 AI 驅動功能。例如,在搭載 SME2 的單個核心上運行神經攝像頭降噪功能,可以在 1080P 分辨率下實現(xiàn)幀率超 120 幀/秒 (fps),或在 4K 分辨率下實現(xiàn)幀率達 30fps。這使得智能手機用戶即使身處光線最暗的場景,也能捕捉到更銳利、清晰的圖像,進而在日常設備上獲得更流暢的操作交互與更豐富的使用體驗。
不同于受到延遲、成本及隱私問題等挑戰(zhàn)的云優(yōu)先 AI,Lumex 將智能引入設備端,能夠在本地實現(xiàn)更快、更安全且隨時可用的智能體驗。SME2 已經廣受業(yè)界領先生態(tài)伙伴的采用,包括阿里巴巴、支付寶、三星 System LSI、騰訊及 vivo。
為全線產品層級賦予架構自由
Arm Lumex 為合作伙伴提供了充分的自由度,使其能從高端智能手機、PC 到新興 AI 優(yōu)先設備的各類產品中,實現(xiàn)峰值性能、持續(xù)能效與芯片面積之間的靈活平衡。
CPU
主要優(yōu)勢
性能與能效提升
理想應用場景
Arm C1-Ultra
旗艦級峰值性能
單線程性能提升 25%,IPC 性能同比實現(xiàn)兩位數(shù)增長
大模型推理、計算攝影、內容創(chuàng)作、生成 式 AI
Arm C1-Premium
兼具 C1-Ultra 性能且面積效率更優(yōu)
相較于 C1-Ultra 面積縮減 35%
次旗艦移動設備市場、語音助手、多任務處理
Arm C1-Pro
持久高能效
持續(xù)性能提升 16%
視頻播放、流式推理
Arm C1-Nano
極致能效
效率提升 26%,面積更小
可穿戴設備、超小型設備
Mali GPU:實現(xiàn)桌面級游戲體驗和更快的 AI 推理

隨著搭載 Arm GPU 的芯片累計出貨量突破 120 億顆,Arm 持續(xù)穩(wěn)居手游體驗領域的核心地位。全新的 Arm Mali G1-Ultra GPU 進一步突破移動游戲的性能邊界,為手游玩家?guī)砀弑U妗⒅鳈C級畫質。這一突破得益于全新的第二代光線追蹤 (Ray Tracing Unit v2, RTUv2) 技術,該技術顯著提升光照、陰影與反射效果,使其光線追蹤性能相較前代提升了兩倍。在 AI 工作負載方面,Mali G1-Ultra 可將推理性能提升最高 20%,顯著增強各類實時應用的響應速度。
在各類圖形基準測試中,Mali G1-Ultra 較前代產品實現(xiàn)了 20% 的性能提升,為《暗區(qū)突圍:無限》、《堡壘之夜》、《原神》、《崩壞:星穹鐵道》等主流游戲帶來了全面的性能增強。同時,Mali G1-Premium 與 Mali G1-Pro 兩款 GPU,也為硬件資源受限的設備提供了更出色的性能與能效表現(xiàn)。
開發(fā)者友好的端側 AI 解決方案

開發(fā)者可在 Arm Lumex 平臺上獲取開機即用的 AI 開發(fā)體驗。通過 KleidiAI 與各大主流框架的集成,包括 PyTorch ExecuTorch、Google LiteRT、阿里巴巴 MNN 及微軟 ONNX Runtime,開發(fā)者無需修改任何代碼,即可自動取得 SME2 的加速能力。
對于需要構建跨平臺應用的開發(fā)者而言,Lumex 帶來了全新的可遷移性:
- Gmail、YouTube 和 Google Photos 等 Google 應用現(xiàn)已全面支持 SME2 ,搭載 Lumex 的設備一經上市即可無縫運行
- 跨平臺可遷移性意味著針對安卓構建的優(yōu)化功能可無縫擴展至采用 Arm 架構的 Windows 及其他操作系統(tǒng)
- 支付寶等合作伙伴已成功驗證:依托 SME2 技術,終端設備上的大語言模型 (LLM) 可實現(xiàn)高效運行。
Apple、三星和 MediaTek 等科技領軍企業(yè),正積極集成 AI 加速功能,推動端側 AI 向更快速、更高效的方向發(fā)展。其中,Apple 正憑借該能力為“蘋果智能” (Apple Intelligence) 提供核心支撐;三星與 MediaTek 則借助 Google Gemini 提升翻譯、摘要、個人助手等實時 AI 應用的響應速度與運行效率。
Arm Lumex:AI 時代的平臺級智能
Arm Lumex 不僅是 Arm 面向消費計算市場的最先進 CSS 平臺,更是開啟新時代智能 AI 體驗的基石。無論是 OEM 廠商還是開發(fā)者,Lumex 均可提供所需工具,助力其在關鍵端側場景實現(xiàn)兼具個性化、隱私保障與高性能的 AI 體驗。作為專為 AI 時代打造平臺, Arm Lumex 將成為未來移動創(chuàng)新的全新起點。
Arm Mali G1-Ultra 重新定義游戲與 AI 體驗
Mali G1-Ultra 專為新一代手游和 AI 體驗打造,通過以下設計在移動設備上實現(xiàn)高端沉浸式游戲體驗:
- 新一代 Arm 光線追蹤單元 RTUv2;
- 加速的端側 AI;
- 重構圖形管線;
- 單一目標導向設計中的增強型架構效率。
與前一代 Arm Immortalis-G925 GPU 相比,Mali G1-Ultra 的光線追蹤性能提升高達兩倍,并在主流圖形基準測試中,性能表現(xiàn)提升 20%。在 AI 方面,通過新的 FP16 矩陣計算路徑,該 GPU 在 AI 與機器學習網絡上的推理速度比 Immortalis-G925 快上 20%。此外,Mali G1-Ultra 還改進了內存、調度和開發(fā)者工具,使 Arm 生態(tài)系統(tǒng)能夠在不犧牲功耗或效率的情況下,擴展視覺和智能性。