在 COMPUTEX 2024 期間,Arm CEO Rene Haas 特別說明了 AI 所帶來產業變革,並且再次說明了 Arm KleidiAI,包括針對 AI 工作負載的 KleidiAI 和針對電腦視覺應用的 KleidiCV。另外也再次針對 Arm 終端產品運算子系統(CSS)做了說明,並且提到預計 2025 年底,市場將有超過千億的 AI 裝置採用 Arm 的產品組合。
![]()
眾所皆知愛台灣的 NVIDIA 執行長黃仁勳這次訪台最常逛的就是夜市,首場 Keynote 似乎也吸引許多 CEO 級人物關注,AMD CEO 蘇姿丰在活動上以「夜市」為例大秀 AI,而 Arm CEO Rene Haas 也在 Keynote 上直接拿他在發表會前一天逛夜市的照片做對比,提到自己也試著去逛了一下夜市,並且強調台灣的 OEM 與 ODM 廠商都是Arm的重要合作夥伴。
![]()
Rene Haas 表示,自 1981 年以來,網路以驚人的速度發展,然而 AI 的發展是經過一段時間累積而爆發的,它以應用程式為例,Twitter 花了五年普及、Instagram 約兩年半、TikTok 僅需 9 個月,然而 ChatGPT 則只需要兩個月。在未來,AI 的普及需要效能、需要更多廠商加入。
談到效能,Rene Haas 提到亞馬遜最新的雲端處理器 AWS Graviton 效能提升 60%、微軟 Azure Cobalt 100效能提升 40%、Google Axion 效能提升 60%、NVIDIA 昨晚發表的 Grace Blackwell 效能提升 25X,說明效能對於 AI 的影響。他也提到近期發表的 Arm KleidiAI 將提供開發人員無縫存取 Arm CPU 上的最佳效能。
![]()
KleidiAI 是一組為 AI 框架開發人員設計的運算核心,使他們能夠無縫存取 Arm CPU 上的最佳效能,適用於各種裝置,並支援 NEON、SVE2 和 SME2 等關鍵 Arm 架構特性。KleidiAI 與現行熱門的 AI 框架整合,例如 PyTorch、TensorFlow 和 MediaPipe,以促進主要模型包括 Meta Llama 3 和 Phi-3 的加速。Haas 表示:「在 Arm 超過 30 年的歷史中,如果我們有學到什麼,那就是無論硬體多出色,如果沒有開發人員能夠存取的資源,那硬體也沒有多大用處。」
![]()
Arm 的資深副總裁暨終端產品事業部總經理 Chris Bergey ,也在會中介紹了最近發表的 Arm 終端產品運算子系統(CSS)。這是 Arm 第一次在先進的 3 奈米製程節點中,導入其 CPU 和 GPU 的實體實作。 Bergey 表示,這一點非常重要,因為 Arm 生態系現在可以在這些先進的 3 奈米製程節點中,採用經過驗證的核心實體實作,能以更充分的信心更快地上市。
Arm 終端產品運算子系統 (CSS) 是全新的運算解決方案,結合 Armv9 的各項優勢,以及通過 3nm 製程節點驗證及認證可量產實作的全新 Arm CPU 及 GPU,結合 Kleidi 軟體,將成為推動 AI 未來發展的運算平台。
Arm 還展示同樣採用台積電 3nm 製程的 CPU Cortex-X925 及 GPU Immortalis-G925 的設計,提供片段預處理技術 (Fragment prepass) ,並將圖塊模組和移位轉換單元的數據傳輸量提高到原來的兩倍,採用最新的圖形及機器學習 (ML) 效能與節能技術,圖塊模組資料傳輸量提升兩倍,移位轉換單元的資料傳輸量提升兩倍,GPU效能是歷代最強,相較上一代效能提升 37%、AI 處理提升 34%、光追效能提升 52%。Arm 資深副總裁暨終端產品事業部總經理 Chris Bergey 指出, Arm Immortalis-G925 GPU 是 Arm 目前為止效能及效率最高的GPU。
![]()
根據 Arm 介紹,Immortalis-G925 是以 Arm 第 5 代架構為基礎,可配置最多 24 個核心,搭載了兩組Cortex-X925、四組Cortex-A725以及兩組Cortex-A520,是所謂四大兩小以及兩超大核心的組合,整個平台組合專為AI PC設計,效能提升 37%,GPU 能耗提升 30%,AI 處理效率大幅提升 59%, 是 Arm 有史以來為 Android 平台開發的最強效能核心,也為次世代 AI PC 帶來可擴充性。
![]()
順帶一提,Cortex-X925 核心單執行緒應用執行速度比前代改良 36%,而執行 AI 應用效能也高 41%,以 Cortex-X925 為基礎的新 CPU 每核心 L2 快取可高達 3 megabytes。根據先前發表會介紹,此次與 X925 同步發表的還有 Cortex-A725 和 Cortex-A520,前者效能相比前一代產品提升了 35%,而後者主要專注在能耗。在遊戲性能方面,ARM 的改進使得相同水準的遊戲效能下,功耗降低了 30%。
談到 AI 應用,Haas 指出,Arm 已經成為全球每個主要作業系統的既定標準。Microsoft 宣佈的 AI PC 就是其中一個很好的例子,所有最常用的應用程式,現在都在 Windows on Arm 上原生運行。事實上,擁有 1800 萬軟體開發人員的生態系,使得今天有更多的開發人員在 Arm CPU 上設計,而不是任何其他處理器。如果我們希望能從邊緣的最小裝置到雲端的訓練和推論,體驗 AI 帶來的社會變革,這種對開發人員的支持是極其重要的。開發人員需要能夠將他們在 AI 上的創新應用於硬體,並在效能優化、功耗最佳化、高度可執行和可預測的狀態下運行。
Haas 在演說結束時進一步強調了 Arm 對 AI 的承諾:提供地球上最完整的運算平台。透過例如Arm CSS 和 KleidiAI 這樣的創新,他預計到 2025 年底,將有超過 1000 億台 Arm 裝置可以運行AI。Haas 表示,這不僅將重塑產業,也將重塑整個地球。