2025年9月,Arm發布了其最新的處理器架構。今年,Arm拋棄了原有的X系列和A系列命名規則,采用了新的的命名規則,叫C1系列,包括了C1-Ultra、C1-Premium、C1-Pro、C1-Nano等產品。名稱上感覺更像手機的命名系列,并且微架構新全新升級到了Armv9.3-A。此外,今年的GPU的新架構叫做GPU Mali G1。

除了微架構的名稱變化,Arm還為每個目標市場都創建了完整的品牌名稱:
- Neoverse 用于服務器
- Zena 用于汽車
- Lumex 用于移動設備
- Niva 用于個人電腦
- Orbis 用于物聯網
值得一提是有一個新的PC品牌Niva,推測對Windows有更好的支持。除了Qualcomm's Snapdragon X 系列處理器,我們有望看到更多的Arm處理器運行Windows系統。

今年用于手機處理器的C1系列和G1系列則屬于Lumex套件,全稱叫做Arm Lumex CSS Platform。那么Lumex里面都包含什么?根據Arm的資料,Lunux包含CPU、GPU、System等IP設計,還包含了3nm等工藝節點的物理實現,以及一些生態的支持,例如Pre-silicon的平臺指導、安卓16支持、SME2的應用等等,可以幫助芯片廠商更快的完成芯片設計。

Arm期望通過CSS套件將這些IP以套裝打包起來售賣以提升產品競爭力,提升整體性價比,提升對客戶的吸引力,從而提升Arm的銷售額。打個比方,這就類似麥當勞更喜歡賣套餐,而不是單賣漢堡。
我們用一個表格,直觀的展示這5年來Arm微架構演進迭代的情況。


上面這張圖包含了今年新C1架構的核心參數指標參數的變化,后面我們會看具體的變化。

首先看一下C-Ultra相比上一代X925的性能提升。C1-Ultra的IPC性能,從Arm給出的數據看,比上一代的X925要提升12左右,前期有預測過C1-Ultra可能會采用12路decoder設計,現在看來應該沒有用12路這么激進,不然性能應該能有20以上的提升。圖中下面2024年的安卓旗艦競品,應該是指用了X4核心的處理器8Gen3處理器。

在前端設計上,C1-Ultra和上一代X925的核心參數decoder寬度,ALU數量,FPU數量等基本相同。C1-Ultra主要優化是提升分支預測性能,增加記錄預測歷史的空間,從而提升分支預測的準確性,對性能和功耗都有幫助。此外,一個明顯的變化是,L1指令緩存的帶寬提升了33,以實現更快的指令獲取速度。

在后端設計上,C1-Ultra的L1數據緩存容量從64KB提升到128KB,這個大小要超出高通Oryon的96KB,可惜L1指令緩存還是大小還是64KB,不如Oryon的192KB。這也是多年來Arm第一次在旗艦核心上增加L1緩存的容量。

性能和功耗指標上,C1-Ultra比X925,峰值性能提升了25,同性能下功耗則降低了28,在工藝沒有變化,都是3nm的情況下,性能的提升主要通過優化微架構和提升頻率。至于功耗,需要注意C1-Ultra的極限功耗是增加的,但是得益于微架構的優化和緩存的提升,原來X925極限性能的高能效區間在這一代同性能頻率可以跑的更低。在C1-Ultra的使用上,建議多使用這段高能效的區間,以達到最經濟的能效使用。
下面用一個表格總結了Arm旗艦核心在過去六年里的發展變化:

在這幾年中,變化最大的演進是2023年的Cortex-X4,其decoder寬度從6路提升到10路,ALU也從6個增加到8個,性能提升明顯,典型處理器代表是MTK的天璣9300和高通的驍龍8Gen3處理器。

再來看一下C1-Premium,面積比C1-Ultra減少35,主要是減少了矢量單元和L2緩存,并優化了物理實現。如果說是減少了FPU,推測其性能和X4的差不多。今年的天璣9500信息提到了一顆Travis和三顆Alto,應該是一顆超大C1-Ultra加三顆C-Premium來實現。

C1-Pro是高性能大核心,相比上一代游戲性能提升了16,正統A725的繼承者。A725的能效相當不錯,也期待C1-Pro在今年處理器的表現,天璣9500剩余的4顆Gales,應該是C1-Pro。
C1-Nano是功耗核心,A520的下一代,功耗降低26,性能稍弱,應該還是三路decoder的非亂序執行,在高端處理器中已經見不到身影,主要用于中低端處理器,可以做小芯片面積。

C1-Pro在前端設計上重點優化了分支預測的吞吐率和準確性,L1指令的TLB容量提升了50,并且降低了分支預期的功耗。

C1-Pro在后端上提升了數據L1緩存的帶寬,優化L2的TLB延遲,新增了間接預期器,提升預取的性能和減少L3到SLC和內存的數據擁塞。

性能功耗上,C1-Pro相比A725,峰值功耗差異不大的情況下,性能提升了11,相同性能下功耗則降低了26。A725已經是一顆能效優秀的大核心處理器,從這個數據看非常期待C1-Pro的市場表現。

下面我們來看一下C1-Nano核心,這也是一顆Armv9.3-A架構的處理器。Arm宣稱C1-Nano相比A520提升了26的效能,并有效減少L3到內存的擁塞。性能上,在不到2的核心面積增加下(小核心很在意核心面積),性能可以提升5.5。還通過解耦預測和取指流水線,提升了指令預取的性能。

DSU是連接多個處理器核心的關鍵模塊,這一代的新DSU命名為C1-DSU。這一代的C1-DSU,Arm宣稱功耗可以節省11,Quick Nap內存(L3支持的功能)功耗可以降低7。

新一代的C1-DSU相比DS120,調整了CPU連接的拓撲結構,提供優秀的AI能力支持,支持新的SME2擴展指令集,并且在不影響性能的情況下降低了功耗和面積。

C1-DSU還更新了L3的Quick Nap支持。Quick Nap是系統在進入低功耗狀態前,L3緩存會標記高頻率訪問的數據(如進程上下文),在喚醒時通過硬件級數據預取功能(如SME2),直接從L3恢復關鍵數據,降低系統延遲。C1-DSU通過把L3緩存進行切片,只需喚醒需要數據所在的區片,進一步降低了系統延遲和功耗。
下面是一個L3 Quick Nap和傳統深度休眠的數據對比:


和上一代一樣,C1-DSU最多可以支持14個處理器核心的組合,并且可以實現不同C1處理器的組合,除了最初級的2核心配置,其余都可以支持SME2。

2025年新Arm架構的一個特征就是采用了新的Armv9.3-A指令集,并且支持SME2擴展指令集,我們來看一下SME2的特點。
SME(Scalable Matrix Extension,可擴展矩陣擴展)是Armv9架構引入的指令集,雖然SME指令集在2021年就提出了,但是Arm的Cortex-X系列處理器從X925才開始支持第一代的SME指令集,蘋果公司的M4處理器和今年的A19處理器也支持第一代的SME指令集,最新的高通的8 Elite 2處理器也可以支持SME指令集。今年的Arm C1系列則全面升級到了SME2指令集。


SME2是第二代SME指令集,Arm宣稱其專為加速AI/ML工作負載設計,通過矩陣運算優化提升能效比。相比SME,SME2引入了多矢量指令和動態去量化等技術,可以顯著提升矩陣運算效率。SME2采用可變長度寄存器架構(128-2048位),支持流式SVE模式和高吞吐量矩陣數據處理。

在性能表現上,Arm宣稱SME2對性能上有顯著幫助,例如在AI任務中,SME2可使CPU集群的AI性能提升5倍,同時實現了3倍的能效提升。由于AI類計算需要調用非常多的矩陣計算,因此SME2在AI類應用中尤為有效。
在開發上,SME2對開發者也會非常友好,Arm宣稱,很多應用程序開發都集成了Arm的開發套件KleidAI來輔助執行AI處理,在這種情況下,用戶只要講KleidiAI更新到支持SME2的版本即可。另外。多數情況,用戶只需要修改少量代碼,即可實現兼容,同時也支持C語言用內聯函數intrinsics預言開發。
在應用場景上,SME2可以廣泛應用在端側AI,大模型推理,智能助手,計算機視覺等場景。
總結
如果不想看前面的文章,可以快速跳轉到這一部分。這次的總結部分用簡潔整理,讓大家可以快速了解今年Arm的處理器升級點。
2025年Arm處理器采用新的架構命名體系,CPU新架構叫做C1系列,GPU新架構叫做G1,手機處理器平臺套件叫做Lumex。
CPU家族包含C1-Ultra、C1-Premium、C1-Pro、C1-Nano四款產品。
C1-Ultra對標原來的Cortex-X系列,峰值性能提升25,IPC性能提升12,同性能下功耗降低28。
C1-Premium是新出的次旗艦核心,面積比C1-Ultra小35,性能參考Cortex-X4。
C1-Pro是A725的升級,峰值功耗差異不大的情況下,性能提升了11,相同性能下功耗則降低了26。
C1-Nano是A520的升級,相比A520提升了26的效能。
C1-DSU是DSU120的升級,功耗可以節省11,提供優秀的AI能力支持,支持新的SME2擴展指令集。
C1家族全新支持SME2擴展指令集,全面面向AI矩陣運算優化性能和功耗,在AI任務中,SME2可使CPU集群的AI性能提升5倍,同時實現了3倍的能效提升。
雖然2025年Arm的發布會姍姍來遲,但是一口氣發布的這么多款產品也是可圈可點的,整體也有比較明顯的提升,讓我們期待今年搭載最新Arm C1家族處理器的旗艦芯片的體驗!
本文轉自OPPO內核工匠公眾號
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
關于億道電子
上海億道電子技術有限公司是國內資深的研發工具軟件提供商,公司成立于2009年,面向中國廣大的制造業客戶提供研發、設計、管理過程中使用的各種軟件開發工具,致力于幫助客戶提高研發管理效率、縮短產品設計周期,提升產品可靠性。
十多年來,先后與ARM、Altium、Ansys、QT、Green Hills、Minitab、EPLAN、QA Systems、OpenText、Visu-IT、HighTec、PLS、Ashling、MSC Software、Autodesk、Source Insight、IncrediBuild、Lauterbach、Adobe、Testplant、TeamEDA等多家全球知名公司建立戰略合作伙伴關系,并作為他們在中國區的主要分銷合作伙伴服務了數千家中國本土客戶,為客戶提供從芯片級開發工具、EDA設計工具、軟件編譯以及測試工具、結構設計工具、仿真工具、電氣設計工具、以及嵌入式GUI工具等等。億道電子憑借多年的經驗積累,真正的幫助客戶實現了讓研發更簡單、更可靠、更高效的目標。

歡迎關注“億道電子”公眾號
了解更多研發工具軟件知識

首頁 > 新聞資訊
