CES 2026:揭開 AMD Venice 與 MI400 SoC 的神秘面紗 (★ 114 分)
AMD 在 CES 2026 首度展示了 EPYC「Venice」伺服器 CPU 與 MI400 資料中心加速器的實體晶片與封裝,讓外界得以從裸晶與封裝配置推估其設計重點。Venice 最顯著的變化是封裝走線方式看起來更進階,類似 AMD 先前在 Strix Halo 或 MI250X 上採用的作法;同時也從過往 EPYC 慣例的單一 I/O Die(IOD,輸入輸出晶粒)改成雙 IOD,暗示記憶體、PCIe 等外部連接與內部互連的規劃可能大幅調整。
就運算晶粒而言,Venice 由 8 個 CCD(Core Complex Die,含 CPU 核心與快取的晶粒小塊)組成,每個 CCD 32 核心,單顆封裝最高可達 256 核心。作者以現場照片量測推估,每個 CCD 約 165 mm²、採用 TSMC N2(2nm)製程;若延續每核心 4MB L3 快取的配置,則單個 CCD 可能是 32 個 Zen 6 核心加上 128MB L3。另一方面,每個 IOD 約 353 mm²,兩顆合計超過 700 mm²,明顯高於前代 EPYC 約 400 mm² 的 I/O 面積;封裝周邊還有 8 顆小晶粒,可能是結構用矽片或深溝電容(deep trench capacitor)晶粒,用來改善供電品質。
MI400 加速器則是一個更巨大的封裝:配置 12 顆 HBM4(High Bandwidth Memory 4,高頻寬記憶體)堆疊,並包含「12 個 2nm 與 3nm 的運算與 I/O 晶粒」。從外觀推測其結構類似 MI350 的雙 base die(基底晶粒),但上下另多了兩顆額外晶粒,可能負責封裝外 I/O(例如 PCIe、UALink 等互連)。作者估算每個 base die 約 747 mm²、額外 I/O 晶粒約 220 mm²;運算 chiplet(晶粒小塊)可能是 8 顆、每顆大小上限約 180 mm²,較可能落在 140–160 mm² 但仍待日後確認。AMD 也宣布 MI400 家族新增 MI440X,鎖定 8 路 UBB(Universal Base Board,通用底板)機箱,作為 MI300/MI350 的直接替換;同時提出 Venice-X,推測為採用 3D V-Cache(堆疊式額外 L3 快取)的版本,若 32 核心 CCD 也能疊 V-Cache,單 CCD L3 最高可能推到 384MB、整顆處理器合計可達 3GB L3。
Hacker News 討論熱點集中在「高核心數到底怎麼用」與「這類晶片真正瓶頸在哪」。不少人把 256 核心/512 執行緒(threads)拿來玩梗,想像用 CPU 軟體光柵化(D3D WARP,Direct3D 的軟體渲染器)來跑 Crysis 或 DOOM;但也有人提醒,多數桌面與遊戲負載難以有效擴展到數百核心,真正的關鍵往往是記憶體頻寬與 I/O,而不是把執行緒數硬撐大。相對地,也有留言指出對網頁與資料庫等伺服器工作,透過在單機塞進大量容器或 VM(Virtual Machine,虛擬機)其實很吃高核心數;HPC(High Performance Computing,高效能運算)則常以 MPI(Message Passing Interface,訊息傳遞介面)搭配 OpenMP 等方式做階層式平行化,並討論 NUMA(Non-Uniform Memory Access,非一致性記憶體存取)拓樸在多 CCD/多 IOD 下會更複雜,跨晶粒溝通與原子操作(atomic)成本可能成為程式模型的新壓力。
另一條爭論是把 AMD 的高密度核心(常被推測為 Zen 6c)拿去類比 Intel 的 E-core(Efficiency core,高效率核心)是否恰當。有高分留言強調兩者差異:Intel P-core/E-core 往往是不同微架構、IPC(Instructions Per Cycle,每時脈指令數)與指令集支援也可能不一致,導致排程與相容性更棘手;而 AMD 的「c」版本多被認為是同微架構、主要以較少快取與較低時脈換取更高密度,因此比較不會出現同一顆 CPU 內「兩種核心像兩種不同機器」的困擾。也有人替 Intel E-core 平反,認為它在面積與功耗限制下堆疊算力很有價值,名聲不好更多來自使用情境與系統整合問題。
最後,討論也延伸到工程現實:如此巨大的封裝要怎麼散熱、1U 能塞幾顆、下一代機櫃每 U 的 kW 密度會變多高。有人推估由於封裝面積很大,熱通量(單位面積熱量)未必比桌面旗艦更糟,未必「一定要」水冷,但整機櫃的總功耗與風量仍會逼近資料中心極限;也有讀者補充 AMD 軟體生態 ROCm(Radeon Open Compute,AMD 的 GPU 運算平台)近年穩定度已改善,但「CUDA(Nvidia 的 GPU 運算平台)優勢」仍是採購與導入時繞不開的現實門檻。
👥 63 則討論、評論 💬
https://news.ycombinator.com/item?id=46519326