Jump to...
redirecting...

Log for YSITD

[photo](media:AgACAgUAAx0CPZbPgAABGh5TY-p5XDtz9f0xJg1AbE2vf5agLhgAAhy1MRtH5VFXuQ5KKUk4qlIBAAMCAANzAAMuBA@telegram)
為什麼三號的算力比二號低ㄚ
因為台灣沒電了(O
又或是他們沒經費組到這麼高效能阿
反正 HPC 通常機器不是 HPE Cray 就是 Atos
其他都要自己研究架構
話說 HPC 為什麼這麼難做ㄚ
他不會是我把兩台電腦拼在一起
我就有兩台的算力
這樣嗎
HPC 要用高速網路拼阿
還要有些東西不是 compute bound 是 memory bound 的話,互聯架構和高速記憶體就更加是重點了
做好了以後還有程式能用到所有核心
所以程式也要 port 去超級電腦的架構,還有改進運行效率
還有好像 Frontier 那樣拼太多節點(當然還有 AMD 問題)跑不久就沒了 coherency
主要是不只要把系統拼起來,還要他們可以協同運作才是真的能用
我最近發現兩片晶片拼在一起的功耗<底下貼一片矽拿來拼的功耗<電路板拼起來的功耗<接其他奇怪的硬體然後拼起來的功耗
越往後可能還有上萬瓦的電老虎
算力甚至不是簡單加法
[photo](media:AgACAgQAAx0CPZbPgAABGh5nY-p8d8XF7exONjFnl-wPHDi79acAAgGwMRsgfVRTIQhYkkjJHjEBAAMCAANzAAMuBA@telegram)
這是怎樣ㄚ
15000W
Cerebras WSE-2 AI 加速處理器
一塊晶圓只能做一顆 WSE-2
超級電阻,上面估計都可以煮水出去推渦輪機
聽起來就是要爛好幾塊才會好一塊
人家是最快的處理器,一塊等於一千張老黃 A100
沒有,專利技術自我修復
能夠容忍生產瑕疵
所以是 100% 良率
[sticker](media:AAMCBQADHQI9ls-AAAEaHnJj6n0pMh7zbc1hBL8U8CPLIH3r5AACMgADT5qXEpo9cV_kowaTAQAHbQADLgQ@telegram)
他規格是 85 萬個 核心
但是製造的時候做了超過 85 萬個核心上去
那現在有超級電腦用它來做ㄇ
所以就算有生產瑕疵,他直接停用有問題的地方就好
[sticker](media:AAMCBQADHQI9ls-AAAEaHnhj6n1xI6ccjEA24YMf0SpZ5Q1aEgACMgADT5qXEpo9cV_kowaTAQAHbQADLgQ@telegram)
然後這裡的 coherency 是什麼意思ㄚ
例如是 Andromeda 超級電腦
Licson 怎麼什麼都知道
用了 16 塊 WSE-2
喔原來是他們自己家ㄉ
那那台有實際使用嗎
不只阿,美國國家實驗室也有
庫ㄟ原來
你可以跟 Cerebras 租 timeslot 用
還有 GSK AZ 都有買
他們說幾個星期的東西現在兩天就開
藥廠嗎
庫ㄟ
他除了 AI 還能做有限的 HPC
他這個晶片有自己的 ASM-like code
叫 Cerebras Programming Language
可以不只做 AI
GPT-3 塞進去 Cerebras 這台東西跑根本雞毛旋皮
2D平面是指什麼啊
他的 85 萬個核心 在晶片上是個 2D 方格阿
喔喔
然後每個方格都有一定數量的 SRAM
所以我還要思考我要把資料丟給離我比較近的哪個核心嗎
還是
這顆晶片只有一層 SRAM,互相共享的
不用
你可以直接把核心當成 array
例如 array map 這樣,在這塊晶片就是一個核心等於一個 array item 執行一次 map 函數
所以你的 map,一個 cycle 就跑完了
是整個晶片只有 40GB 嗎還是
但是他是 SRAM
而且不像正常 CPU 有層級
實際上差在哪ㄚ
Cerebras 這個是沒分層的,同等存取
SRAM 快很多阿
喔喔原來
比 DRAM 高一個量級
CPU 快取用的那個 SRAM
這樣做的好處是什麼ㄚ
分層你就變慢阿
那為什麼一般 CPU 要分
[photo](media:AgACAgUAAx0CPZbPgAABGh6lY-qA7ZceVbd-5EiG1NJxXYh5lJYAAh61MRtH5VFXduKBGhOjDJUBAAMCAANzAAMuBA@telegram)
他是這樣運作的
execution plan 那邊你會發現他會把 NN 裡面 不同的 layer 投影在核心平面上面
每一群核心就是負責 NN 某一層
太酷了吧
所以 coherency 是什麼XDD
那如果良率慘到剩不到85萬呢,像是什麼三星(X
學校電腦教室(多功能教師)
要我們不要使用白色螢幕的電腦
(理由是那是Linux伺服器)
但是電腦是沒有開機的狀態
應該也可以使用吧
(因為我們之前都使用過這間教室,大家都知道白色螢幕的主機配置明顯的高階很多)
還有桌上型電表,桌上型信號產生器,DC Power Supply跟示波器
為啥不給用w
不是
2號是GPU Node
你去查查NUMA
[sticker](media:AAMCBQADHQI9ls-AAAEaHrZj6vLuq44t7q-71JQQahgugaHhjAACtwMAApGwiAf4pMEZ0MSiJAEAB20AAy4E@telegram)
喔喔好我去查
聽說現在4090是每TFLOPS最便宜的東西
$0.02/GFLOPS
那是A100
[photo](media:AgACAgUAAx0CPZbPgAABGh67Y-sjDb8cO3Z7Q8-tdjzw6_0CHZoAAuSyMRtH5VlXpho4wnI1EI0BAAMCAANzAAMuBA@telegram)
他是 TSMC N7
第一代是 TSMC 16nm
第二代就 7 了
第一代多很多預留核心容忍瑕疵的
第二代發現 TSMC 良率不錯就把很多本來預留的核心拿出來用了
反正三星就是漏電
茲茲
[photo](media:AgACAgUAAx0CPZbPgAABGh7DY-t5x7yXfV5W1q6D7Zd0Cr_TkLUAAnqzMRuu3VlXlsgaKIplZfkBAAMCAANzAAMuBA@telegram)
話説 台灣有童子軍嘛(
你要幹嘛
沒有 我最近被人推進去童子軍圈了(
推了我去當委員……
主要問題是我都不知道童子軍是做什麼的(
https://youtu.be/H7MqtC94HTw
覺得第四款是在抄 TG 嗎
[photo](media:AgACAgUAAx0CPZbPgAABGh7MY-ujEzIBMLje23iQ_AMLHkMF22cAAhS0MRuu3VlXJthI7Dh97A0BAAMCAANzAAMuBA@telegram)