Jump to...
redirecting...

Log for OKTW Network

[photo](media:AgACAgEAAx0CPmz7HwABBO0pacqkvbL0XpINwUU-pALTcrpXE0kAAsILaxuT61lG50MhRwAB4_eKAQADAgADcwADOgQ@telegram)
原圖
我看你傳的變jpg了
的readme
你自己用bot生一個不就有了
他有圖示
太慘了
還是其實那是 emoji 🤔
不知道阿,我感覺png也白邊
這就是個firefox截圖
你還是自己拉svg想辦法比較實際
Done,等他刷新
[sticker](media:AAMCBQADHQI-bPsfAAEE7Tlpyqizdk-YoGVy1s1at12HyDI2jAACaSIAAjhrUFbItLY3-j9m3AEAB20AAzoE@telegram)
高度好像太高了?
[sticker](media:AAMCBQADHQI-bPsfAAEE7TtpyqjG9gABPJQILoT6ASNpvCpG5Z8AAlQAAyZPZAXMK621KvwhSQEAB20AAzoE@telegram)
這個就很矮
感覺遇到了啥bug,這個是直接上傳svg原圖的
搞不好就是因為svg
直接512x512了
[sticker](media:AAMCBQADHQI-bPsfAAEE7TtpyqjG9gABPJQILoT6ASNpvCpG5Z8AAlQAAyZPZAXMK621KvwhSQEAB20AAzoE@telegram)
[sticker](media:AAMCBQADHQI-bPsfAAEE7Tlpyqizdk-YoGVy1s1at12HyDI2jAACaSIAAjhrUFbItLY3-j9m3AEAB20AAzoE@telegram)
[sticker](media:AAMCBAADHQI-bPsfAAEE7UJpyqkYK-PYOa6zYVdQQDLYRY7wbQACDRUAAroxaVNVmfQCvjVmfAEAB20AAzoE@telegram)
說起來因為沒設定封面,works fine for me直接變成封面了
bot該加icon功能了
vibe上個robot icon
那個位置其實是logo不是icon
畢竟他被你放在第一張圖
我覺得挺符合這包主旨啊(x
[sticker](media:AAMCBQADHQI-bPsfAAEE7UlpyqmnGbaC2W9gdTu4A26J2YNl-AACZgADQfm4DIprSRhnm5syAQAHbQADOgQ@telegram)
來了個案外案,node-canvas 的 svg 支援有 bug
[sticker](media:AAMCBQADHQI-bPsfAAEE7Utpyq27TYJV2J6g4minM0t6cQip_wACASYAAh1EUVa8LtciOycRBgEAB20AAzoE@telegram)
logo呢
svg 裡用 image 塞另一張 svg 會壞掉
直接神隱
要直接原地開個chromium了嗎
這年頭瀏覽器真好用
記憶體爆炸
[sticker](media:AAMCBQADHQI-bPsfAAEE7VNpyq4b-v6GEWrNq0pdct4q1rM5xQAC7AYAAshzuAcNyrP5Q9RrbgEAB20AAzoE@telegram)
雖然我沒用過
@Cute_Panda 你的仿生應該還能用ㄅ
又zig又AI的東西一定很厲害
啥 這跟我啥關係
都是胖打
反正我是信 playwright
那個是膠水
它理論上也能黏這個
[photo](media:AgACAgUAAx0CPmz7HwABBO1dacqvPey3FFu0hcV_AlstJ-eIKRAAAlsPaxvHnVFWZvaDwK6fdpcBAAMCAANzAAM6BA@telegram)
你有3.3G swap,放心開
豪,他變 playwright 了
[sticker](media:AAMCBQADHQI-bPsfAAEE7WBpyrnxQy_byd-VKUwqB2OdIzVBhgACEyYAAh1EUVarQ9q-VRMakgEAB20AAzoE@telegram)
[sticker](media:AAMCBQADHQI-bPsfAAEE7WFpyrtMv8jNcgKuPbIW4IIn_bFh_QACHCYAAh1EUVYKu_r-vppCxwEAB20AAzoE@telegram)
順便支援塞 emoji
話説現在有 vibe coding
是不是可以拿來改寫一下萬年沒動過的 bot 了(
那東西感覺 claude pro 可以一發燒完...
那個架構問題我自己都沒啥好想法
畢竟是從 irc 硬搬過來的
我發現 webp 下載再上船也會變 512x512...
[sticker](media:AAMCBQADHQI-bPsfAAEE7Wlpyr20R8kWOJfi-avsPYnqYkiN6wACoQsAArwK2gxUZRF8nlSnjQEAB20AAzoE@telegram)
那要怎樣
png
png特權喔
真庫
等下...連 png 都會
那個新的上船面板是不是有毒
@bill96012 有請大師
開示一下貼圖怎麼傳
對了,看起來用原本的指令船才不會被強行padding 成512x512
現在就等 server 刷新成沒 padding 的版本了
[sticker](media:AAMCBQADHQI-bPsfAAEE7XRpyr_VhhC49jiXdAmiwXSXDAtrqQAC_x0AAliJUFZYL-YLBWbQQAEAB20AAzoE@telegram)
[sticker](media:AAMCBQADHQI-bPsfAAEE7XVpyr_by4bIHsTIxnEiJ86FjxUpawACThwAAvLxWFbItyWzRylHVQEAB20AAzoE@telegram)
[sticker](media:AAMCBQADHQI-bPsfAAEE7XVpyr_by4bIHsTIxnEiJ86FjxUpawACThwAAvLxWFbItyWzRylHVQEAB20AAzoE@telegram)
[sticker](media:AAMCBQADHQI-bPsfAAEE7Tlpyqizdk-YoGVy1s1at12HyDI2jAACaSIAAjhrUFbItLY3-j9m3AEAB20AAzoE@telegram)
怎麼還變小了
Padding
看了一眼跟之前的一樣高所以大概沒vibe壞吧
拉滿512比較好看吧
因為上下必須有,所以當初就乾脆弄成上下左右 padding 一樣了
為啥要有padding
[sticker](media:AAMCBQADHQI-bPsfAAEE7X9pytD6tbA3W80hrbE0zBCx2S4ZeAACyhQAAvG3KVQFRama8vR8AwEAB20AAzoE@telegram)
感覺沒有也沒事阿
你這個箭頭自帶吧
[sticker](media:AAMCBQADHQI-bPsfAAEE7YJpytEhtp9SknzA2X8pCfkbKid-eQACaRoAAquk8VfZPepVx0GYcgEAB20AAzoE@telegram)
印象中好像是啥client版面會爆破吧
我感覺是半點不需要padding
讓它爆(O
比聊天框矮畫面會雷掉
至於是啥以及修好了沒,這點死無對症
那也別卡左右阿
讓貼圖變小以外還有啥用
為了讓字一樣大
不需要阿
有一邊必須是512
TG是寬度必須512
高度隨便
你啥時看過不一樣大的badge
但這是貼圖
而且滿地都是吧
但他內容是badge就該按照badge的規則
???
那我只好 @bill96012
不然連續貼就很醜
設計終究不能給工程師搞
[sticker](media:AAMCBQADHQI-bPsfAAEE7TtpyqjG9gABPJQILoT6ASNpvCpG5Z8AAlQAAyZPZAXMK621KvwhSQEAB20AAzoE@telegram)
[sticker](media:AAMCBQADHQI-bPsfAAEE7ZhpytIfwIK4TmFzKw8K1FIn00KJTwACVQADJk9kBQABImxNgRxi4AEAB20AAzoE@telegram)
[sticker](media:AAMCBQADHQI-bPsfAAEE7ZlpytIgqFVVFK3ss0ae6fObedBT4gACVgADJk9kBW9BxKG9ZYyxAQAHbQADOgQ@telegram)
你這看起來有比較好看嗎
誰他媽連續貼還沒個字都不一樣大的
完全沒有
相信你的github badge也長這樣
那個是橫著擺,所以高度要一樣
TG貼圖是直著擺
寬度要一樣
很合理吧
[sticker](media:AAMCBQADHQI-bPsfAAEE7aNpytLEiQuEApBOO-UJ1U0LDA9mkQAC3BUAApXGKFSrdewD-jzNYQEAB20AAzoE@telegram)
[sticker](media:AAMCBQADHQI-bPsfAAEE7aRpytLEmU4ziss9f97rmNrXp-CezgACCxEAAr-kMVR2L9Fwe4AjTwEAB20AAzoE@telegram)
[sticker](media:AAMCBQADHQI-bPsfAAEE7aNpytLEiQuEApBOO-UJ1U0LDA9mkQAC3BUAApXGKFSrdewD-jzNYQEAB20AAzoE@telegram)
舒服阿
你這內容一樣多啊
字的大小不一樣,高度也不一樣,但寬度相同
得證貼圖寬度相同比較好看
他是badge,我不能接受大小不一樣
所以我只能 @bill96012 做貼圖了
[sticker](media:AAMCBQADHQI-bPsfAAEE7UlpyqmnGbaC2W9gdTu4A26J2YNl-AACZgADQfm4DIprSRhnm5syAQAHbQADOgQ@telegram)
你們那麼熱鬧噢
要不你也一起熱鬧
只是卷斯又在發病
我狀況外,我持續吃瓜看戲
[sticker](media:AAMCBQADHQI-bPsfAAEE7VNpyq4b-v6GEWrNq0pdct4q1rM5xQAC7AYAAshzuAcNyrP5Q9RrbgEAB20AAzoE@telegram)
我感覺得出來
畢竟他的龜毛成度並不在我之下
你需要提升一下個人審美標準
實在太慘了
我覺得你的審美有毛病
字會隨機變大變小的badge根本不像badge 啊
[photo](media:AgACAgUAAx0CPmz7HwABBO24acrT7NktXRrX0VBdsTrbMxEXI6QAAkUOaxvHnVlWSE_zv8XWIOABAAMCAANzAAM6BA@telegram)
因為這是貼圖
第一個看起來合理,第二個是被當漢堡包壓扁了嗎?第三個根本糊的
badge只是內容,在那之前這是個貼圖
第二個不幸超出512了
那就維持比例一下
就很簡單,寬度填滿512就好了
他是說第二個光內容就超過了
高度直接照比例縮放
這樣字也只好變小不會變形阿
但會糊
這就是我強烈拒絕的東西
我不會動它高度
然後你日了他的寬度
[sticker](media:AAMCBQADHQI-bPsfAAEE7cZpytSjAddEz25QX4tAMuzKgs2aqQACfwADdjHSCcTrRcpEC1JTAQAHbQADOgQ@telegram)
總不能切掉
其實應該還好,512px並不是非常小
但你接受了變形
[sticker](media:AAMCBAADHQI-bPsfAAEE7cppytS_EVJZbvMWh-TqHZoHizulBwAC0xUAAthVCFNYoFLMHI-PBgEAB20AAzoE@telegram)
理想上左右我也不想留 padding,然而這是貼圖限制
不知道在堅持啥,一個垂直排列的東西就應該寬度相同
那就填滿 512px 寬啊
高度才應該是可變的,邏輯和橫向排列的badge相反
Badge不是設計來垂直排列的的東西也不該遵守這個規則
別跳針了,這是貼圖
but 你現在是 sticker 並不是 badge
你是在做 badge 造型的 sticker
但我想讓他呈現上看起來就是badge
那就維持比例一致,大小不一致不重要,那是 sticker 先天的缺陷
你高度變高不會改變內容是badge的事實
或者你全部都靠左對齊,然後不足 512px 就右邊填充空白,除非超過 512px
這樣既能維持你每個 badge sticker 的比例和大小又能滿足需求
不然這啥狗幹對齊方式,誰家 badge 這樣排列的
Repo加個text-align center就有了
這啥噁心變態的用法
我記得我還真的看過,長得很噁心倒是真的
北部濕透了,90%濕度,只要腳伸進被子就開始流汗
[sticker](media:AAMCBAADHQI-bPsfAAEE7d1pyteoSeG3s4kxCLO2xXsFOXUGCAACyRgAAnMXEFPU0R9LHsgZOgEAB20AAzoE@telegram)
那就起來做事
除濕機
現在買明天到
剛打開
應該要24h開
洨米溫度計自動開
窩感覺這頻道 @mmis1000 應該要多看
不然更多panda班表樣的東西長出來真的很可怕
那東西我甚至都沒寫過一行樣式
你要給gemini跟claude讀才有用
prompt你下的
別人vibe出來的東西就沒那麼醜
@Haraguroicha 不能只有我被辣眼睛
啊我有叫他想,他結論就這樣
全世界都應該被辣一下
正常看到第一眼就會叫它改了
只有你會讓它直接上線
真的這頻道的影片多看點
提升一下審美
另外我也沒覺得你做的東西有多好看,你自己也需要
不會辣眼睛
我本來就不是專業搞設計的
doubt
這三洨
而且我做的UI根本就沒幾個阿
看panda有沒有在上班的網站?
所以資料哪來的
他自己餵膩
Open data ™️
有一個公開的github
讚吧
[sticker](media:AAMCBQADHQI-bPsfAAEE7UlpyqmnGbaC2W9gdTu4A26J2YNl-AACZgADQfm4DIprSRhnm5syAQAHbQADOgQ@telegram)
他排版的直接把班表扔上github
然後你往下展開幾下就知道為啥panda那麼想離職
我現在才知道
不當人類系列
看起來很吃 excel
真要說我設計的東西也就只有 moe.r20.tw 而已吧
也就把版面排好顏色套好而已
反正肯定是不會辣眼睛
我去魔法了一下 🤔 希望會好
不然我履歷其實也開好了
[sticker](media:AAMCBQADHQI-bPsfAAEE7gtpyxsR2cMa31DsDE5VnbF3qdG49AACXQADJk9kBSoSLlCOWdaMAQAHbQADOgQ@telegram)
改ㄌ好像人類一點了
要幫ㄘㄈ修好貼圖了ㄇ
說過了, 沒 壞 ,字一樣高是by design,你的設計爛得要死,有意見自己開一包
沒說不開阿
空白對齊都可能動,東高度沒門
啥時有要逼你幹啥的錯覺了
早就放棄你了好嗎
[sticker](media:AAMCBQADHQI-bPsfAAEE7hNpyzDJz83YzYcMWYXsMPkkHN3suwACWhUAAiOvKFQOt5EWsW2k-AEAB20AAzoE@telegram)
窩在這個時候就已經放棄叫你做事了 https://t.me/oktwNetwork/322964
只能讓 AI 唱了
加個padding選項跟對齊選項是挺快的
他需要的其實是龍蝦(x
但加是一回事,有沒有要取代原本的是一回事
但你叫的那個在這邊是有生之年吭聲系列
不過當初到底是啥版面會爆開所以加垂直 padding 的,ios還web嗎
他其實會看
看得你發函殘
你可以重生一下 他更新ㄌ
看起來還好
你只是錯過了
本來是四天三個時區
施展過魔法才對人類友善 QQ
原本裡面甚至有
早早晚大夜大夜大夜
的組合
一個禮拜經過所有時區
聽起來我比他還慘
[sticker](media:AAMCAQADHQI-bPsfAAEE7iVpyz8KaIZdn0dldG8yUaZ5tS_lNQACcwIAAvBHSERa70UZzlD60gEAB20AAzoE@telegram)
你們怎麼還活著
那還好啊,那不是很正常嗎,我一天就過完全部時區了餒
他「至少還有」休息時間
不知道但我整天都在胃痛
聽起來是要暴斃了
你只差三餐止痛藥了
你們太噁心ㄌ
但反正我現在有休息時間 還是以周算固定的
換休息時間還可以空兩天調作息
養身起來了
推薦哥們試試
[photo](media:AgACAgUAAx0CPmz7HwABBO4xactFJ_HewxcCr6cAARR-mKXZRHyuAAIDD2sbx51ZVhHWQKk63kEwAQADAgADcwADOgQ@telegram)
傳 webp 不會直接當貼圖了嗎 🤔
[sticker](media:AAMCBQADHQI-bPsfAAEE7jNpy0VOBlAF3L0xONwuryagKvy5dQACoB4AAsedWVZJu54cs_YgGwEAB20AAzoE@telegram)
啊,要當檔案傳
[sticker](media:AAMCBQADHQI-bPsfAAEE7jVpy0XSZ0WPJgjwm_D2-k2lbMTvDwACxxsAAulm6VemN8xsN4Gc5wEAB20AAzoE@telegram)
要不要年度健檢排個胃鏡,我猜會有胃潰瘍
應該直接排心電圖
感覺隨時暴斃
這倒還好
心電圖是標準吧
24h的
掛著走
/badge@mmis1000_bot --vpadding=0 --hpadding=0 --align=stretch coverage | 100% | brightgreen
[sticker](media:AAMCBQADHQI-bPsfAAEE7j5py1X3zGkwlG9JqVMurBnqTVTnwQACEBwAAh1EWVY2-VJa-U4l8AEAB20AAzoE@telegram)
恩?這裡有這隻?那為啥自動完成不出來
我又遇上了啥 tg bug 嗎
我有無限 token(
用本地模型慢慢跑
笨蛋模型
還好啦
最近嘗試 vibe code 都是先用 chatgpt / gemini 打底
然後用 GLM-5 / Qwen3.5-397B-A17B 來步進
暫時用著感覺還好
你說笨蛋可能 Codex 笨蛋點
Claude 我是從來沒用過就是
吃胃藥囉
可能胃酸倒流
主要還是本地模型的 context window 比較小,需要把工作拆散和經常 compact
我還沒試老黃那個大 context 的 Nemotron 3 Super
codex 只是廢話多還行了,gemini 會突發性失憶啊
他還會突然隨機把 system prompt 當成接下來的指令,有點失智
我用法都是把東西拆開做小 session 啦
然後重要的會重複提
然後大部分時間還是請本地模型
不過也有可能是我還玩得不夠深入
最近一個月才開始弄
像是我的 prompt 寫了

如果說輸出給我複製,請 format 成 markdown block

然後他只要對話一長就會突然把 請 format 成 markdown block 當成我剛剛講過的指令
然後就對話到一半冒出個 markdown block
我直接???
[photo](media:AgACAgUAAx0CPmz7HwABBO5ZactkycXLZ9lAv0N22n246EQ4gzwAAksOaxsr_eFVv-ToAAEV8j5mAQADAgADcwADOgQ@telegram)
hmm
我覺得那應該是模型問題,至今遇過的模型無論大小,我只看過 gemini 會突然這樣失智
最多也就是對話一長忘了 system prompt,突然把 system prompt 當成對話指令簡直莫名其妙
買了兩個 GB10
還有兩台在送過來
我主要還是做非 coding 工作所以本地模型沒問題
會過熱算力又沒多少的東西為啥要買那麼多個
他差不多是現在最便宜的 vram
ai395 價格好像也差不多,但 amd 生態系還是差一點
沒有唉,最便宜的選項滿地都是
甚至A770都能跳出來踩gb10一腳
a770啥時有128g了
你可以一打
a770超便宜
算力還很多
pcie瓶頸超大
除了 moe 全都得甲賽
說得好像 A770 的環境有人配得起來一樣(逃
不如 V100 16G 洋垃圾
你還記得gb10不是GDDR而是LPDDR嗎
gb10自己也非常瓶頸
再慢也比過 pcie 快啊
而且 pcie 延遲超級高
還真沒有,你不是所有資料都必須交換阿
VRAM就在那邊怎麼不用一下
不是,你跑 Tensor Parallel 肯定需要資料交換的,不然你加卡沒有效能提升
那不要tenspr parallel
Pipeline Parallel 沒搞好優化會生出一堆 pipeline bubble,結果實際用起來效能比 tensor parallel 還差
a770最大的問題就不是硬體,而是不是nvidia
反正我不信gb10能快多少,這東西算力少的要命記憶體頻寬也小
你們是不是都沒看過窩表格
而且還有AMD R9700呢
賬面算力當然有,但實際能不能發揮出來又是另外一碼事了
另外 GB10 其實沒閹割,BF16 真有 200+ TFLOPS
問題是這種東西沒有魔法,你硬體沒有的再怎樣就沒有
就沒人給 A770 寫 Marlin Kernel 之類的東西啊……
表上就是沒閹割的數字了
那個已經是最樂觀的數字了
不是,你沒實際跑過 mmapeak
官方規格fp4 1000 tops阿
有沒有可能,算力到底要不要砍 1/2 其實是 NVIDIA 可以決定的
你知道專業卡上面 FP16 的 matmul 用 FP16/FP32 累加是一樣的算力嗎
表上數字就是沒砍1/2的了
你沒發現比例和RTX PRO 6000一樣嗎
那個算力比例又不是只能長那樣
反正有人測過了
你可以自己跑看看:
https://github.com/ReinForce-II/mmapeak
過熱我有辦法
我最後會放他在機房吹 15 度的冷氣
你叫一個整機功耗不到300W的東西算力和300W的一樣高
還會加裝風扇
反正我肯定不信,這顯然突破物理了
15度+風扇
[sticker](media:AAMCBQADHQI-bPsfAAEE7hNpyzDJz83YzYcMWYXsMPkkHN3suwACWhUAAiOvKFQOt5EWsW2k-AEAB20AAzoE@telegram)
人家 Tensor Core 數量比例和普通卡不一樣啊……
怎麼
算力這東西不是堆就能突破物理唉,算力高=功耗高
算力只有在有東西算時才算數誒
你功耗沒高,那不就只是boost帥兩秒而已
有沒有可能,頻率/功耗和算力之間的關係也不是線性的
然後就功耗牆溫度牆
我的 4080S 跑到 2.7GHz 用 320W,但 2.4GHz 只要 200W
太難了
mxfp4 和 nvfp4 可以 450TFLOPs 喔
這還是包含 GDDR6X 的功耗
但是他是用擴展 mma 指令
肯定要可以阿,這不就官方規格
它用 LPDDR5X 那功耗肯定是比較低
不是 sm100 的 tcgen05
正常跑 matmul 肯定都是 mma 指令吧
tcgen05 現在沒什麼東西在用
說真的好幾台gb10不如一張RTX PRO 6000
反正你128G扣系統實際可用也差不多96G
雖然算力上是這樣,但一張 RTX Pro 6000 也只有 96GiB
算力和頻寬都高超多
你買好幾臺 GB10 就是好幾倍的 VRAM
要幹啥用
跑大的 MoE 模型啊
8 臺湊起來都能跑 Kimi K2.5 了吧
MoE其實直接RAM offload速度都不會差太多
RTX Pro 6000 跑不了跨機
重要的是context本體一定要在VRAM
不完全,因為跑 tensor parallel 的時候每個 node 不用存取那麼多 weight
沒有 GPUDirect RDMA 最後會吃到 CPU
那正常,老黃刀法不會讓你那麼爽
甚至可以搞 EP parallel
但是 GB10 可以哦
有 Server 版的可以開 GPUDirect 吧
不肯定誒
好像是 Max-Q?
要查一下
但它沒算力也沒頻寬
我記得 RTX Pro 6000 有 Server 版的可以這樣搞
還好啦 我 INT4 autoround 可以跑到 114t/s 才過熱
兩台 GB10
聽起來符合規格
正常 concurrency 每個 session 可以 25t/s
夠快的
我還是覺得直接RTX PRO 6000會更快
Context 越大,越需要夠多的互聯頻寬
RTX Pro 6000 普通版甚至沒有辦法 PCI-E P2P 吧
全部都得繞去 CPU 再去另外一張卡
老黃就很愛閹
人家都算計好了
所以 GB10 是接近無閹割的了
不然誰買貴死人的金磚機櫃
其實還是有:GB10 沒 ECC
Inference 沒 ECC 還行
跑 HPC 比較在意
LPDDR5X 的 On-Die ECC 感覺跟沒有差不多
gb10比較像是個POC環境,讓你驗證東西能在機房跑起來
我有 DGX H100(租出去了)
金磚機櫃
只摸了一下下就交給客戶了
我比較希望 GB10 能跑正常主線 Linux Kernel 然後跑自己喜歡的發行版
我超討厭 Ubuntu 那些預裝垃圾的
看它CPU肯定是不可能
ARM 走 SBSA 也不是不行吧
問題是 GPU Driver 那邊不知道有沒有動什麼手腳,能不能進主線
那東西到處都特規
老實說他是 Ubuntu Pro 所以維護方面有老黃和 Canonical 照顧我是不太擔心
主要是他 UMA 架構
只是 kernel 無法 mainline 而已
而且老黃是送你 Ubuntu Pro subscription 的
那好像也沒什麼用(
每台都會自動註冊
NV特別愛放生,想當年那堆奇怪的Quadro系列
大概過幾年東西就不更新了,你只能固定在這版本
DGX OS 是黃金機櫃也在用的
還好吧
舉個例子看看?
ubuntu全世界都要生鏽了
到處改rust
DGX OS 好處是已經有驅動和 CUDA Toolkit
我只知道 sudo-rs
還有其他 gnu 命令改 rust 的嗎
coreutils整個
ls那些的都換了
du df都是
我們discord有個AI thread
那邊更多AI人(
笑死
我也只是最近在開發 AI 的優點
你有兩個gb10
AI金磚*2
我討厭 snap 之類的玩意,很 unorthodox
我有兩台 R730,每台 6x P4
另外加兩台 Spark(還有兩台在送過來)
如果卸載掉 snap 的話也沒 Ubuntu Pro 能用,那我不如直接去用 Debian
P4 目前只能跑 Llama.cpp 😢
Debian 不會給你隨便加料
幸好 tg t/s 還行
是 prefill 慢
哇靠,你要總共搞四臺噢
prefill純吃算力
decode才是吃VRAM頻寬
是哦
Tesla P4 連 Tensor Core 都沒,那當然慢
Tesla P4 = 70W 的 GTX1080
六張加起來 prefill 才 415t/s
[sticker](media:AAMCBQADHQI-bPsfAAEE7v5py5NSoOBUmzLwuaDZenHVqCpplwACZQAD9044FTBM00-SrS6RAQAHbQADOgQ@telegram)
這很正常
還是你要搞八臺跑 Kimi K2.5?(逃
少了matrix加速都會慢很多
我有想過
但是先試試看 4 台過了 VXLAN EVPN 的效能會怎樣
跨櫃
交換機能處理 VXLAN 中的 ECN?
可以
你們真的應該進discord
我 Cisco 誒
太高級了
Discord 難用,不想搞
垃圾 Electron
Cisco 可以把 DSCP 從封裝內複製到封裝外(預設行為)
[sticker](media:AAMCBQADHQI-bPsfAAEE7w9py5QVOhEcTbT5LsU6bIS4OkLtWAACFQADCNOhPnM6EnRUI1g6AQAHbQADOgQ@telegram)
那大概就沒問題了
確保對 GB10 端口的 PFC/ECN 打開,然後對 Spine 口的 ECN 打開
我覺得discord難用不是electron造成的
就應該可以了
我這邊近期在忙:
1. 搞 UPS(從閒魚買二手的 ITA2 3kVA 型號,然後在臺灣買電池)
2. 搞磁帶機(朋友送我 LTO-5 的,但我自己應該還要買 LTO-6 的機器)
確實,它不管在什麼瀏覽器上面都頓頓的
我有一櫃辦公室網路櫃,3kVA 只能撐 45 分鐘...
之前停電整修就捱不過去了(
我家的設備總閒置功耗 500W,配 6x 12V 20Ah 蓄電池大概可以撐一小時
ITA2 還自帶網路孔,可以直接跑 SNMP,不用買選件
inference 其實還好 反正大家都會卡 decode
新那個 Intel Battlematrix 好像也不錯
但是不知道 SGLang 跑起來怎樣