Jump to...
redirecting...

Log for Ubuntu 台灣社群

@Haraguroicha 據說政府的音訊站存在漏洞,可以取得網路權限。
[sticker](media:AAMCBQADHQI9GfldAAECTmtp3GDN_vgkN74KsFf2SgESeZfliQACtgoAArwK2gzlYJExFSEe6AEAB20AAzsE@telegram)
新的詐騙?????
[sticker](media:AAMCBQADHQI9GfldAAECTm9p3GGRkWg0AUOgAl9KcLjDr75NRgACPxUAAs6eUFev-zJdu5dACwEAB20AAzsE@telegram)
AMD 以 ROCm 迎戰 CUDA:「一步一步來」 (★ 100 分)

AMD 將 ROCm (AMD 的開源 GPU 運算軟體堆疊) 視為搶攻資料中心人工智慧 (AI) 市占的關鍵,因為它必須正面挑戰 CUDA (Nvidia 的 GPU 平行運算軟體平台) 長年累積的既有裝機基礎。負責 AI 軟體的副總裁 Anush Elangovan 形容,這像是爬山,只能一步一步來。自從 AMD 兩年半前收購新創 Nod.ai 後,這支原本約 30 人、長期投入 AI 編譯器的團隊被納入核心戰力,ROCm 也獲得持續投資。Elangovan 說,早期的 ROCm 更像一堆圍繞特定應用積體電路 (ASIC, Application-Specific Integrated Circuit) 韌體拼湊而成的零件,如今 AMD 想把它做成像 Chrome 一樣「不用特別感受到存在」的平台,並把釋出節奏推向每 6 週一次,讓軟體團隊真正以軟體公司的速度前進。他也說,AMD 不只在補齊先前的落後缺口,也在為下一波 AI 輔助工程做準備。

在技術路線上,AMD 已把原先分散在中央處理器 (CPU)、圖形處理器 (GPU) 與現場可程式化邏輯閘陣列 (FPGA, Field-Programmable Gate Array) 的 AI 軟體整合為內部稱作 OneROCm 的方向,重點是把加速能力都收斂到 ROCm,提升不同 AMD 硬體之間的可攜性。Elangovan 指出,業界這兩年已逐漸往更高層的開發抽象移動,焦點不再只是把 CUDA kernel 轉成 HIP,而是改用 Triton (OpenAI 推出的開源 GPU 程式框架) 這類較中立的工具;AMD 也重押 MLIR (Multi-Level Intermediate Representation,多層中介表示編譯基礎設施) 與 Torch-MLIR,讓程式更容易重定向到不同硬體。對多數大型語言模型 (LLM, Large Language Model) 推論客戶來說,關鍵已變成每秒詞元數與部署難度,而不是手動改寫底層程式碼。

AMD 同時把「開發者能否輕鬆上手」列為主戰場。Elangovan 表示,ROCm 除了韌體以外已全面開源,這雖然會讓 AMD 更直接面對外界檢驗,但也能讓外部創新不必受限於 AMD 自身節奏。公司近來特別強調筆電端,讓搭載 Strix Halo (AMD 的高階整合處理器平台) 的機種可開箱即用地使用 ROCm,且 Windows 筆電版本通常會與 Instinct 資料中心 GPU 同日釋出。他本人也持續在 X 上追蹤 ROCm、ROCm sucks 與 AMD software not working 等關鍵字,直接回覆使用者問題;AMD 去年在 GitHub 蒐集到超過 1,000 筆抱怨,多數與舊硬體支援有關,官方稱一年內已陸續處理完畢。AMD 希望藉此把 ROCm 從「驅動程式常惹人火大」的印象,轉成未來 10 年都能安心採用的平台,並為 2026 年下半將出貨的 MI450 鋪路。

Hacker News 的討論對此抱持審慎樂觀。有些人認為 AMD 確實比前幾代進步不少,尤其在 RDNA 4 (AMD 新一代消費級 GPU 架構) 顯示卡上,若用途以本地 LLM 推論為主,價格效益明顯優於 Nvidia,同樣預算甚至能買到多張卡,湊出更大的顯示記憶體 (VRAM, Video RAM)。也有人分享實際經驗,指出雙卡機在 llama.cpp 或 Ollama 上可得到不錯的每秒詞元數,足以因應個人實驗機房 (homelab) 與工作站需求。另一些留言則看重 AMD 的開源路線,認為相較於 Nvidia 長年採用封閉堆疊,ROCm 在 Linux 上的驅動程式與編譯流程更有機會被長期維護,對重視隱私、可驗證性與高安全需求的人更具吸引力。

不過,批評聲音仍然很強。許多開發者直指 AMD 早在 5 年前就錯失加碼 ROCm 的時機,現在不是沒有改善,而是落後太久;消費級 GPU 的支援週期過短、最新硬體有時得等上一段時間才進到正式支援清單、Linux 套件更新偶爾又會讓環境失效,這些都削弱信任。另有不少人提到,在本地推論場景中,Vulkan (跨平台圖形與運算介面) 後端常常比 ROCm 更省事,某些工具甚至更快,於是反問 ROCm 的必要性到底在哪裡;也有人認為,真正左右勝負的可能不再是 ROCm 本身,而是 Triton、PyTorch (常用深度學習框架) 這些更高層工具能否逐步淡化 CUDA 的專屬優勢。還有留言把問題指向 AMD 的管理與流程,認為 Elangovan 帶來的新創式作風雖然有效,但若組織文化沒有同步轉向,ROCm 要追上 CUDA 仍會是一場漫長戰役。

👥 78 則討論、評論 💬
https://news.ycombinator.com/item?id=47745284
2026 年我的家用實驗室 (Homelab) 現況 (★ 58 分)

作者把自己的家用實驗室 (homelab) 從早期的 Orange Pi 5,升級到較穩定的 GMKTec 迷你電腦,搭配 32 GB 記憶體與 1 TB NVMe 固態硬碟,另租一台 Hetzner 虛擬機承接需要全天候上線的服務。整體方向很務實:以基礎設施即程式碼 (IaC, Infrastructure as Code)、可重現性與易用性為原則,作業系統選擇熟悉且穩定的 Debian 裸機安裝,不刻意導入 NixOS、Proxmox 虛擬化平台或 Kubernetes 容器協調平台。對外連線則採用 Cloudflare Tunnel 這種由主機主動連出的通道服務,不必開放入站埠,再用 Traefik 作為反向代理、Authentik 擔任 IdP (身分提供者) 與 SSO (單一登入) 中心,把各項自架服務接到同一套入口與驗證機制。

維運上,作者用 Ansible 把每個服務寫成獨立角色,從 Docker 網路、資料庫、環境變數、容器啟動到 Cloudflare Tunnel 規則,都盡量交給腳本與 Git 管理;機密資料則用 SOPS (Secrets OPerationS) 搭配 age 加密工具處理,只加密 YAML (常見的純文字設定格式) 內的值,讓版本比對仍然清楚,也能在 Ansible 執行時自動解密。實際跑的服務相當完整,包含以 Prowlarr、Radarr、Lidarr、Bazarr、Tidarr 與 Transmission 組成的媒體整理鏈,Jellyfin 與 Navidrome 負責影音播放,Calibre Web 管電子書,LibreChat 串接大型語言模型 (LLM, Large Language Model),Immich 管照片備份與人臉辨識,Syncthing 進行 P2P (點對點) 同步,另有 MinIO、Miniflux、PostgreSQL、Redis 與數個自寫工具。監控部分則刻意避開過重的 Grafana 全套堆疊,改用 Beszel 看主機狀態、Statping 追服務可用性,追求的是低維護成本而不是極致細節。

作者也坦白指出,這套家用實驗室還有幾個明顯短板:正式備份幾乎還沒做好,媒體與系統目前都壓在單一硬碟上,沒有磁碟陣列 (RAID),高度依靠 Cloudflare 也意味著一旦上游故障,外部存取就會中斷;此外,他也沒有導入 GitOps (以 Git 為中心的維運流程) 或持續整合 (CI, Continuous Integration) 流程,而是手動執行 Ansible。即便如此,這套環境的成本仍相對低廉,Hetzner 主機每月約 7 歐元,新增一個服務或修一個設定通常只要 20 到 30 分鐘,幾年累積下來大約投入 100 到 150 小時。作者的結論不是追求完美,而是以合理代價換取資料主控權、較少的廠商綁定,以及對自己基礎設施的理解與樂趣。

討論區延伸出的焦點,多半集中在自架的取捨。有人調侃,這種「獨立」更像是想當系統管理員的浪漫想像;也有人分享自己用 Plex、Overseerr、Telegram 機器人或 systemd / Podman 容器工具做出更精簡的版本,認為現在工具成熟後,自架門檻已比過去低得多。最受關注的還是 Cloudflare Tunnel:不少人稱讚它讓家中主機對外公開變得非常簡單,但也有人提醒,流量畢竟仍經過 Cloudflare,隱私與「真正獨立」都要打折,而且拿它來做媒體串流可能踩到服務條款;若重視私密性或要避開公開入口,較常見的替代方案是 WireGuard 或 Tailscale 這類虛擬私人網路 (VPN, Virtual Private Network) 工具。另一條討論主軸則是照片與媒體該不該自架:贊成者認為 Immich 這類工具已經夠順手,長期看也比 Google 或 Apple 的訂閱更能掌握資料;反方則提醒,真正困難的是硬體穩定度、電費與 3-2-1 備份策略 (保留 3 份資料、使用 2 種媒介、其中 1 份放在異地),而不是把服務架起來本身。也有人補充,網路流傳的某些 Google 帳號被永久停權案例,後來被質疑為虛構,提醒大家在談雲端風險時,仍要區分真實事故與都市傳說。

👥 41 則討論、評論 💬
https://news.ycombinator.com/item?id=47746577
我覺得原因主要就是因為gnome很肥
但是現在幾乎已經變成兩條路線
使用更多的記憶體來讓運算速度變高
或者是降低記憶體的使用量
趙長鵬自費出版了自己的自傳

幣安創辦人趙長鵬自費出版了自己的中英文自傳《Freedom of Money: A Memoir of Protecting Users, Resilience, and the Founding of Binance》。趙長鵬在書中講述了幣安與美國監管機關的長期對抗,幣安因助長洗錢活動而支付創紀錄的 43 億美元和解金,他在加州服刑四個月期間開始撰寫本書,以及去年底獲得川普總統的特赦——他此前被永久禁止涉足加密貨幣銀行業務,特赦意味著他可以繼續從事這項業務。他創辦的幣安是全球最大的加密貨幣交易所,與川普家族的加密貨幣業務 World Liberty Financial 有深度合作。本書最有意思的部分,可能是他的監獄生活。趙長鵬寫道,他一度擔心在獄中會被人勒索,因為媒體報導他是美國監獄裡關押過最有錢的人,結果根本沒人認識他,因為監獄裡的人沒有人會去看《華爾街日報》或彭博社(Bloomberg)。他曾與一名因殺害兩人而被判 30 年徒刑的男性同住一間牢房,他發現這位獄友最致命的不是他曾經殺過人,而是他雷鳴般的鼾聲。他也在書中提到 FTX 創辦人 Sam Bankman-Fried,幣安曾持有 FTX 五分之一的股權,以及價值 5.8 億美元的 FTT 代幣。2022 年 FTX 瀕臨破產之際,Bankman-Fried 曾打電話給他,開口索討數十億美元,他的語氣漫不經心,彷彿只是在要一份三明治。
https://news.slashdot.org/story/26/04/11/2331242/crypto-billionaire-pardoned-in-prison-by-trump-just-wrote-a-memoir

https://news.slashdot.org/story/26/04/11/2331242/crypto-billionaire-pardoned-in-prison-by-trump-just-wrote-a-memoir
Linux 7.0 釋出

Linus Torvalds 在核心郵件清單上宣布釋出 Linux 7.0,這將會是支援 i486 CPU 的最後一個版本。Linux 7.0 的主要新功能包括:Rust 程式碼不再屬於實驗性功能;iouring 操作的新過濾機制,CPU 排程器預設啟用延遲搶占,支援時間片擴充,nullfs 檔案系統,XFS 檔案系統支援自我修復,新的檔案 I/O 錯誤回報 API,支援 Clang 靜態分析,預設啟用 AccECN 支援以更妥善處理 TCP 壅塞,Btrfs 實驗性支援重新映射樹 (remap tree),新驅動程式,等等。更多內容可參閱 KernelNewbies 7.0。
https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=028ef9c96e96197026887c0f092424679298aae8
https://kernelnewbies.org/Linux7.0

https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=028ef9c96e96197026887c0f092424679298aae8
ubuntu 26.04 會搭 kernel 7.0
😂 Linux\_7.0的底線和前面io\_uring的底線被當成斜體語法了。
Bot 傳送複雜內容還是用 HTML 比較好,不然 Markdown 一堆 escaping 要處理
Valve 工程師改善 Linux 遊戲的顯示記憶體占用

隨著遊戲的圖像需求日益提升,顯示記憶體占用愈來愈成為一大問題。想提升視覺擬真度,就需要把越來越多的遊戲素材儲存在顯示卡的顯示記憶體中。然而,顯示記憶體容量有限,不是每個人的桌機上都有配備 128 GB 大容量顯示記憶體的資料中心等級 GPU。Valve 工程師 Natalie Vock 開發了新的核心修補程式與兩套專用工具,用來解決 8 GB 以下顯示卡的顯示記憶體占用問題。她的修補程式主要針對 AMD GPU,Intel 的 Xe 顯示卡也支援,但採用 NVIDIA 專有驅動程式的顯示卡則不支援——原因是 NVIDIA 的專有核心模組不支援 dmem cgroups。她的方法重點在於確保前景執行的遊戲能優先使用顯示記憶體;如果顯示記憶體開始被占滿,背景工作所占用的顯示記憶體會優先轉移到系統記憶體中。在配備 8 GB 顯示記憶體的顯示卡上執行《電馭叛客 2077》時,有 1.37 GB 的顯示記憶體溢出到 GTT (Graphics Translation Table),遊戲實際上只用了 6 GB 顯示記憶體;套用修補程式之後,遊戲占用的顯示記憶體提升到 7.4 GB,GTT 則降到 650 MB。
https://pixelcluster.github.io/VRAM-Mgmt-fixed/

https://pixelcluster.github.io/VRAM-Mgmt-fixed/
我有遇到類似狀況
即使關掉遊戲和 Steam 後,仍有殘留的記憶體空間未釋放
找 AI 調查後找到其中一種洩漏源:
類似 /dev/shm/u1000-Shm_891c8c79 這類檔名的共享記憶體檔案
即使不再使用卻不一定會被刪掉

不知道來源到底是 Steam, Proton 還是 gamescope
[photo](media:AgACAgUAAx0CPRn5XQABAk6Ead0AAfpRgbpdJq0V0UViSa0Zdi78AAJxDWsbwZTpVrTMAXlmfi7LAQADAgADcwADOwQ@telegram)