Jump to...
redirecting...

Log for Ubuntu 台灣社群

Raspberry Pi 自建撥接 ISP (★ 101 分)

Jeff Geerling 以 1999 年的 Tangerine iBook G3 與 Apple 初代 AirPort 設備為起點,示範如何用 Raspberry Pi 自建一個本機撥接 ISP (網際網路服務供應商)。他先回顧當年背景:AirPort Base Station 同時具備 10Base-T 乙太網路埠與 56K 撥接 Modem (調變解調器),反映 1999 年無線上網剛起步、多數家庭仍靠電話線連網的現實。為了重現這種體驗,他選用 Raspberry Pi、StarTech 56K USB Modem 與 Viking DLE-200B 電話線模擬器,讓老電腦能像打給 ISP 一樣撥入;若再接上一支傳統電話,來電時還會真的先響鈴,兼具懷舊感與除錯用途。

軟體部分則仰賴 Linux 上的 mgetty (管理 Modem 來電與序列埠連線的工具) 與 PPP (Point-to-Point Protocol,點對點通訊協定)。mgetty 負責接聽電話與處理 Modem 交握,PPP 再完成帳號驗證與網路橋接,讓遠端電腦像直接掛在區域網路上。作者把整套設定整理成一份 Ansible (自動化設定工具) 腳本,可在 Debian 系統上快速部署。實測時,多半能穩定連到 33.6K,偶爾還要靠 AT 指令 (用來控制 Modem 的指令集) 微調速率上限;他也說明,POTS (Plain Old Telephone System,傳統類比電話系統) 的限制下,33.6K 幾乎就是天花板,若想碰到 56K,就必須讓整段路徑大部分維持數位化。

這個專案真正有趣的地方,在於它不只重現電話撥接,還把老電腦重新帶回現代網際網路。作者利用 Macproxy Classic 這類本機代理伺服器,把現代網站轉成舊瀏覽器能處理的簡化版本,移除 CSS (樣式表)、JavaScript (網頁腳本) 與較新的 HTML 結構,解決舊版 Internet Explorer 與 Netscape 因 TLS (傳輸層安全性) 憑證與加密能力落後而無法正常瀏覽網站的問題;再配合 WayBack Machine (網頁典藏服務) 擴充功能,甚至能用 1999 年的 iBook 去看當年版本的網站。作者之後還重整 iBook 電池、接上 AirPort Base Station,實現完整的 Wi‑Fi 撥接體驗,並藉此重新理解 Modem 交握、PPP 介面與 QAM (Quadrature Amplitude Modulation,正交振幅調變) 等原理,如何一路延伸到今天的 Wi‑Fi 與 VPN (虛擬私人網路)。

留言區普遍認為這是極具復古趣味的技術實驗,也補充了不少電信實務。有人指出,不一定非得買專用線路模擬器,也能用 9 V 電池與舊電話線、直接下 AT 指令,或用 VoIP ATA (Analog Telephone Adapter,類比電話轉接器) 讓兩台 Modem 互打;若想一次接更多線路,二手 Cisco VG-224 甚至能提供 24 路。不過也有人提醒,這種兩端都走類比的架構通常只會停在 V.34 (33.6 kbps 的類比撥接標準),若要逼近 V.90 或 V.92 (56K 撥接標準),必須把訊號盡量維持在數位路徑中。另一個共識則是,33.6K 放到 2026 年幾乎等同沒有網路:現代網站首頁常已膨脹到數十 MB,背景分頁流量與應用程式逾時都足以吃光頻寬,因此文字代理或極簡網站才是老機器真正可用的解方;也有人提到,若目的是光纖斷線備援,這類做法仍仰賴原本的寬頻骨幹,實用性有限,但作為理解早期網路工程與低頻寬設計思維的實驗,價值反而相當高。

👥 22 則討論、評論 💬
https://news.ycombinator.com/item?id=47627527
!!!可以用中文投稿!!!
COSCUP x UbuCon Asia 2026 熱烈徵稿中!
特別是 UbuCon Asia ,距離徵稿截止4月7日還剩不到四天!
歡迎大家踴躍投稿~

UbuCon Asia 投稿連結: https://2026.ubucon.asia/cfp
COSCUP 投稿連結: https://s.coscup.org/26cfp
果:簡單得驚人的自蒸餾 ( Self-Distillation ) 可提升程式碼產生表現 (★ 110 分)

Apple 提出的簡單自蒸餾 ( SSD, Simple Self-Distillation ),做法是先讓大型語言模型 ( LLM, Large Language Model ) 用特定解碼溫度與 top-k / top-p 截斷規則(分別保留前 k 個高機率詞元,或保留累積機率達 p 的候選)對同一批競賽程式題抽樣作答,再把這些完全未驗證、未執行測試的原始輸出拿回去做監督式微調 ( SFT, Supervised Fine-Tuning )。這套方法不需要人工標註答案、教師模型、驗證器、程式執行環境,也不需要強化學習 ( RL, Reinforcement Learning )。在程式碼基準 LiveCodeBench v6 上,Qwen3-30B-Instruct 的第一個答案即通過率 ( pass@1 ) 從 42.4% 提升到 55.3%,五次抽樣通過率 ( pass@5 ) 也明顯上升;而且進步不只出現在單一模型,Llama 與 Qwen 的 4B、8B 到 30B 模型都有提升,且增幅主要集中在中等與困難題。

論文把程式碼產生過程分成 fork(多條合理延伸分支的分岔點)與 lock(幾乎只剩少數正確續詞的鎖定點)。單一解碼溫度必須在兩者之間折衷:溫度低時,lock 會更精準,但 fork 缺乏探索空間;溫度高時,fork 較容易找到不同解法,卻也會讓低機率干擾尾部重新冒出。作者認為,SSD 的效果來自把這種取捨直接寫進模型內部,也就是訓練時先做候選集合壓縮 ( support compression ),再重塑保留下來的高機率區。玩具模擬、真實模型分析與理論推導都指向同一件事:SSD 會讓 lock 更穩、fork 仍保有可用多樣性,因此只靠調整推論階段的溫度與截斷設定,追不上微調後模型的表現。

論文還做了一個很反直覺的壓力測試:把訓練抽樣溫度拉到 2.0,且完全不做截斷,結果大約 62% 的輸出連可擷取的程式碼區塊都沒有,許多答案中途還會退化成多語混雜的亂文。即便如此,Qwen3-30B-Instruct 仍可提升到 48.1% 的 pass@1 與 64.0% 的 pass@5,顯示 SSD 的效益未必主要來自「抽到很多正確程式」,而更像是來自對詞元機率分布的重塑。額外測試也顯示,30B 模型在數學推理、一般程式碼產生與程式理解等基準上大致維持穩定,但較小模型的取捨較明顯,有些基準進步、有些退步。

討論串裡,多數人最關注的是這個方法簡單到近乎粗暴,卻能帶來不小增幅,認為這再次反映出機器學習常常先靠經驗找到有效做法,理論才慢慢補上;也有人直言,目前仍缺乏足夠好的工具去看清神經網路在高維空間裡到底發生了什麼。幾位留言者認為 fork / lock 的解釋最有說服力,等於把原本只能靠單一採樣參數處理的「情境感知解碼」內化到模型本身,甚至推測這種機制可能不只適用於程式碼,也可能延伸到敘事寫作、一般推理與創作任務。另一些人則從產業角度看待這件事,認為若這類技術和本地端模型進展持續疊加,未來程式輔助模型可能更便宜、更多人會自行架設;但也有人追問 Apple 是否公開蒸餾後權重,討論裡看不出已有釋出。留言中也夾雜一些輕鬆吐槽,例如有人笑稱 SSD 早就是固態硬碟的縮寫,也有人替標題中的 `embarrassingly` 辯護,指出它在電腦科學裡沿用自 `embarrassingly parallel`,不是單純的誇飾字眼。

👥 27 則討論、評論 💬
https://news.ycombinator.com/item?id=47637757