AI Creative Daily — 2026-04-09

動手做 — 混搭靈感

MegaTrain (HN 219) × Gemma 4 multimodal fine-tuner × google-ai-edge/LiteRT-LM 2930★ → 把 MegaTrain 的 CPU-streaming 訓練接到 Apple Silicon 的 Gemma 4 微調器，做『一台 Mac Studio 訓練 70B-class 客製模型』

MegaTrain 證明了把參數和 optimizer state 全留 CPU RAM、把 GPU 當『暫態 compute engine』可以在單卡上 full precision 訓練 100B+。但論文用的是 NVIDIA stack。同一天 Show HN 上的 Gemma 4 fine-tuner 證明了 Apple MLX 已經能跑得動多模態 fine-tune。把這兩個 idea 接起來：在 M3 Ultra 192GB 上拿 unified memory 做 host store、把 Metal GPU 當 transient compute，整套 pipeline 會比 NVIDIA H100 cluster 便宜兩個數量級。

📊 HN 219 分 MegaTrain 留言區頂貼是『RTX 3080 10GB 用戶想 fine-tune >40M 模型都會 OOM』，這個 pain point 是真的；Apple Silicon AI training 在 r/LocalLLaMA 月活躍從 2025 Q4 翻倍到 2026 Q1。

難度 — ★★★★☆ (4/5)
開發時間 — 1 個月+ POC，3 個月生產 ready
使用場景 — 你是法律科技 startup CTO，要用 5000 份合約 fine-tune 一個 70B-class 的 retrieval 模型，但 H100 月租 $30k 砍掉你 18 個月 runway 的一半。你買一台 $7k 的 M3 Ultra Mac Studio，週五啟動訓練，週一拿到 checkpoint。
技術組合 — MLX + MegaTrain 的 layer streaming pattern + LiteRT-LM 推理 + Gemma 4 27B base
硬體需求 — M3 Ultra Mac Studio 192GB（$6,999）；備援：M2 Ultra 64GB+ 也能跑較小模型
技術門檻 — 需熟悉 PyTorch / MLX 互轉、能讀懂 ZeRO-3 paper；不需要懂 CUDA
外部依賴 — MLX、MegaTrain reference implementation（尚未開源，是這個 idea 的最大瓶頸）
入門第一步 — git clone https://github.com/ml-explore/mlx-examples 跑通官方 70B inference，量測 host↔GPU bandwidth 是否真能 sustain 100GB/s

milla-jovovich/mempalace 26017★ × obra/superpowers 141270★ × JuliusBrussee/caveman 7287★ → 把 mempalace 的『LLM 記憶層』包成 Claude Code skill marketplace 的 backend——讓每個 skill 自帶可遷移 memory

今天 Trending #1 是 forrestchang/andrej-karpathy-skills（8805★），#7 是 obra/superpowers，兩個都是『skill』為核心的 framework。但所有 skill 都有同一個問題：context 是一次性的，session 結束就忘。mempalace 號稱是『最高分的 AI memory benchmark』（26k★ 4 天，forks 3217 比例 12.4% 表示不是 star farm）。把它當每個 skill 的 persistent memory layer，做一個『skill + memory』雙層市集——你下載一個『code-reviewer』skill 同時下載它累積過的 100k context token，新 session 直接帶記憶上線。

📊 Anthropic Partner Network $100M 注資（今日新聞）+ obra/superpowers 連 2 天 trending + SegmentFault 中文社群在問『superpowers 怎麼 upgrade』，下游需求已經形成。

難度 — ★★★☆☆ (3/5)
開發時間 — 2 週 MVP
使用場景 — 你開了一家 5 人 dev shop，每個工程師都用 Claude Code，但每次新 session 都要重新教它你們的 coding style、舊架構決策、過去 3 個月的踩雷。裝上『Memory-enabled superpowers』之後，新人入職第一天的 Claude 已經知道你們 RAG pipeline 的歷史和哪個 PR 被回滾過為什麼。
技術組合 — mempalace memory backend + superpowers skill loader + 自寫 skill registry（FastAPI + SQLite）
硬體需求 — 純 CPU 可跑；mempalace backend 跑在小 VPS 即可
技術門檻 — 需熟悉 Claude Code skill API + Python；不需要 ML background
外部依賴 — mempalace 的 license（README 寫 free，需確認商用條款）；Claude Code skill 規格仍在改
入門第一步 — git clone https://github.com/milla-jovovich/mempalace 跑通它的 benchmark，確認 26k★ 不是 vapor

newton-physics/newton 4030★ × Show HN: $300 camera-only robot vacuum (HN 94) × Audio Reactive LED (HN 154) → 用 Newton physics + Show HN $300 機器人吸塵器的失敗，做一個『Newton sim 訓練 → ESP32 部署』的 sim-to-real pipeline

今天 Show HN 94 分的相機機器人吸塵器作者誠實承認失敗：CNN 在 train set 過擬合無法泛化。HN 留言頂貼 isoprophlex 給出對的方向：『讓 robot 自己跑、用 VLM 監督產生資料』。但這需要 24/7 的真實環境試錯，太貴。Newton physics（trending #8，4030★）剛好填這個洞：建一個你家客廳的 sim 環境（量一下家具位置），在裡面用 Newton + RL 訓 CNN policy，再 export 到 ESP32-S3 的 TFLite 部署。整個 sim-to-real 閉環社群裡缺一個『便宜業餘版』，Newton 把那個門檻降下來了。

📊 Show HN $300 vacuum 94 分證明 hobbyist 對低成本機器人有興趣；Newton 4030★ 兩天內衝起來證明 sim 端工具長期被 NVIDIA Isaac 壟斷的不滿。

難度 — ★★★☆☆ (3/5)
開發時間 — 2 週 sim 訓練 POC，1 個月跑通完整 sim-to-real
使用場景 — 你是大學機械系大二，預算 $300，週末想做一個會繞開家貓的吸塵器 demo 投履歷。傳統做法要買 LIDAR + 真實 collect 100 小時資料；新做法是 Newton sim 訓 8 小時 + ESP32-S3 部署 + 用 vibe coding 搞定 firmware。
技術組合 — Newton physics + Stable-Baselines3 PPO + TFLite Micro + ESP32-S3 + OV2640 camera
硬體需求 — 訓練：消費級 GPU 8GB+ VRAM（RTX 3060 起跳）；部署：ESP32-S3 + 1 顆 OV2640 + 1 個底盤套件，總成本 <$300
技術門檻 — 需熟悉 Python + PyTorch 基礎 + 一點 C++（部署側）；不需要會控制理論
外部依賴 — Newton 還在 alpha（issues 192 個是 yellow flag），可能需要 patch；TFLite Micro 對 CNN op 支援有限
入門第一步 — git clone https://github.com/newton-physics/newton && cd examples/quadruped 跑通範例，量測單步 sim FPS

今日上線 — 新鮮出爐的專案

社群脈動 — 今日熱門討論

Anthropic acquires Vercept — computer use action 層被吃下 Anthropic News 如果你在做 RPA / browser-agent，30 天內要決定『靠 lab 還是繞 lab』 → 本週把 action layer 抽象掉，避免 hard-bind Anthropic native API
MegaTrain：100B+ 單卡 full precision 訓練 HN 219 分 consumer GPU fine-tune 大模型的硬體門檻被往下打了一檔，但需等 reference implementation → watch arxiv comments 跟 GitHub，預期 8 週內會有 PyTorch 復現
Microsoft 終止 VeraCrypt developer cert HN 977+313 分 OSS 風險面正式從『程式碼』擴張到『平台撤權』；安全敏感工具需要備援簽章路徑 → 把你依賴的 FOSS 工具列出來，標註誰的 release artifact 是 single point of failure
GLM-5.1: Towards Long-Horizon Tasks Simon Willison 中國 OSS 路線在 long-horizon agent 上開始出現可重複的 baseline，open thread 持續追蹤
mempalace 4 天衝 26k★（forks ratio 12.4% 健康） topic:llm · 26017★ · 3d AI memory layer 是今年第一個出現『benchmark-driven hype + 真實 fork 採用』雙訊號的 sub-category

趨勢訊號 — 觀察與預測

今日焦點

Anthropic 把『模型公司』四個字寫滿了今天的整條供應鏈

2026-04-09 是一個極端罕見的日子：單一公司在 24 小時內推送了 5 條獨立新聞，且每一條都打在不同的供應鏈節點上。Anthropic 同日宣布收購 Vercept（電腦操作層）、與 Google + Broadcom 簽下多 GW 級下一代算力合作、注資 $100M 到 Claude Partner Network、與澳洲政府簽 AI 安全 MOU、並把雪梨設為亞太第四個辦公室。再加上 04-08 的 Mythos Preview + Project Glasswing，我們追蹤的 arc-model-lab-vertical-integration 跟 arc-frontier-access-decoupling 兩條敘事在 48 小時內同時加速到 episode 2。

發生了什麼

把這 5 條新聞拆開來看每一條都不算大新聞——Anthropic 每月本來就會收 1-2 家小公司、每季都會有一筆 compute 合約。但今天的同步度是訊號：computer use 的 action 層（Vercept）、訓練側的硬體後端（Google TPU + Broadcom 自訂矽）、上層生態的合作伙伴金流、以及政府/地理覆蓋——全部在同一個 news cycle 裡推出。Lobsters 上 64 分的 Assessing Claude Mythos Preview's cybersecurity capabilities 同日上線，證實了 Glasswing 的『受限發佈、第三方先 review』模式真的開始跑了。Simon Willison 也把 Glasswing 標為『sounds necessary to me』——這意味業界 OG 正在背書 Anthropic 的脫鉤策略。

對比之下 OpenAI 這 48 小時相對安靜：04-08 收購 Astral 的故事還在 Changelog news #184 持續發酵，但今天 OpenAI 沒有新動作；Google 端今天的新聞集中在 Veo 3.1 Lite、Gemini 3.1 Flash Live、Lyria 3 等產品分發，沒有併購或結構性合作。從這個對比看，Anthropic 是三家裡唯一在『分發層+算力層+操作層』同步出手的。

為什麼重要

過去 12 個月模型廠的競爭主軸是 benchmark 分數。從這 48 小時開始，主軸正在切換成『誰能控制從 GPU 到滑鼠游標的整條垂直』。Vercept 不是一家普通的 startup——它是 computer use evals 上少數能跟 OpenAI Operator 競爭的隊伍。把它買進來等於在 OSWorld / WebArena-Hard 這類 benchmark 上跳過半年的 catch-up 期。但代價是 Anthropic 的『中立基礎設施』敘事再次被削弱：你今天決定用 Claude API 做 computer use 應用，明天你的競爭對手是 Anthropic 自家整合的 Vercept stack。

對技術決策者：如果你在 2025 H2 押注 『用一家 lab 做所有事』 的策略，今天驗證了押對；如果你押注 『lab 不會碰我這層』（特別是 RPA/automation/agent harness 賽道），你需要在 30 天內重畫競爭圖。

社群怎麼看

HN 上 Claude Managed Agents（87 分）的熱門 reply 一針見血：『MANAGED AGENTS sounds like progress, but also like we're standardizing around the current limitations instead of solving them.』 這抓到了 vertical integration 的隱憂——當 lab 自己定義 agent 介面，社群創新會被 forced into 一個 lab 友善的形狀。另一條 51 分『I've been waiting over a month for Anthropic support to respond』則暴露了 Anthropic 在 scale 上的軟肋：往垂直整合衝的同時，最基礎的客戶支援卻在崩潰。Gary Marcus 今天那篇『What should we take from Anthropic's (possibly) terrifying new report on Mythos?』則站在另一端——認為 Mythos 的 cybersecurity 能力數字本身就值得社會層級的討論，不只是技術討論。三種聲音拼起來就是今天 Anthropic 故事的全貌：策略上贏、執行上裂、社會層級緊張。

行動建議

第一，如果你正在用 Claude API 做 computer use，本週就把你的 action layer 抽象掉——不要硬綁 Anthropic native API，留下能切到 OSS Operator 替代品（例如 open-multi-agent、TUI-use）的逃生通道。第二，如果你在 RAG / agent 工具鏈賽道，把『與 lab 合作』寫進你的 30 天 roadmap——Partner Network 的 $100M 是真錢，且通常先給先簽；觀察 Astral 被 OpenAI 收後 uv 的待遇可以反推 Anthropic 對 Partner 的態度。第三，如果你做安全研究，申請 Glasswing 的 Mythos Preview 存取——這是你能在 GA 之前接觸 frontier capability 的唯一管道。

AI Creative Daily.

動手做 — 混搭靈感

MegaTrain (HN 219) × Gemma 4 multimodal fine-tuner × google-ai-edge/LiteRT-LM 2930★ → 把 MegaTrain 的 CPU-streaming 訓練接到 Apple Silicon 的 Gemma 4 微調器，做『一台 Mac Studio 訓練 70B-class 客製模型』

milla-jovovich/mempalace 26017★ × obra/superpowers 141270★ × JuliusBrussee/caveman 7287★ → 把 mempalace 的『LLM 記憶層』包成 Claude Code skill marketplace 的 backend——讓每個 skill 自帶可遷移 memory

newton-physics/newton 4030★ × Show HN: $300 camera-only robot vacuum (HN 94) × Audio Reactive LED (HN 154) → 用 Newton physics + Show HN $300 機器人吸塵器的失敗，做一個『Newton sim 訓練 → ESP32 部署』的 sim-to-real pipeline

今日上線 — 新鮮出爐的專案

熱門專案與精選

開發者動態 — 知名開發者的新專案

🇹🇼 台灣

🌐 全球

社群脈動 — 今日熱門討論

Hacker News

Lobsters

Dev.to Top

SegmentFault

OSChina

Changelog

Anthropic News

HuggingFace Daily Papers

Simon Willison

Gary Marcus

Karpathy

Google AI Blog

Phoronix

LWN

趨勢訊號 — 觀察與預測

今日焦點

Anthropic 把『模型公司』四個字寫滿了今天的整條供應鏈

發生了什麼

為什麼重要

社群怎麼看

行動建議

訊號 1：arc-model-lab-vertical-integration 升級為今日唯一主敘事強訊號第 2 天

訊號 2：單卡 full precision 訓練 100B+：訊號層級從『實驗室技巧』升級為『可發 arxiv 的方法』強訊號第 2 天

訊號 3：OSS 供應鏈風險面從『程式碼』擴張到『平台撤權』，今日新增第 3 個獨立案例強訊號第 2 天

潛力股

預測（可驗偽）

動手做 — 混搭靈感

MegaTrain (HN 219) × Gemma 4 multimodal fine-tuner × google-ai-edge/LiteRT-LM 2930★ → 把 MegaTrain 的 CPU-streaming 訓練接到 Apple Silicon 的 Gemma 4 微調器，做『一台 Mac Studio 訓練 70B-class 客製模型』

milla-jovovich/mempalace 26017★ × obra/superpowers 141270★ × JuliusBrussee/caveman 7287★ → 把 mempalace 的『LLM 記憶層』包成 Claude Code skill marketplace 的 backend——讓每個 skill 自帶可遷移 memory

newton-physics/newton 4030★ × Show HN: $300 camera-only robot vacuum (HN 94) × Audio Reactive LED (HN 154) → 用 Newton physics + Show HN $300 機器人吸塵器的失敗，做一個『Newton sim 訓練 → ESP32 部署』的 sim-to-real pipeline

今日上線 — 新鮮出爐的專案

熱門專案與精選

開發者動態 — 知名開發者的新專案

🇹🇼 台灣

🌐 全球

社群脈動 — 今日熱門討論

Hacker News

Lobsters

Dev.to Top

SegmentFault

OSChina

Changelog

Anthropic News

HuggingFace Daily Papers

Simon Willison

Gary Marcus

Karpathy

Google AI Blog

Phoronix

LWN

趨勢訊號 — 觀察與預測

今日焦點

Anthropic 把『模型公司』四個字寫滿了今天的整條供應鏈

發生了什麼

為什麼重要

社群怎麼看

行動建議

訊號 1：arc-model-lab-vertical-integration 升級為今日唯一主敘事 強訊號 第 2 天

訊號 2：單卡 full precision 訓練 100B+：訊號層級從『實驗室技巧』升級為『可發 arxiv 的方法』 強訊號 第 2 天

訊號 3：OSS 供應鏈風險面從『程式碼』擴張到『平台撤權』，今日新增第 3 個獨立案例 強訊號 第 2 天

潛力股

預測（可驗偽）

訊號 1：arc-model-lab-vertical-integration 升級為今日唯一主敘事強訊號第 2 天

訊號 2：單卡 full precision 訓練 100B+：訊號層級從『實驗室技巧』升級為『可發 arxiv 的方法』強訊號第 2 天

訊號 3：OSS 供應鏈風險面從『程式碼』擴張到『平台撤權』，今日新增第 3 個獨立案例強訊號第 2 天