動手做 — 混搭靈感
MegaTrain (HN 219) × Gemma 4 multimodal fine-tuner × google-ai-edge/LiteRT-LM 2930★ → 把 MegaTrain 的 CPU-streaming 訓練接到 Apple Silicon 的 Gemma 4 微調器,做『一台 Mac Studio 訓練 70B-class 客製模型』
MegaTrain 證明了把參數和 optimizer state 全留 CPU RAM、把 GPU 當『暫態 compute engine』可以在單卡上 full precision 訓練 100B+。但論文用的是 NVIDIA stack。同一天 Show HN 上的 Gemma 4 fine-tuner 證明了 Apple MLX 已經能跑得動多模態 fine-tune。把這兩個 idea 接起來:在 M3 Ultra 192GB 上拿 unified memory 做 host store、把 Metal GPU 當 transient compute,整套 pipeline 會比 NVIDIA H100 cluster 便宜兩個數量級。
📊 HN 219 分 MegaTrain 留言區頂貼是『RTX 3080 10GB 用戶想 fine-tune >40M 模型都會 OOM』,這個 pain point 是真的;Apple Silicon AI training 在 r/LocalLLaMA 月活躍從 2025 Q4 翻倍到 2026 Q1。
- 難度 — ★★★★☆ (4/5)
- 開發時間 — 1 個月+ POC,3 個月生產 ready
- 使用場景 — 你是法律科技 startup CTO,要用 5000 份合約 fine-tune 一個 70B-class 的 retrieval 模型,但 H100 月租 $30k 砍掉你 18 個月 runway 的一半。你買一台 $7k 的 M3 Ultra Mac Studio,週五啟動訓練,週一拿到 checkpoint。
- 技術組合 — MLX + MegaTrain 的 layer streaming pattern + LiteRT-LM 推理 + Gemma 4 27B base
- 硬體需求 — M3 Ultra Mac Studio 192GB($6,999);備援:M2 Ultra 64GB+ 也能跑較小模型
- 技術門檻 — 需熟悉 PyTorch / MLX 互轉、能讀懂 ZeRO-3 paper;不需要懂 CUDA
- 外部依賴 — MLX、MegaTrain reference implementation(尚未開源,是這個 idea 的最大瓶頸)
- 入門第一步 —
git clone https://github.com/ml-explore/mlx-examples 跑通官方 70B inference,量測 host↔GPU bandwidth 是否真能 sustain 100GB/s
milla-jovovich/mempalace 26017★ × obra/superpowers 141270★ × JuliusBrussee/caveman 7287★ → 把 mempalace 的『LLM 記憶層』包成 Claude Code skill marketplace 的 backend——讓每個 skill 自帶可遷移 memory
今天 Trending #1 是 forrestchang/andrej-karpathy-skills(8805★),#7 是 obra/superpowers,兩個都是『skill』為核心的 framework。但所有 skill 都有同一個問題:context 是一次性的,session 結束就忘。mempalace 號稱是『最高分的 AI memory benchmark』(26k★ 4 天,forks 3217 比例 12.4% 表示不是 star farm)。把它當每個 skill 的 persistent memory layer,做一個『skill + memory』雙層市集——你下載一個『code-reviewer』skill 同時下載它累積過的 100k context token,新 session 直接帶記憶上線。
📊 Anthropic Partner Network $100M 注資(今日新聞)+ obra/superpowers 連 2 天 trending + SegmentFault 中文社群在問『superpowers 怎麼 upgrade』,下游需求已經形成。
- 難度 — ★★★☆☆ (3/5)
- 開發時間 — 2 週 MVP
- 使用場景 — 你開了一家 5 人 dev shop,每個工程師都用 Claude Code,但每次新 session 都要重新教它你們的 coding style、舊架構決策、過去 3 個月的踩雷。裝上『Memory-enabled superpowers』之後,新人入職第一天的 Claude 已經知道你們 RAG pipeline 的歷史和哪個 PR 被回滾過為什麼。
- 技術組合 — mempalace memory backend + superpowers skill loader + 自寫 skill registry(FastAPI + SQLite)
- 硬體需求 — 純 CPU 可跑;mempalace backend 跑在小 VPS 即可
- 技術門檻 — 需熟悉 Claude Code skill API + Python;不需要 ML background
- 外部依賴 — mempalace 的 license(README 寫 free,需確認商用條款);Claude Code skill 規格仍在改
- 入門第一步 —
git clone https://github.com/milla-jovovich/mempalace 跑通它的 benchmark,確認 26k★ 不是 vapor
newton-physics/newton 4030★ × Show HN: $300 camera-only robot vacuum (HN 94) × Audio Reactive LED (HN 154) → 用 Newton physics + Show HN $300 機器人吸塵器的失敗,做一個『Newton sim 訓練 → ESP32 部署』的 sim-to-real pipeline
今天 Show HN 94 分的相機機器人吸塵器作者誠實承認失敗:CNN 在 train set 過擬合無法泛化。HN 留言頂貼 isoprophlex 給出對的方向:『讓 robot 自己跑、用 VLM 監督產生資料』。但這需要 24/7 的真實環境試錯,太貴。Newton physics(trending #8,4030★)剛好填這個洞:建一個你家客廳的 sim 環境(量一下家具位置),在裡面用 Newton + RL 訓 CNN policy,再 export 到 ESP32-S3 的 TFLite 部署。整個 sim-to-real 閉環社群裡缺一個『便宜業餘版』,Newton 把那個門檻降下來了。
📊 Show HN $300 vacuum 94 分證明 hobbyist 對低成本機器人有興趣;Newton 4030★ 兩天內衝起來證明 sim 端工具長期被 NVIDIA Isaac 壟斷的不滿。
- 難度 — ★★★☆☆ (3/5)
- 開發時間 — 2 週 sim 訓練 POC,1 個月跑通完整 sim-to-real
- 使用場景 — 你是大學機械系大二,預算 $300,週末想做一個會繞開家貓的吸塵器 demo 投履歷。傳統做法要買 LIDAR + 真實 collect 100 小時資料;新做法是 Newton sim 訓 8 小時 + ESP32-S3 部署 + 用 vibe coding 搞定 firmware。
- 技術組合 — Newton physics + Stable-Baselines3 PPO + TFLite Micro + ESP32-S3 + OV2640 camera
- 硬體需求 — 訓練:消費級 GPU 8GB+ VRAM(RTX 3060 起跳);部署:ESP32-S3 + 1 顆 OV2640 + 1 個底盤套件,總成本 <$300
- 技術門檻 — 需熟悉 Python + PyTorch 基礎 + 一點 C++(部署側);不需要會控制理論
- 外部依賴 — Newton 還在 alpha(issues 192 個是 yellow flag),可能需要 patch;TFLite Micro 對 CNN op 支援有限
- 入門第一步 —
git clone https://github.com/newton-physics/newton && cd examples/quadruped 跑通範例,量測單步 sim FPS
今日上線 — 新鮮出爐的專案
熱門專案與精選
- Anthropic acquires Vercept 今日宣佈 電腦操作層整合進 Claude,OSWorld benchmark 領先期可能拉長
- Anthropic × Google × Broadcom multi-GW compute deal 今日宣佈 Anthropic 把訓練側硬體後端從『主要 AWS』擴張到 Google TPU + Broadcom 自訂矽,數 GW 級
- Claude Partner Network $100M 今日宣佈 從『被動 listing』升級為帶資金的 ecosystem 計畫;對 RAG / agent infra startup 是真錢
- google-ai-edge/LiteRT-LM ⭐2,930 2025-04 建立 Gemma 4 邊緣推理框架;今日 push,新增 Gemma 4 完整支援
- MegaTrain 論文:100B+ 單卡 full precision 訓練 今日 arxiv 上線 把 params + optimizer state 放 CPU RAM,GPU 做 transient compute;reference implementation 尚未釋出
- milla-jovovich/mempalace ⭐26,017 本週新增 宣稱『最高分 AI memory benchmark』;3 天 26k★、forks 3217(12.4% healthy ratio)
- JuliusBrussee/caveman ⭐7,287 本週新增 Claude Code skill,宣稱用『caveman talk』砍 65% token(這個數字需驗證)
- JackChen-me/open-multi-agent ⭐5,392 本週新增 TypeScript 多 agent framework,runTeam() 一行從 goal 到 result
- lintsinghua/claude-code-book ⭐2,415 本週新增 《御輿:解碼 Agent Harness》42 萬字拆解 Claude Code 架構;中文圈第一本系統性著作
- abhigyanpatwari/GitNexus ⭐25,205 2025-08 建立 瀏覽器內 zero-server 程式碼知識圖譜,內建 Graph RAG agent
- forrestchang/andrej-karpathy-skills ⭐8,805 2026-01 建立 把 Karpathy 對 LLM coding pitfalls 的觀察打包成單一 CLAUDE.md
- Claude Managed Agents 今日宣佈 Anthropic 推出的 managed agent 託管層;HN 87 分但留言對『standardize around current limitations』有保留
- Meta Muse Spark 今日宣佈 Meta『scaling towards personal superintelligence』第一步;HN 158 分但封閉不開源、無 API
- Safetensors 移交 PyTorch Foundation 今日宣佈 HF 把 safetensors 捐給 PyTorch Foundation,鎖定 AI 模型執行安全的去中心化治理
- Railway 把前端從 Next.js 搬走,build 時間 10 分鐘→2 分鐘 今日發佈 competitor 對 Vercel 的公開技術反擊;HN 131 分
- Show HN: TUI-use 今日 Show HN 讓 AI agent 控制互動式終端程式(vim、git rebase -i 等);補上 Claude Code 一直缺的 piece
開發者動態 — 知名開發者的新專案
過去 72 小時內,全球與台灣高影響力開發者新建的 public repo。
🇹🇼 台灣
- cw1997 1,220 followers → cw1997/claude-code-sourcemap 20h ago 從 source map 還原 Claude Code 完整原始碼 🇹🇼 台灣社群對 Claude Code internals 的逆向熱度 H1 持續升溫,對應 Anthropic 不開源 client 的封閉策略
- yuaanlin 742 followers → yuaanlin/awesome-codex-plugins 13h ago Curated list of OpenAI Codex plugins, skills 與資源 🇹🇼 對應 Astral 被收購後的 Codex 生態擴張預期
🌐 全球
-
karpathy
161,642 followers
→ karpathy/KarpathyTalk
Go64h ago Twitter meets GitHub Gists:plain markdown 貼文 + 基本社交層 + 對人類與 LLM agent 都開放的 API。Karpathy 親自下場做『LLM-friendly 社交層』 - google 70,357 followers → google/agents-cli 2h ago 空 repo 但名字暗示 Google 在準備自家 agent CLI 對手 Claude Code / Codex
-
apple
36,085 followers
→ apple/ml-safetypairs
Python46h ago SafetyPairs:透過 counterfactual image 隔離影像中的安全關鍵特徵;apple 對 multimodal safety 的研究一手公開 -
huggingface
61,522 followers
→ huggingface/arxiv-robotics-sustainability-classification
Python7h ago 自動化分類 ArXiv robotics 論文的永續性面向;HF 在做 robotics 議題的元研究
社群脈動 — 今日熱門討論
- Anthropic acquires Vercept — computer use action 層被吃下 Anthropic News 如果你在做 RPA / browser-agent,30 天內要決定『靠 lab 還是繞 lab』 → 本週把 action layer 抽象掉,避免 hard-bind Anthropic native API
- MegaTrain:100B+ 單卡 full precision 訓練 HN 219 分 consumer GPU fine-tune 大模型的硬體門檻被往下打了一檔,但需等 reference implementation → watch arxiv comments 跟 GitHub,預期 8 週內會有 PyTorch 復現
- Microsoft 終止 VeraCrypt developer cert HN 977+313 分 OSS 風險面正式從『程式碼』擴張到『平台撤權』;安全敏感工具需要備援簽章路徑 → 把你依賴的 FOSS 工具列出來,標註誰的 release artifact 是 single point of failure
- GLM-5.1: Towards Long-Horizon Tasks Simon Willison 中國 OSS 路線在 long-horizon agent 上開始出現可重複的 baseline,open thread 持續追蹤
- mempalace 4 天衝 26k★(forks ratio 12.4% 健康) topic:llm · 26017★ · 3d AI memory layer 是今年第一個出現『benchmark-driven hype + 真實 fork 採用』雙訊號的 sub-category
Hacker News
- Git commands I run before reading any code 1436分
- Veracrypt project update 977分
- I ported Mac OS X to the Nintendo Wii 725分
- ML promises to be profoundly weird 244分
- MegaTrain: Full Precision Training of 100B+ Parameter LLMs on a Single GPU 219分
- Muse Spark: Scaling Towards Personal Superintelligence 158分
- We moved Railway's frontend off Next.js. Builds went from 10+ mins to under 2 131分
- Claude Managed Agents 87分
Lobsters
- The Last Quiet Thing 77分 hardware
- The Future of Everything is Lies, I Guess 66分 vibecoding
- Assessing Claude Mythos Preview's cybersecurity capabilities 64分 securityvibecoding
- Nix privilege escalation security advisory: symlink following during FOD output 39分 nixsecurity
- Porting Mac OS X to the Nintendo Wii 34分 hardwaremacosdev
Dev.to Top
- AIMock: One Mock Server For Your Entire AI Stack Dev.to Top
- Top 7 Featured DEV Posts of the Week Dev.to Top
- Google Maps for Codebases: Paste a GitHub URL, Ask Anything Dev.to Top
- Final Round AI vs Interview Coder: Best AI Tool for Coding Interview Prep (2026) Dev.to Top
- Por que eu começo 10 projetos e não termino nenhum? Dev.to Top
- O que uma usina nuclear tem a ver com o seu processo de QA? Dev.to Top
- Confidently Wrong AI – The World's Most Useless Ad Algorithm Dev.to Top
- Hacking with multimodal Gemma 4 in AI Studio Dev.to Top
- De front-end para UX, e de volta ao código: o que significa ser Design Engineer em 2026 Dev.to Top
- Do You Actually Need an AI Gateway? (And When a Simple LLM Wrapper Isn't Enough) Dev.to Top
- Do You Actually Need an AI Gateway? (And When a Simple LLM Wrapper Isn’t Enough) Dev.to Top
- Google Gemma 4: Everything Developers Need to Know Dev.to Top
- 365 Days of Building in Public, Perfectly Reflected By My Badges Dev.to Top
- Best Enterprise Claude Code Gateway🔥 Dev.to Top
- 9 Things You’re Overengineering (The Browser Already Solved Them) Dev.to Top
SegmentFault
- HAProxy 启动报错,辛苦核实一下此配置文件有异常吗? SegmentFault
- 我自己做了一个 skill 放到 github 之后,使用者怎么 upgrade 呢? SegmentFault
- 如何用Python提取扫描件PDF中的表格并转为结构化文本? SegmentFault
- 关于post请求参数方式的疑问? SegmentFault
- 在新建一个CentOS 10的虚拟机,里面很多工具都没有,是否有一键安装常用包的命令呢? SegmentFault
- 怎么把 superpowers 加到 codebuddy /workbuddy 啊? SegmentFault
- K8s中,我们知道deployment 进行配置无状态的应用。 但是我们为何不能使用deployment配置有状态应用呢? SegmentFault
- opencode 怎么删除掉已经配置的供应商? SegmentFault
- Cloudflare 多域名批量修改 DNS 记录,有没有系统的技术方案? SegmentFault
- 关于 Hudi 元数据字段(_hoodie_前缀)在 ODS 层进入 DWD 层时是否需要手动删除的请教? SegmentFault
OSChina
Changelog
- Astral has been acquired by OpenAI Changelog
- From Tailnet to platform Changelog
- Big change brings big change Changelog
- Finale & Friends Changelog
- Opus 4.5 changed everything Changelog
- The mythical agent-month Changelog
- Selling SDKs in the era of many Claudes Changelog
- All the Claw things Changelog
- Han shot first Changelog
- Building the machine that builds the machine Changelog
Anthropic News
- Anthropic expands partnership with Google and Broadcom for multiple gigawatts of next-generation compute Anthropic News
- Australian government and Anthropic sign MOU for AI safety and research Anthropic News
- Anthropic invests $100 million into the Claude Partner Network Anthropic News
- Introducing The Anthropic Institute Anthropic News
- Sydney will become Anthropic’s fourth office in Asia-Pacific Anthropic News
- Partnering with Mozilla to improve Firefox’s security Anthropic News
- Where things stand with the Department of War Anthropic News
- Statement on the comments from Secretary of War Pete Hegseth Anthropic News
- Statement from Dario Amodei on our discussions with the Department of War Anthropic News
- Anthropic acquires Vercept to advance Claude's computer use capabilities Anthropic News
HuggingFace Daily Papers
- Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents HuggingFace Daily Papers
- Beyond Accuracy: Unveiling Inefficiency Patterns in Tool-Integrated Reasoning HuggingFace Daily Papers
- Paper Circle: An Open-source Multi-agent Research Discovery and Analysis Framework HuggingFace Daily Papers
- In-Place Test-Time Training HuggingFace Daily Papers
- Action Images: End-to-End Policy Learning via Multiview Video Generation HuggingFace Daily Papers
- MMEmb-R1: Reasoning-Enhanced Multimodal Embedding with Pair-Aware Selection and Adaptive Control HuggingFace Daily Papers
- Experience Transfer for Multimodal LLM Agents in Minecraft Game HuggingFace Daily Papers
- FactReview: Evidence-Grounded Reviews with Literature Positioning and Execution-Based Claim Verification HuggingFace Daily Papers
- Context-Value-Action Architecture for Value-Driven Large Language Model Agents HuggingFace Daily Papers
- QiMeng-PRepair: Precise Code Repair via Edit-Aware Reward Optimization HuggingFace Daily Papers
- Scientific Graphics Program Synthesis via Dual Self-Consistency Reinforcement Learning HuggingFace Daily Papers
- CUE-R: Beyond the Final Answer in Retrieval-Augmented Generation HuggingFace Daily Papers
- Video-MME-v2: Towards the Next Stage in Benchmarks for Comprehensive Video Understanding HuggingFace Daily Papers
- Vanast: Virtual Try-On with Human Image Animation via Synthetic Triplet Supervision HuggingFace Daily Papers
- Watch Before You Answer: Learning from Visually Grounded Post-Training HuggingFace Daily Papers
Simon Willison
- Quoting Giles Turnbull Simon Willison
- GLM-5.1: Towards Long-Horizon Tasks Simon Willison
- Anthropic's Project Glasswing - restricting Claude Mythos to security researchers - sounds necessary to me Simon Willison
- SQLite WAL Mode Across Docker Containers Sharing a Volume Simon Willison
- Google AI Edge Gallery Simon Willison
- datasette-ports 0.2 Simon Willison
- scan-for-secrets 0.3 Simon Willison
- Cleanup Claude Code Paste Simon Willison
- datasette-ports 0.1 Simon Willison
- Eight years of wanting, three months of building with AI Simon Willison
Gary Marcus
- What should we take from Anthropic’s (possibly) terrifying new report on Mythos? Gary Marcus
- Sam Altman, unconstrained by the truth Gary Marcus
- The back story behind the first “$1.8 Billion” dollar “AI Company” Gary Marcus
- The two wildest stories today in tech Gary Marcus
- On employment, don’t panic – yet. Gary Marcus
Karpathy
- Coming soon Karpathy
Google AI Blog
- New ways to balance cost and reliability in the Gemini API Google AI Blog
- Create, edit and share videos at no cost in Google Vids Google AI Blog
- We’re creating a new satellite imagery map to help protect Brazil’s forests. Google AI Blog
- The latest AI news we announced in March 2026 Google AI Blog
- Build with Veo 3.1 Lite, our most cost-effective video generation model Google AI Blog
- Watch James Manyika talk AI and creativity with LL COOL J. Google AI Blog
- Transform your headphones into a live personal translator on iOS. Google AI Blog
- Gemini 3.1 Flash Live: Making audio AI more natural and reliable Google AI Blog
- Search Live is expanding globally Google AI Blog
- Build with Lyria 3, our newest music generation model Google AI Blog
Phoronix
- AMD Ryzen 9 9950X3D2 To Be Priced At $899 USD Phoronix
- Intel Arc Pro B70 Benchmarks With LLM / AI, OpenCL, OpenGL & Vulkan Phoronix
- Lenovo Laptops To Enjoy Better Fan Speed Monitoring With Linux 7.1 Phoronix
- Intel Releases OpenVINO 2026.1 With Backend For Llama.cpp, New Hardware Support Phoronix
- Chrome 147 Stable Released With New Restrictions, Web Printing API Phoronix
- Hugging Face Contributes Safetensors To PyTorch Foundation To Secure AI Model Execution Phoronix
- XDG-Desktop-Portal 1.20.4 Released To Protect Against Apps Trashing Arbitrary Host Files Phoronix
- Flatpak 1.16.4 Brings Important Security Fixes For Sandbox Escape & Deleting Host Files Phoronix
- Jay: A New Open-Source Shader Compiler Being Developed For Intel GPUs Phoronix
- AMD InterWave ISA Sound Card Driver Seeing New Linux Patches In 2026 Phoronix
LWN
- [$] Ripping CDs and converting audio with fre:ac LWN
- [$] An API for handling arithmetic overflow LWN
- Nix privilege escalation security advisory LWN
- Security updates for Wednesday LWN
- [$] Sharing stories on Scuttlebutt LWN
- Security updates for Tuesday LWN
- Introducing the FreeBSD laptop integration testing project LWN
- [$] Protecting against TPM interposer attacks LWN
- 6.6.133 stable kernel released LWN
- Security updates for Monday LWN
趨勢訊號 — 觀察與預測
今日焦點
Anthropic 把『模型公司』四個字寫滿了今天的整條供應鏈
2026-04-09 是一個極端罕見的日子:單一公司在 24 小時內推送了 5 條獨立新聞,且每一條都打在不同的供應鏈節點上。Anthropic 同日宣布收購 Vercept(電腦操作層)、與 Google + Broadcom 簽下多 GW 級下一代算力合作、注資 $100M 到 Claude Partner Network、與澳洲政府簽 AI 安全 MOU、並把雪梨設為亞太第四個辦公室。再加上 04-08 的 Mythos Preview + Project Glasswing,我們追蹤的 arc-model-lab-vertical-integration 跟 arc-frontier-access-decoupling 兩條敘事在 48 小時內同時加速到 episode 2。
發生了什麼
把這 5 條新聞拆開來看每一條都不算大新聞——Anthropic 每月本來就會收 1-2 家小公司、每季都會有一筆 compute 合約。但今天的同步度是訊號:computer use 的 action 層(Vercept)、訓練側的硬體後端(Google TPU + Broadcom 自訂矽)、上層生態的合作伙伴金流、以及政府/地理覆蓋——全部在同一個 news cycle 裡推出。Lobsters 上 64 分的 Assessing Claude Mythos Preview's cybersecurity capabilities 同日上線,證實了 Glasswing 的『受限發佈、第三方先 review』模式真的開始跑了。Simon Willison 也把 Glasswing 標為『sounds necessary to me』——這意味業界 OG 正在背書 Anthropic 的脫鉤策略。
對比之下 OpenAI 這 48 小時相對安靜:04-08 收購 Astral 的故事還在 Changelog news #184 持續發酵,但今天 OpenAI 沒有新動作;Google 端今天的新聞集中在 Veo 3.1 Lite、Gemini 3.1 Flash Live、Lyria 3 等產品分發,沒有併購或結構性合作。從這個對比看,Anthropic 是三家裡唯一在『分發層+算力層+操作層』同步出手的。
為什麼重要
過去 12 個月模型廠的競爭主軸是 benchmark 分數。從這 48 小時開始,主軸正在切換成『誰能控制從 GPU 到滑鼠游標的整條垂直』。Vercept 不是一家普通的 startup——它是 computer use evals 上少數能跟 OpenAI Operator 競爭的隊伍。把它買進來等於在 OSWorld / WebArena-Hard 這類 benchmark 上跳過半年的 catch-up 期。但代價是 Anthropic 的『中立基礎設施』敘事再次被削弱:你今天決定用 Claude API 做 computer use 應用,明天你的競爭對手是 Anthropic 自家整合的 Vercept stack。
對技術決策者:如果你在 2025 H2 押注 『用一家 lab 做所有事』 的策略,今天驗證了押對;如果你押注 『lab 不會碰我這層』(特別是 RPA/automation/agent harness 賽道),你需要在 30 天內重畫競爭圖。
社群怎麼看
HN 上 Claude Managed Agents(87 分)的熱門 reply 一針見血:『MANAGED AGENTS sounds like progress, but also like we're standardizing around the current limitations instead of solving them.』 這抓到了 vertical integration 的隱憂——當 lab 自己定義 agent 介面,社群創新會被 forced into 一個 lab 友善的形狀。另一條 51 分『I've been waiting over a month for Anthropic support to respond』則暴露了 Anthropic 在 scale 上的軟肋:往垂直整合衝的同時,最基礎的客戶支援卻在崩潰。Gary Marcus 今天那篇『What should we take from Anthropic's (possibly) terrifying new report on Mythos?』則站在另一端——認為 Mythos 的 cybersecurity 能力數字本身就值得社會層級的討論,不只是技術討論。三種聲音拼起來就是今天 Anthropic 故事的全貌:策略上贏、執行上裂、社會層級緊張。
行動建議
第一,如果你正在用 Claude API 做 computer use,本週就把你的 action layer 抽象掉——不要硬綁 Anthropic native API,留下能切到 OSS Operator 替代品(例如 open-multi-agent、TUI-use)的逃生通道。第二,如果你在 RAG / agent 工具鏈賽道,把『與 lab 合作』寫進你的 30 天 roadmap——Partner Network 的 $100M 是真錢,且通常先給先簽;觀察 Astral 被 OpenAI 收後 uv 的待遇可以反推 Anthropic 對 Partner 的態度。第三,如果你做安全研究,申請 Glasswing 的 Mythos Preview 存取——這是你能在 GA 之前接觸 frontier capability 的唯一管道。
訊號 1:arc-model-lab-vertical-integration 升級為今日唯一主敘事 強訊號 第 2 天
Anthropic 單日推 5 條互補新聞(Vercept + Google/Broadcom + Partner Network $100M + Australia MOU + Sydney 辦公室),加上 04-08 的 OpenAI×Astral,48 小時內兩大 lab 各完成一次『往工具鏈與算力同時併購』的動作。Google 今天的新聞集中在產品分發層而非結構性合作。
量化佐證:Anthropic News 5 條 + Lobsters 64 分 Mythos cybersecurity eval 證實 Glasswing 跑起來 + Simon Willison 公開背書
💡 產品機會:做一個『lab-neutral action layer adapter』——幫客戶把 Claude / OpenAI / Google agent 的 computer use API 統一抽象,避免任何單一 lab 的 vertical lock-in。Vercept 被吃掉之後,市場上突然空出了這個位置。
訊號 2:單卡 full precision 訓練 100B+:訊號層級從『實驗室技巧』升級為『可發 arxiv 的方法』 強訊號 第 2 天
MegaTrain 論文今日 HN 219 分,配合昨日 Show HN 上的 Gemma 4 multimodal fine-tuner(Apple Silicon native)與 unsloth 在 topic search 的持續 mention,單卡訓練大模型的訊號層級在 48 小時內三條獨立來源同時上升。MegaTrain 的核心 trick 是把 params + optimizer state 全留 CPU、GPU 當 transient compute——和 DeepSpeed-Zero 思路相近但更激進。
量化佐證:HN 219 + Show HN 216 + topic:llm 上 unsloth/MegaTrain 衍生 fork 出現
💡 產品機會:做一個『把消費級工作站變 fine-tune farm』的 CLI 工具——封裝 MegaTrain pattern + LoRA + Apple MLX backend,目標是讓非 ML 工程師用 8 小時 fine-tune 一個 70B 模型在自家領域文件上。
訊號 3:OSS 供應鏈風險面從『程式碼』擴張到『平台撤權』,今日新增第 3 個獨立案例 強訊號 第 2 天
Microsoft 今日終止 VeraCrypt developer certificate(HN 977 + 313 雙主題),加上 Lobsters 11 分『Open source security at Astral』+ LWN 39 分 Nix FOD 權限升級。三件事的共同訊號是 publisher-side risk——你的程式碼乾淨沒用,發行通道被掐就是死。
量化佐證:HN 977+313 分 VeraCrypt 雙主題 + Lobsters 11 分 Astral OSS security + LWN Nix advisory
💡 產品機會:做一個 FOSS『signing redundancy service』——為每個 release artifact 同時透過 Sigstore + 自簽 cert + GPG 三條路徑簽名,當任一條被撤權時自動 fall back。或更直接:『DistroWatch for binary publishers』,追蹤每個 FOSS 專案的 publisher diversity 評分。
潛力股
💡 商業化路徑:短期:成為 LLM agent 開發者的測試平台(付費 API tier)。中期:data licensing 給 lab 做 social-data RL。長期:如果真的吃掉一塊『agent-native social』市場,是 Bluesky-tier opportunity。
預測(可驗偽)
1. pending Claude Mythos Preview 在 2026 Q3 結束前不會 GA
2. pending Z.ai 會在 2026-05-10 前釋出 GLM-5.1 的 <32B variant
3. pending uv 會在 2026 H2 新增 OpenAI Codex / 官方 agent CLI 的深度整合
4. pending obra/superpowers 月均 star 增速到 2026-09-30 降至 <5%/月
5. pending Vercept 在 Anthropic 內整合後,『Claude + Vercept』版在 WebArena-Hard 或 OSWorld 對 OpenAI Operator / Google Agent 的領先不會 ≥8%(到 2026-12-31)
6. pending MegaTrain 的 reference implementation 會在 2026-06-30 前開源
7. pending Claude Partner Network $100M 在 2026-07-01 前會至少注資 5 家做 RAG / agent infra 的 OSS 專案(≥1M USD/家)
8. pending karpathy/KarpathyTalk 在 2026-06-09 前 stars 不會超過 30k(=Karpathy 個人實驗 vs 真實平台的分水嶺)