重要：Show HN: Smart model routing directly in Claude, Codex and Cursor

一個名為 Weave Router 的開源專案在 Hacker News 引發討論。根據專案作者在 Show HN 的說明，這是一個可接入 Claude Code、Codex、Cursor 等 coding agent 的 model router，目標是在不同模型之間自動分流請求，以降低成本並保留必要時使用高階模型的能力。

事件詳情

Weave Router 的定位是作為 Anthropic / OpenAI endpoint，專門服務 coding agent。它會檢視每一次 inference request，並判斷應該送往哪個模型，同時處理不同模型之間所需的轉換。

作者表示，團隊在 Weave 大量使用 AI 寫程式，因此成本逐漸上升；在 Opus 4.7 發布後，因 tokenizer 變更導致成本增加，促使他們思考並非每個任務都需要使用 Opus。Weave Router 因此被設計成：能在適合時使用較快或較便宜的模型，例如 DeepSeek v4、GLM 5.2、Kimi K2.6；在必要時再使用 frontier models，例如 Opus 4.8、GPT 5.5，或文中提到「Fable whenever it’s back」。

至於路由判斷方式，作者稱他們在數萬筆 agent traces 上訓練了一個 RL model。當 routing model 選到能成功完成任務的 LLM 時，就會獲得 reward。文章中舉例，如果請 router 規劃一個複雜變更，它可能會把請求送到 Opus 4.8；而探索 codebase、蒐集 context 的 subagents，則可能不需要同等級模型。

對 Claude Code 使用者的意義

這則討論之所以值得 Claude Code 使用者關注，是因為它直接切中目前 coding agent 使用中的一個現實問題：不同任務對模型能力的需求並不相同，但實際使用時往往會把所有請求送到同一個高階模型。

如果 router 能穩定判斷哪些請求需要 frontier model、哪些可以交給較便宜或較快的模型，對高頻使用 Claude Code、Codex 或 Cursor 的團隊來說，可能帶來更細緻的成本控制。不過，事件資料中尚未提供實測節省比例、成功率比較或失敗案例，因此目前仍應視為一個值得觀察的開源方案，而不是已被驗證的通用最佳實踐。

開發者可以怎麼做

對有興趣的開發者，建議先閱讀 GitHub 專案與 Hacker News 討論，確認它目前支援的 agent、模型與部署方式是否符合自己的工作流程。若要試用，適合先從本機或低風險專案開始，觀察它在規劃、探索、修改與驗證等不同任務中的路由結果，再評估是否導入日常開發流程。

重要：Show HN: Smart model routing directly in Claude, Codex and Cursor

事件詳情

對 Claude Code 使用者的意義

開發者可以怎麼做

相關連結

讀者回應

推薦閱讀

重要：The text in Claude Code’s “Extended Thinking” output

重要：Anthropic, please ship an official Claude Desktop for Linux

重要：Claude Desktop spawns 1.8 GB Hyper-V VM on every launch, even for chat-only use

重大：Introducing Claude Tag

訂閱最新文章