上週有個獨立開發者在社群問:「我接了 OpenClaw,又買了 Cursor Pro,月底對帳發現花了 $180,這正常嗎?」留言區瞬間分裂——有人說「太便宜了」,有人說「你瘋了吧」。兩邊其實都沒錯:他們說的根本不是同一種 AI Agent。
有人把 Agent 當成「進階版聊天框」,偶爾問幾個問題;有人讓 Agent 7×24 跑在 VPS 上,自動讀郵件、改程式碼、發 Slack 通知。前者一個月 $20 就夠用,後者一個人就能輕鬆燒到三位數。「AI Agent 多少錢」這個問題,缺的不是答案,而是一套統一的計價口徑。
這篇文章把帳單拆成四層,給出個人、獨立開發者、小團隊三檔參考區間,並附一個你可以直接套用的自測公式。價格以 2026 年中主流廠商公開報價為基準,匯率按 $1 ≈ NT$32 估算,實際以你控制台帳單為準。
拆解維度
單次問答的呼叫倍數
「無效消耗」占比
別只盯 Token:AI Agent 的四層成本模型
大多數人算 AI 帳單時,只打開 Anthropic 或 OpenRouter 的控制台看 Token 消耗。這在「問答模式」下勉強夠用,但在 Agent 場景裡會嚴重低估總成本。一個能自主執行任務的 Agent,至少疊加四層支出:
| 層級 | 包含什麼 | 誰最容易忽略 |
|---|---|---|
| L1 模型推理 | LLM API Token、thinking tokens、多模態輸入 | 幾乎沒人忽略——但會低估 Agent 倍數 |
| L2 工具與平台 | Cursor Pro、Claude Code、OpenClaw、向量庫、搜尋 API | 把訂閱和 API 混為一談,重複計費 |
| L3 基礎設施 | 常駐 VPS / 雲 Mac、Gateway、網域、物件儲存、日誌 | 個人使用者以為「跑在本機不要錢」 |
| L4 人力覆核 | 審查 Agent 輸出、修錯、處理告警、寫 prompt / 規則 | 財務帳上為零,機會成本極高 |
L1 是顯性成本,帳單上看得見;L2—L4 是隱性成本,往往在「感覺 AI 很便宜」和「月底怎麼這麼多」之間製造落差。下面按使用規模逐檔分解。
第一檔:個人輕度——把 Agent 當「更聰明的搜尋」
典型輪廓:偶爾用 Cursor 補全程式碼,手機上的 Agent 幫忙整理筆記,沒有 7×24 背景任務,不接 Slack / Discord 機器人。
這一檔的 L1 消耗很低。假設每天 20 次對話,每次平均 2,000 tokens(含上下文),月總量約 1.2M tokens。用 Sonnet 級模型(約 $3/M 輸入 + $15/M 輸出,按 7:3 輸入輸出比粗算),L1 大約 $8—$15/月。若走 OpenRouter 定價頁 上的 Haiku / GPT-4o-mini 路由,可壓到 $3—$8。
L2 往往是最大單項:Cursor Pro 約 $20/月(含一定額度的高速模型),或 Claude Pro $20/月。注意——訂閱裡的額度用完後,超額部分仍走 API 計費,很多人第一次超支就是在這裡。
L3 在個人檔通常為零:Agent 跑在筆電上,關機就停。L4 可忽略——你本來就要看 Agent 的輸出,覆核時間算進正常使用。
個人輕度合計:約 $15—$40/月(NT$480—NT$1,280)。上限通常不是 Token,而是你有沒有同時訂了兩三個 AI 工具卻只用其中一個。
第二檔:獨立開發者——Agent 是生產力主力
典型輪廓:每天用 Cursor Agent 或 Claude Code 改程式碼 2—4 小時,OpenClaw / 自寫腳本在背景處理 PR Review、日誌摘要、定時報告;有一台常開的 Gateway 或 VPS 做統一路由。
這一檔的 L1 會跳一個數量級。獨立開發者的真實用量我們抽樣過(10 人問卷 + 自己的帳單):每天 5—15 個 Agent 任務,每任務平均 6—10 次 LLM 呼叫,每次 8,000—15,000 tokens(含 repo 上下文)。粗算月 Token 量 50M—200M。
| 成本項 | 獨立開發者典型區間 | 備註 |
|---|---|---|
| L1 模型推理 | $40—$150/月 | 路由到 Sonnet 為主、Opus 按需 |
| L2 工具訂閱 | $20—$60/月 | Cursor Pro + 可選 Claude Code / OpenClaw |
| L3 基礎設施 | $5—$50/月 | 輕量 VPS 或按天雲 Mac 做 Gateway |
| L4 人力覆核 | 5—10 小時/月 | 按 $50/h 機會成本 ≈ $250—$500 |
把 L4 算進去,獨立開發者的真實代價可能是 $300—$700/月;但若只算現金支出(L1—L3),常見 $80—$250/月。
這一檔的關鍵變數是 Agent 倍數:你發出 1 條指令,背景可能觸發 8 次 LLM 呼叫。我們在 當 Token 越來越便宜,帳單為什麼越來越貴? 裡詳細講過這個效應——單價跌了,倍數鏈卻沒縮短,帳單照樣漲。
控制這一檔成本最有效的手段,不是少用,而是把 Gateway 和預算熔斷搭起來:LiteLLM 做分層路由(簡單任務走 Haiku,複雜任務走 Sonnet),每個工具一把 Virtual Key 設月上限。具體搭法可參考 Cloud Mac + OpenRouter 保姆級實戰。
第三檔:小團隊(3—10 人)——Agent 進入工作流
典型輪廓:團隊共享一套 Gateway,Cursor Business 或同類席位按人頭計費;有 1—3 個背景 Agent(客服摘要、CI 失敗分析、文件同步);需要稽核日誌和密鑰隔離。
小團隊的 L1 不再是「一個人的用量 × 人數」,而是超線性成長——因為背景 Agent 不隨人頭線性縮放,且團隊成員會互相觸發 Agent(A 的 PR 觸發 Review Bot,B 的 Bot 又去調測試 Agent)。
粗算:5 人團隊,每人日均 10 個 Agent 任務,月 Token 量可達 500M—2B。按混合路由均價 $2/M 計,L1 alone 就是 $1,000—$4,000/月。若不做路由、全員預設 Sonnet + Opus,翻倍不稀奇。
L2 按人頭:Cursor Business 約 $40/人/月 × 5 = $200;若再加 Claude Team 或專用 Agent 平台,再加 $100—$300。L3:一台常駐 Gateway 機器(雲 Mac 或 VPS)$20—$80/月,加日誌儲存、向量庫(Pinecone / pgvector 自建)$20—$100/月。
L4 在小團隊會被嚴重低估。按我們的觀察,前三個月平均每週有 2—4 小時花在「修 Agent」上——調 prompt、處理誤報、給新人解釋為什麼 Bot 說了奇怪的話。5 人團隊若由 Tech Lead 兼管,每月 8—16 小時 × $80/h ≈ $640—$1,280 機會成本。
小團隊現金支出(L1—L3)常見 $800—$3,000/月;含 L4 機會成本則 $1,500—$5,000/月。若業務上 Agent 能替代 0.5 個初級營運或 20% 的客服工時,ROI 仍然成立——但前提是財務和工程用同一套口徑算帳。
四層之下還有三筆「看不見的錢」
除了四層模型,還有三筆成本在預算會上經常被跳過:
失敗與重試稅。Agent 遇到工具呼叫失敗會重試,遇到模糊指令會多輪澄清。一次「本可以 1 次呼叫搞定」的任務,在 Agent 模式下變成 5—12 次呼叫並不罕見。按 Anthropic 官方定價,thinking 模式的內部推理 tokens 同樣計費,一次「深度分析」可能是你想像的 5—10 倍。
上下文膨脹稅。Agent 框架傾向於「每次呼叫攜帶完整上下文」——整個 repo、整份對話歷史、所有工具定義。一個 500KB 原始檔約 125K tokens,塞進 prompt 一次就吃掉大半個月輕度使用者的額度。不做上下文裁剪,路由再省錢也白搭。
冷啟動與遷移稅。換模型、換 Agent 框架、從本機遷到雲端,前兩週的除錯消耗往往是穩定運行期的 2—3 倍。預算裡應單獨留「實驗線」,別和生產線共用一個沒上限的 API Key。
自測公式:30 秒估算你的月度 Agent 帳單
把下面四個數代進去,能得到 L1 現金成本的粗算(單位:美元/月):
# 變數說明 D = 每天 Agent 任務數 M = 每任務平均 LLM 呼叫次數(倍數,常見 5—12) T = 每次呼叫平均 Token 數(含輸入+輸出,常見 8K—20K) P = 混合路由後的有效單價($/M tokens,常見 1.5—4) # 公式 月 Token 成本 ≈ D × M × T × 30 × P / 1,000,000 # 範例:獨立開發者 # D=10, M=8, T=12000, P=2.5 → 10×8×12000×30×2.5/1M = $72/月(僅 L1) # 別忘了加 L2+L3,再 ×1.3 留失敗重試餘量 月現金總成本 ≈ 月 Token 成本 × 1.3 + L2 訂閱 + L3 基礎設施
若算出來 L1 只要 $30,但信用卡扣了 $120,差額幾乎一定在 L2(訂閱 + 超額 API)和 L3(你沒意識到的常駐機器)。打開各平台控制台,按「服務」而非「日期」分組對帳,通常一眼就能找到漏網之魚。
讓帳單可控:三檔策略,不按人數一刀切
個人檔:只留一個主力工具訂閱,API 走單一 Gateway 或直接用廠商 Console 設 hard limit。不必上雲,但務必在 OpenRouter / Anthropic 設月度 credit cap。
獨立開發者檔:值得花一個下午搭 LiteLLM + Virtual Key。把 Cursor、腳本、OpenClaw 分到不同 Key,分別設 $20—$50/月上限。Gateway 放在常開的機器上——本機睡眠就斷線,Agent 任務會莫名其妙失敗然後瘋狂重試,那才是最貴的。
小團隊檔:必須有的三件套:① per-user Virtual Key + spend cap;② 模型分層路由(fast / smart / deep 三別名);③ 每週 spend 報表對齊上游帳單。技術選型上,LiteLLM Virtual Keys 文件 涵蓋了最小可行治理;密鑰只放在 Gateway 機器,客戶端不下發主 Key。
最後的問題:值不值,不由 Token 單價決定
回到開頭那個 $180 的獨立開發者——如果他用 Agent 每週省下 6 小時手工改測試、整理 PR 描述,按 $50/h 計,月省 $1,200,$180 的帳單 ROI 是 6.7 倍。如果他只是多了一個更貴的聊天框,那確實貴了。
AI Agent 的成本結構決定了:帳單大小不由「你有沒有用 AI」決定,而由「倍數鏈有多長、上下文有多胖、有沒有預算閘」決定。個人檔控制在 $40 以內完全可行;獨立開發者把 Gateway 搭好,$150 左右可以跑得很舒服;小團隊若不治理,四位數帳單是常態,但治理後往往能在不砍功能的前提下砍掉三分之一浪費。
下一步不是問「Agent 貴不貴」,而是問:「我這張四層帳單裡,每一塊錢對應哪項可衡量的產出?」能回答這個問題,你就已經比 90% 的團隊更清醒了。
FAQ
只用一個 Cursor Pro,不另外買 API,算不算 Agent 成本?算,而且要把訂閱和超額 API 分開記帳。Cursor Pro 含一定 fast requests 額度,Agent 模式消耗更快,超額後按 API 價計費——很多人以為「包月就 unlimited」,月底才發現疊加扣費。
自建 Ollama 本地模型,是不是零成本?現金 API 帳單接近零,但硬體折舊、電費、調模型時間都是成本。Mac mini M4 跑 7B—14B 模型電費不高,但複雜 Agent 任務仍可能需要回調雲端大模型,Hybrid 架構很常見。
團隊應該先砍模型檔次還是先搭 Gateway?先 Gateway。模型降級是單次優化;Gateway 的 Virtual Key、路由和熔斷是系統性治理。沒有 Gateway,你永遠不知道錢是誰、在哪個任務上燒掉的。
Agent 成本會隨模型降價持續下降嗎?單價會降,但 Jevons 效應會讓用量漲得更快——降價解鎖更多用例,倍數鏈也會變長。長期來看,治理結構比模型單價對帳單的影響更大。
把 Gateway 和 Agent 執行面放在同一台常駐雲 Mac
獨立開發者和小團隊的 Agent 帳單裡,L3 基礎設施往往被低估——本機睡眠就斷線,Agent 重試反而燒更多 Token;密鑰散落在各台筆電上,Virtual Key 沒法統一簽發。一台 7×24 線上的雲端 Mac mini M4,可以同時承擔 LiteLLM Gateway(launchd 常駐)、OpenClaw 執行面、以及 iOS/macOS 原生工具鏈除錯,密鑰只寫在伺服器 .env,筆電只拿受限 Virtual Key。
M4 待機功耗約 4W,長期跑 Gateway 的電費可忽略;Apple Silicon 統一記憶體讓並發 Agent + Proxy 更從容;macOS 的 Gatekeeper、SIP、FileVault 疊加,比典型 Linux VPS 更適合長期託管 API 密鑰。按天計費也適合「先驗證 ROI、再決定是否常駐」的節奏。
如果你剛算完四層帳單、準備搭第一套有熔斷的 Agent 基礎設施,從一台 VPSSpark 雲 Mac 開始——了解方案,讓控制面和執行面住在同一台安全、安靜的機器上。