一個 AI Agent 到底要花多少錢？從個人到團隊的完整成本帳單

上週有個獨立開發者在社群問：「我接了 OpenClaw，又買了 Cursor Pro，月底對帳發現花了 $180，這正常嗎？」留言區瞬間分裂——有人說「太便宜了」，有人說「你瘋了吧」。兩邊其實都沒錯：他們說的根本不是同一種 AI Agent。

有人把 Agent 當成「進階版聊天框」，偶爾問幾個問題；有人讓 Agent 7×24 跑在 VPS 上，自動讀郵件、改程式碼、發 Slack 通知。前者一個月 $20 就夠用，後者一個人就能輕鬆燒到三位數。「AI Agent 多少錢」這個問題，缺的不是答案，而是一套統一的計價口徑。

這篇文章把帳單拆成四層，給出個人、獨立開發者、小團隊三檔參考區間，並附一個你可以直接套用的自測公式。價格以 2026 年中主流廠商公開報價為基準，匯率按 $1 ≈ NT$32 估算，實際以你控制台帳單為準。

先給結論

個人輕度使用約 $15—$40/月；獨立開發者把 Agent 當生產力主力約 $80—$250/月；3—10 人小團隊若全員接入且跑背景任務，綜合成本常見 $800—$3,000/月，還不含人力覆核時間。Token 通常只占 40%—70%，其餘藏在訂閱、基礎設施和「修 Agent 犯的錯」裡。

4 層

完整成本
拆解維度

5—12×

Agent 模式相對
單次問答的呼叫倍數

~30%

首月常見
「無效消耗」占比

別只盯 Token：AI Agent 的四層成本模型

大多數人算 AI 帳單時，只打開 Anthropic 或 OpenRouter 的控制台看 Token 消耗。這在「問答模式」下勉強夠用，但在 Agent 場景裡會嚴重低估總成本。一個能自主執行任務的 Agent，至少疊加四層支出：

層級	包含什麼	誰最容易忽略
L1 模型推理	LLM API Token、thinking tokens、多模態輸入	幾乎沒人忽略——但會低估 Agent 倍數
L2 工具與平台	Cursor Pro、Claude Code、OpenClaw、向量庫、搜尋 API	把訂閱和 API 混為一談，重複計費
L3 基礎設施	常駐 VPS / 雲 Mac、Gateway、網域、物件儲存、日誌	個人使用者以為「跑在本機不要錢」
L4 人力覆核	審查 Agent 輸出、修錯、處理告警、寫 prompt / 規則	財務帳上為零，機會成本極高

L1 是顯性成本，帳單上看得見；L2—L4 是隱性成本，往往在「感覺 AI 很便宜」和「月底怎麼這麼多」之間製造落差。下面按使用規模逐檔分解。

第一檔：個人輕度——把 Agent 當「更聰明的搜尋」

典型輪廓：偶爾用 Cursor 補全程式碼，手機上的 Agent 幫忙整理筆記，沒有 7×24 背景任務，不接 Slack / Discord 機器人。

這一檔的 L1 消耗很低。假設每天 20 次對話，每次平均 2,000 tokens（含上下文），月總量約 1.2M tokens。用 Sonnet 級模型（約 $3/M 輸入 + $15/M 輸出，按 7:3 輸入輸出比粗算），L1 大約 $8—$15/月。若走 OpenRouter 定價頁上的 Haiku / GPT-4o-mini 路由，可壓到 $3—$8。

L2 往往是最大單項：Cursor Pro 約 $20/月（含一定額度的高速模型），或 Claude Pro $20/月。注意——訂閱裡的額度用完後，超額部分仍走 API 計費，很多人第一次超支就是在這裡。

L3 在個人檔通常為零：Agent 跑在筆電上，關機就停。L4 可忽略——你本來就要看 Agent 的輸出，覆核時間算進正常使用。

個人輕度合計：約 $15—$40/月（NT$480—NT$1,280）。上限通常不是 Token，而是你有沒有同時訂了兩三個 AI 工具卻只用其中一個。

第二檔：獨立開發者——Agent 是生產力主力

典型輪廓：每天用 Cursor Agent 或 Claude Code 改程式碼 2—4 小時，OpenClaw / 自寫腳本在背景處理 PR Review、日誌摘要、定時報告；有一台常開的 Gateway 或 VPS 做統一路由。

這一檔的 L1 會跳一個數量級。獨立開發者的真實用量我們抽樣過（10 人問卷 + 自己的帳單）：每天 5—15 個 Agent 任務，每任務平均 6—10 次 LLM 呼叫，每次 8,000—15,000 tokens（含 repo 上下文）。粗算月 Token 量 50M—200M。

成本項	獨立開發者典型區間	備註
L1 模型推理	$40—$150/月	路由到 Sonnet 為主、Opus 按需
L2 工具訂閱	$20—$60/月	Cursor Pro + 可選 Claude Code / OpenClaw
L3 基礎設施	$5—$50/月	輕量 VPS 或按天雲 Mac 做 Gateway
L4 人力覆核	5—10 小時/月	按 $50/h 機會成本 ≈ $250—$500

把 L4 算進去，獨立開發者的真實代價可能是 $300—$700/月；但若只算現金支出（L1—L3），常見 $80—$250/月。

這一檔的關鍵變數是 Agent 倍數：你發出 1 條指令，背景可能觸發 8 次 LLM 呼叫。我們在當 Token 越來越便宜，帳單為什麼越來越貴？裡詳細講過這個效應——單價跌了，倍數鏈卻沒縮短，帳單照樣漲。

控制這一檔成本最有效的手段，不是少用，而是把 Gateway 和預算熔斷搭起來：LiteLLM 做分層路由（簡單任務走 Haiku，複雜任務走 Sonnet），每個工具一把 Virtual Key 設月上限。具體搭法可參考 Cloud Mac + OpenRouter 保姆級實戰。

第三檔：小團隊（3—10 人）——Agent 進入工作流

典型輪廓：團隊共享一套 Gateway，Cursor Business 或同類席位按人頭計費；有 1—3 個背景 Agent（客服摘要、CI 失敗分析、文件同步）；需要稽核日誌和密鑰隔離。

小團隊的 L1 不再是「一個人的用量 × 人數」，而是超線性成長——因為背景 Agent 不隨人頭線性縮放，且團隊成員會互相觸發 Agent（A 的 PR 觸發 Review Bot，B 的 Bot 又去調測試 Agent）。

粗算：5 人團隊，每人日均 10 個 Agent 任務，月 Token 量可達 500M—2B。按混合路由均價 $2/M 計，L1 alone 就是 $1,000—$4,000/月。若不做路由、全員預設 Sonnet + Opus，翻倍不稀奇。

L2 按人頭：Cursor Business 約 $40/人/月 × 5 = $200；若再加 Claude Team 或專用 Agent 平台，再加 $100—$300。L3：一台常駐 Gateway 機器（雲 Mac 或 VPS）$20—$80/月，加日誌儲存、向量庫（Pinecone / pgvector 自建）$20—$100/月。

L4 在小團隊會被嚴重低估。按我們的觀察，前三個月平均每週有 2—4 小時花在「修 Agent」上——調 prompt、處理誤報、給新人解釋為什麼 Bot 說了奇怪的話。5 人團隊若由 Tech Lead 兼管，每月 8—16 小時 × $80/h ≈ $640—$1,280 機會成本。

小團隊最容易踩的坑

每人各自綁主 API Key，沒有 Gateway 統一路由——結果 5 個人 5 套計費，沒人知道總量；某個同事的實驗腳本忘了關 max_retries，一次 flaky test 燒掉 $200+。團隊超過 3 人之前就該搭 Gateway，否則遷移和追責成本更高。

小團隊現金支出（L1—L3）常見 $800—$3,000/月；含 L4 機會成本則 $1,500—$5,000/月。若業務上 Agent 能替代 0.5 個初級營運或 20% 的客服工時，ROI 仍然成立——但前提是財務和工程用同一套口徑算帳。

四層之下還有三筆「看不見的錢」

除了四層模型，還有三筆成本在預算會上經常被跳過：

失敗與重試稅。Agent 遇到工具呼叫失敗會重試，遇到模糊指令會多輪澄清。一次「本可以 1 次呼叫搞定」的任務，在 Agent 模式下變成 5—12 次呼叫並不罕見。按 Anthropic 官方定價，thinking 模式的內部推理 tokens 同樣計費，一次「深度分析」可能是你想像的 5—10 倍。

上下文膨脹稅。Agent 框架傾向於「每次呼叫攜帶完整上下文」——整個 repo、整份對話歷史、所有工具定義。一個 500KB 原始檔約 125K tokens，塞進 prompt 一次就吃掉大半個月輕度使用者的額度。不做上下文裁剪，路由再省錢也白搭。

冷啟動與遷移稅。換模型、換 Agent 框架、從本機遷到雲端，前兩週的除錯消耗往往是穩定運行期的 2—3 倍。預算裡應單獨留「實驗線」，別和生產線共用一個沒上限的 API Key。

自測公式：30 秒估算你的月度 Agent 帳單

把下面四個數代進去，能得到 L1 現金成本的粗算（單位：美元/月）：

月度 Token 成本估算

# 變數說明
                D = 每天 Agent 任務數
                M = 每任務平均 LLM 呼叫次數（倍數，常見 5—12）
                T = 每次呼叫平均 Token 數（含輸入+輸出，常見 8K—20K）
                P = 混合路由後的有效單價（$/M tokens，常見 1.5—4）

                # 公式
                月 Token 成本 ≈ D × M × T × 30 × P / 1,000,000

                # 範例：獨立開發者
                # D=10, M=8, T=12000, P=2.5 → 10×8×12000×30×2.5/1M = $72/月（僅 L1）

                # 別忘了加 L2+L3，再 ×1.3 留失敗重試餘量
                月現金總成本 ≈ 月 Token 成本 × 1.3 + L2 訂閱 + L3 基礎設施

若算出來 L1 只要 $30，但信用卡扣了 $120，差額幾乎一定在 L2（訂閱 + 超額 API）和 L3（你沒意識到的常駐機器）。打開各平台控制台，按「服務」而非「日期」分組對帳，通常一眼就能找到漏網之魚。

讓帳單可控：三檔策略，不按人數一刀切

個人檔：只留一個主力工具訂閱，API 走單一 Gateway 或直接用廠商 Console 設 hard limit。不必上雲，但務必在 OpenRouter / Anthropic 設月度 credit cap。

獨立開發者檔：值得花一個下午搭 LiteLLM + Virtual Key。把 Cursor、腳本、OpenClaw 分到不同 Key，分別設 $20—$50/月上限。Gateway 放在常開的機器上——本機睡眠就斷線，Agent 任務會莫名其妙失敗然後瘋狂重試，那才是最貴的。

小團隊檔：必須有的三件套：① per-user Virtual Key + spend cap；② 模型分層路由（fast / smart / deep 三別名）；③ 每週 spend 報表對齊上游帳單。技術選型上，LiteLLM Virtual Keys 文件涵蓋了最小可行治理；密鑰只放在 Gateway 機器，客戶端不下發主 Key。

花對錢比省錢重要

上線 spend 監控的團隊，首月通常能砍掉 20%—30% 無效消耗：從未被讀過的 Agent 輸出、每次全量上下文卻只用最後幾行的腳本、以及被遺忘在 cron 裡的舊任務。省下來的預算，應該投給「確實在賺錢」的 Agent 工作流，而不是一刀切降模型。

最後的問題：值不值，不由 Token 單價決定

回到開頭那個 $180 的獨立開發者——如果他用 Agent 每週省下 6 小時手工改測試、整理 PR 描述，按 $50/h 計，月省 $1,200，$180 的帳單 ROI 是 6.7 倍。如果他只是多了一個更貴的聊天框，那確實貴了。

AI Agent 的成本結構決定了：帳單大小不由「你有沒有用 AI」決定，而由「倍數鏈有多長、上下文有多胖、有沒有預算閘」決定。個人檔控制在 $40 以內完全可行；獨立開發者把 Gateway 搭好，$150 左右可以跑得很舒服；小團隊若不治理，四位數帳單是常態，但治理後往往能在不砍功能的前提下砍掉三分之一浪費。

下一步不是問「Agent 貴不貴」，而是問：「我這張四層帳單裡，每一塊錢對應哪項可衡量的產出？」能回答這個問題，你就已經比 90% 的團隊更清醒了。

FAQ

只用一個 Cursor Pro，不另外買 API，算不算 Agent 成本？算，而且要把訂閱和超額 API 分開記帳。Cursor Pro 含一定 fast requests 額度，Agent 模式消耗更快，超額後按 API 價計費——很多人以為「包月就 unlimited」，月底才發現疊加扣費。

自建 Ollama 本地模型，是不是零成本？現金 API 帳單接近零，但硬體折舊、電費、調模型時間都是成本。Mac mini M4 跑 7B—14B 模型電費不高，但複雜 Agent 任務仍可能需要回調雲端大模型，Hybrid 架構很常見。

團隊應該先砍模型檔次還是先搭 Gateway？先 Gateway。模型降級是單次優化；Gateway 的 Virtual Key、路由和熔斷是系統性治理。沒有 Gateway，你永遠不知道錢是誰、在哪個任務上燒掉的。

Agent 成本會隨模型降價持續下降嗎？單價會降，但 Jevons 效應會讓用量漲得更快——降價解鎖更多用例，倍數鏈也會變長。長期來看，治理結構比模型單價對帳單的影響更大。