一个 AI Agent 到底要花多少钱？从个人到团队的完整成本账单

上周有个独立开发者在群里问：「我接了个 OpenClaw，又买了 Cursor Pro，月底对账发现花了 $180，这正常吗？」评论区瞬间分裂——有人说「太便宜了」，有人说「你疯了吧」。两边其实都没错：他们说的根本不是同一种 AI Agent。

有人把 Agent 当成「高级聊天框」，偶尔问几个问题；有人让 Agent 7×24 跑在 VPS 上，自动读邮件、改代码、发 Slack 通知。前者一个月 $20 够用，后者一个人就能轻松烧到三位数。「AI Agent 多少钱」这个问题，缺的不是答案，而是一套统一的计价口径。

这篇文章把账单拆成四层，给出个人、独立开发者、小团队三档参考区间，并附一个你可以直接套用的自测公式。价格以 2026 年中主流厂商公开报价为基准，汇率按 $1 ≈ ¥7.2 估算，实际以你控制台账单为准。

先给结论

个人轻度使用约 $15—$40/月；独立开发者把 Agent 当生产力主力约 $80—$250/月；3—10 人小团队若全员接入且跑后台任务，综合成本常见 $800—$3,000/月，还不含人力复核时间。Token 通常只占 40%—70%，其余藏在订阅、基础设施和「修 Agent 犯的错」里。

4 层

完整成本
拆解维度

5—12×

Agent 模式相对
单次问答的调用乘数

~30%

首月常见
「无效消耗」占比

别只盯 Token：AI Agent 的四层成本模型

大多数人算 AI 账单时，只打开 Anthropic 或 OpenRouter 的控制台看 Token 消耗。这在「问答模式」下勉强够用，但在 Agent 场景里会严重低估总成本。一个能自主执行任务的 Agent，至少叠加四层支出：

层级	包含什么	谁最容易忽略
L1 模型推理	LLM API Token、thinking tokens、多模态输入	几乎没人忽略——但会低估 Agent 乘数
L2 工具与平台	Cursor Pro、Claude Code、OpenClaw、向量库、搜索 API	把订阅和 API 混为一谈，重复计费
L3 基础设施	常驻 VPS / 云 Mac、Gateway、域名、对象存储、日志	个人用户以为「跑在本机不要钱」
L4 人力复核	审查 Agent 输出、修错、处理告警、写 prompt / 规则	财务账上为零，机会成本极高

L1 是显性成本，账单上看得见；L2—L4 是隐性成本，往往在「感觉 AI 很便宜」和「月底怎么这么多」之间制造落差。下面按使用规模逐档拆解。

第一档：个人轻度——把 Agent 当「更聪明的搜索」

典型画像：偶尔用 Cursor 补全代码，手机上的 Agent 帮忙整理笔记，没有 7×24 后台任务，不接企业微信 / Slack 机器人。

这一档的 L1 消耗很低。假设每天 20 次对话，每次平均 2,000 tokens（含上下文），月总量约 1.2M tokens。用 Sonnet 级模型（约 $3/M 输入 + $15/M 输出，按 7:3 输入输出比粗算），L1 大约 $8—$15/月。若走 OpenRouter 定价页上的 Haiku / GPT-4o-mini 路由，可压到 $3—$8。

L2 往往是最大单项：Cursor Pro 约 $20/月（含一定额度的高速模型），或 Claude Pro $20/月。注意——订阅里的额度用完后，超额部分仍走 API 计费，很多人第一次超支就是在这里。

L3 在个人档通常为零：Agent 跑在笔记本上，关机就停。L4 可忽略——你本来就要看 Agent 的输出，复核时间算进正常使用。

个人轻度合计：约 $15—$40/月（¥110—¥290）。上限通常不是 Token，而是你有没有同时订了两三个 AI 工具却只用其中一个。

第二档：独立开发者——Agent 是生产力主力

典型画像：每天用 Cursor Agent 或 Claude Code 改代码 2—4 小时，OpenClaw / 自写脚本在后台处理 PR Review、日志摘要、定时报告；有一台常开的 Gateway 或 VPS 做统一路由。

这一档的 L1 会跳一个数量级。独立开发者的真实用量我们抽样过（10 人问卷 + 自己的账单）：每天 5—15 个 Agent 任务，每任务平均 6—10 次 LLM 调用，每次 8,000—15,000 tokens（含仓库上下文）。粗算月 Token 量 50M—200M。

成本项	独立开发者典型区间	备注
L1 模型推理	$40—$150/月	路由到 Sonnet 为主、Opus 按需
L2 工具订阅	$20—$60/月	Cursor Pro + 可选 Claude Code / OpenClaw
L3 基础设施	$5—$50/月	轻量 VPS 或按天云 Mac 做 Gateway
L4 人力复核	5—10 小时/月	按 $50/h 机会成本 ≈ $250—$500

把 L4 算进去，独立开发者的真实代价可能是 $300—$700/月；但若只算现金支出（L1—L3），常见 $80—$250/月。

这一档的关键变量是 Agent 乘数：你发出 1 条指令，后台可能触发 8 次 LLM 调用。我们在当 Token 越来越便宜，账单为什么越来越贵？里详细讲过这个效应——单价跌了，乘数链却没缩短，账单照样涨。

控制这一档成本最有效的手段，不是少用，而是把 Gateway 和预算熔断搭起来：LiteLLM 做分层路由（简单任务走 Haiku，复杂任务走 Sonnet），每个工具一把 Virtual Key 设月上限。具体搭法可参考 Cloud Mac + OpenRouter 保姆级实战。

第三档：小团队（3—10 人）——Agent 进入工作流

典型画像：团队共享一套 Gateway，Cursor Business 或同类席位按人头计费；有 1—3 个后台 Agent（客服摘要、CI 失败分析、文档同步）；需要审计日志和密钥隔离。

小团队的 L1 不再是「一个人的用量 × 人数」，而是超线性增长——因为后台 Agent 不随人头线性缩放，且团队成员会互相触发 Agent（A 的 PR 触发 Review Bot，B 的 Bot 又去调测试 Agent）。

粗算：5 人团队，每人日均 10 个 Agent 任务，月 Token 量可达 500M—2B。按混合路由均价 $2/M 计，L1 alone 就是 $1,000—$4,000/月。若不做路由、全员默认 Sonnet + Opus，翻倍不稀奇。

L2 按人头：Cursor Business 约 $40/人/月 × 5 = $200；若再加 Claude Team 或专用 Agent 平台，再加 $100—$300。L3：一台常驻 Gateway 机器（云 Mac 或 VPS）$20—$80/月，加日志存储、向量库（Pinecone / pgvector 自建）$20—$100/月。

L4 在小团队会被严重低估。按我们的观察，前三个月平均每周有 2—4 小时花在「修 Agent」上——调 prompt、处理误报、给新人解释为什么 Bot 说了奇怪的话。5 人团队若由 Tech Lead 兼管，每月 8—16 小时 × $80/h ≈ $640—$1,280 机会成本。

小团队最容易踩的坑

每人各自绑主 API Key，没有 Gateway 统一路由——结果 5 个人 5 套计费，没人知道总量；某个同事的实验脚本忘了关 max_retries，一次 flaky test 烧掉 $200+。团队超过 3 人之前就该搭 Gateway，否则迁移和追责成本更高。

小团队现金支出（L1—L3）常见 $800—$3,000/月；含 L4 机会成本则 $1,500—$5,000/月。若业务上 Agent 能替代 0.5 个初级运营或 20% 的客服工时，ROI 仍然成立——但前提是财务和工程用同一套口径算账。

四层之下还有三笔「看不见的钱」

除了四层模型，还有三笔成本在预算会上经常被跳过：

失败与重试税。Agent 遇到工具调用失败会重试，遇到模糊指令会多轮澄清。一次「本可以 1 次调用搞定」的任务，在 Agent 模式下变成 5—12 次调用并不罕见。按 Anthropic 官方定价，thinking 模式的内部推理 tokens 同样计费，一次「深度分析」可能是你以为的 5—10 倍。

上下文膨胀税。Agent 框架倾向于「每次调用携带完整上下文」——整个仓库、整份对话历史、所有工具定义。一个 500KB 源文件约 125K tokens，塞进 prompt 一次就吃掉大半个月轻度用户的配额。不做上下文裁剪，路由再省钱也白搭。

冷启动与迁移税。换模型、换 Agent 框架、从本机迁到云端，前两周的调试消耗往往是稳定运行期的 2—3 倍。预算里应单独留「实验线」，别和生产线共用一个没上限的 API Key。

自测公式：30 秒估算你的月度 Agent 账单

把下面四个数代进去，能得到 L1 现金成本的粗算（单位：美元/月）：

月度 Token 成本估算

# 变量说明
                D = 每天 Agent 任务数
                M = 每任务平均 LLM 调用次数（乘数，常见 5—12）
                T = 每次调用平均 Token 数（含输入+输出，常见 8K—20K）
                P = 混合路由后的有效单价（$/M tokens，常见 1.5—4）

                # 公式
                月 Token 成本 ≈ D × M × T × 30 × P / 1,000,000

                # 示例：独立开发者
                # D=10, M=8, T=12000, P=2.5 → 10×8×12000×30×2.5/1M = $72/月（仅 L1）

                # 别忘了加 L2+L3，再 ×1.3 留失败重试余量
                月现金总成本 ≈ 月 Token 成本 × 1.3 + L2 订阅 + L3 基础设施

若算出来 L1 只要 $30，但信用卡扣了 $120，差额几乎一定在 L2（订阅 + 超额 API）和 L3（你没意识到的常驻机器）。打开各平台控制台，按「服务」而非「日期」分组对账，通常一眼就能找到漏网之鱼。

让账单可控：三档策略，不按人数一刀切

个人档：只留一个主力工具订阅，API 走单一 Gateway 或直接用厂商 Console 设 hard limit。不必上云，但务必在 OpenRouter / Anthropic 设月度 credit cap。

独立开发者档：值得花一个下午搭 LiteLLM + Virtual Key。把 Cursor、脚本、OpenClaw 分到不同 Key，分别设 $20—$50/月上限。Gateway 放在常开的机器上——本机睡眠就断线，Agent 任务会莫名其妙失败然后疯狂重试，那才是最贵的。

小团队档：必须有的三件套：① per-user Virtual Key + spend cap；② 模型分层路由（fast / smart / deep 三别名）；③ 每周 spend 报表对齐上游账单。技术选型上，LiteLLM Virtual Keys 文档覆盖了最小可行治理；密钥只放在 Gateway 机器，客户端不下发主 Key。

花对钱比省钱重要

上线 spend 监控的团队，首月通常能砍掉 20%—30% 无效消耗：从未被读过的 Agent 输出、每次全量上下文却只用最后几行的脚本、以及被遗忘在 cron 里的旧任务。省下来的预算，应该投给「确实在赚钱」的 Agent 工作流，而不是一刀切降模型。

最后的问题：值不值，不由 Token 单价决定

回到开头那个 $180 的独立开发者——如果他用 Agent 每周省下 6 小时手工改测试、整理 PR 描述，按 $50/h 计，月省 $1,200，$180 的账单 ROI 是 6.7 倍。如果他只是多了一个更贵的聊天框，那确实贵了。

AI Agent 的成本结构决定了：账单大小不由「你有没有用 AI」决定，而由「乘数链有多长、上下文有多胖、有没有预算闸」决定。个人档控制在 $40 以内完全可行；独立开发者把 Gateway 搭好，$150 左右可以跑得很舒服；小团队若不治理，四位数账单是常态，但治理后往往能在不砍功能的前提下砍掉三分之一浪费。

下一步不是问「Agent 贵不贵」，而是问：「我这张四层账单里，每一块钱对应哪项可衡量的产出？」能回答这个问题，你就已经比 90% 的团队更清醒了。

FAQ

只用一个 Cursor Pro，不单独买 API，算不算 Agent 成本？算，而且要把订阅和超额 API 分开记账。Cursor Pro 含一定 fast requests 额度，Agent 模式消耗更快，超额后按 API 价计费——很多人以为「包月就 unlimited」，月底才发现叠加扣费。

自建 Ollama 本地模型，是不是零成本？现金 API 账单接近零，但硬件折旧、电费、调模型时间都是成本。Mac mini M4 跑 7B—14B 模型电费不高，但复杂 Agent 任务仍可能需要回调云端大模型，Hybrid 架构很常见。

团队应该先砍模型档次还是先搭 Gateway？先 Gateway。模型降级是单次优化；Gateway 的 Virtual Key、路由和熔断是系统性治理。没有 Gateway，你永远不知道钱是谁、在哪个任务上烧掉的。

Agent 成本会随模型降价持续下降吗？单价会降，但 Jevons 效应会让用量涨得更快——降价解锁更多用例，乘数链也会变长。长期看，治理结构比模型单价对账单的影响更大。