上周有个独立开发者在群里问:「我接了个 OpenClaw,又买了 Cursor Pro,月底对账发现花了 $180,这正常吗?」评论区瞬间分裂——有人说「太便宜了」,有人说「你疯了吧」。两边其实都没错:他们说的根本不是同一种 AI Agent。
有人把 Agent 当成「高级聊天框」,偶尔问几个问题;有人让 Agent 7×24 跑在 VPS 上,自动读邮件、改代码、发 Slack 通知。前者一个月 $20 够用,后者一个人就能轻松烧到三位数。「AI Agent 多少钱」这个问题,缺的不是答案,而是一套统一的计价口径。
这篇文章把账单拆成四层,给出个人、独立开发者、小团队三档参考区间,并附一个你可以直接套用的自测公式。价格以 2026 年中主流厂商公开报价为基准,汇率按 $1 ≈ ¥7.2 估算,实际以你控制台账单为准。
拆解维度
单次问答的调用乘数
「无效消耗」占比
别只盯 Token:AI Agent 的四层成本模型
大多数人算 AI 账单时,只打开 Anthropic 或 OpenRouter 的控制台看 Token 消耗。这在「问答模式」下勉强够用,但在 Agent 场景里会严重低估总成本。一个能自主执行任务的 Agent,至少叠加四层支出:
| 层级 | 包含什么 | 谁最容易忽略 |
|---|---|---|
| L1 模型推理 | LLM API Token、thinking tokens、多模态输入 | 几乎没人忽略——但会低估 Agent 乘数 |
| L2 工具与平台 | Cursor Pro、Claude Code、OpenClaw、向量库、搜索 API | 把订阅和 API 混为一谈,重复计费 |
| L3 基础设施 | 常驻 VPS / 云 Mac、Gateway、域名、对象存储、日志 | 个人用户以为「跑在本机不要钱」 |
| L4 人力复核 | 审查 Agent 输出、修错、处理告警、写 prompt / 规则 | 财务账上为零,机会成本极高 |
L1 是显性成本,账单上看得见;L2—L4 是隐性成本,往往在「感觉 AI 很便宜」和「月底怎么这么多」之间制造落差。下面按使用规模逐档拆解。
第一档:个人轻度——把 Agent 当「更聪明的搜索」
典型画像:偶尔用 Cursor 补全代码,手机上的 Agent 帮忙整理笔记,没有 7×24 后台任务,不接企业微信 / Slack 机器人。
这一档的 L1 消耗很低。假设每天 20 次对话,每次平均 2,000 tokens(含上下文),月总量约 1.2M tokens。用 Sonnet 级模型(约 $3/M 输入 + $15/M 输出,按 7:3 输入输出比粗算),L1 大约 $8—$15/月。若走 OpenRouter 定价页 上的 Haiku / GPT-4o-mini 路由,可压到 $3—$8。
L2 往往是最大单项:Cursor Pro 约 $20/月(含一定额度的高速模型),或 Claude Pro $20/月。注意——订阅里的额度用完后,超额部分仍走 API 计费,很多人第一次超支就是在这里。
L3 在个人档通常为零:Agent 跑在笔记本上,关机就停。L4 可忽略——你本来就要看 Agent 的输出,复核时间算进正常使用。
个人轻度合计:约 $15—$40/月(¥110—¥290)。上限通常不是 Token,而是你有没有同时订了两三个 AI 工具却只用其中一个。
第二档:独立开发者——Agent 是生产力主力
典型画像:每天用 Cursor Agent 或 Claude Code 改代码 2—4 小时,OpenClaw / 自写脚本在后台处理 PR Review、日志摘要、定时报告;有一台常开的 Gateway 或 VPS 做统一路由。
这一档的 L1 会跳一个数量级。独立开发者的真实用量我们抽样过(10 人问卷 + 自己的账单):每天 5—15 个 Agent 任务,每任务平均 6—10 次 LLM 调用,每次 8,000—15,000 tokens(含仓库上下文)。粗算月 Token 量 50M—200M。
| 成本项 | 独立开发者典型区间 | 备注 |
|---|---|---|
| L1 模型推理 | $40—$150/月 | 路由到 Sonnet 为主、Opus 按需 |
| L2 工具订阅 | $20—$60/月 | Cursor Pro + 可选 Claude Code / OpenClaw |
| L3 基础设施 | $5—$50/月 | 轻量 VPS 或按天云 Mac 做 Gateway |
| L4 人力复核 | 5—10 小时/月 | 按 $50/h 机会成本 ≈ $250—$500 |
把 L4 算进去,独立开发者的真实代价可能是 $300—$700/月;但若只算现金支出(L1—L3),常见 $80—$250/月。
这一档的关键变量是 Agent 乘数:你发出 1 条指令,后台可能触发 8 次 LLM 调用。我们在 当 Token 越来越便宜,账单为什么越来越贵? 里详细讲过这个效应——单价跌了,乘数链却没缩短,账单照样涨。
控制这一档成本最有效的手段,不是少用,而是把 Gateway 和预算熔断搭起来:LiteLLM 做分层路由(简单任务走 Haiku,复杂任务走 Sonnet),每个工具一把 Virtual Key 设月上限。具体搭法可参考 Cloud Mac + OpenRouter 保姆级实战。
第三档:小团队(3—10 人)——Agent 进入工作流
典型画像:团队共享一套 Gateway,Cursor Business 或同类席位按人头计费;有 1—3 个后台 Agent(客服摘要、CI 失败分析、文档同步);需要审计日志和密钥隔离。
小团队的 L1 不再是「一个人的用量 × 人数」,而是超线性增长——因为后台 Agent 不随人头线性缩放,且团队成员会互相触发 Agent(A 的 PR 触发 Review Bot,B 的 Bot 又去调测试 Agent)。
粗算:5 人团队,每人日均 10 个 Agent 任务,月 Token 量可达 500M—2B。按混合路由均价 $2/M 计,L1 alone 就是 $1,000—$4,000/月。若不做路由、全员默认 Sonnet + Opus,翻倍不稀奇。
L2 按人头:Cursor Business 约 $40/人/月 × 5 = $200;若再加 Claude Team 或专用 Agent 平台,再加 $100—$300。L3:一台常驻 Gateway 机器(云 Mac 或 VPS)$20—$80/月,加日志存储、向量库(Pinecone / pgvector 自建)$20—$100/月。
L4 在小团队会被严重低估。按我们的观察,前三个月平均每周有 2—4 小时花在「修 Agent」上——调 prompt、处理误报、给新人解释为什么 Bot 说了奇怪的话。5 人团队若由 Tech Lead 兼管,每月 8—16 小时 × $80/h ≈ $640—$1,280 机会成本。
小团队现金支出(L1—L3)常见 $800—$3,000/月;含 L4 机会成本则 $1,500—$5,000/月。若业务上 Agent 能替代 0.5 个初级运营或 20% 的客服工时,ROI 仍然成立——但前提是财务和工程用同一套口径算账。
四层之下还有三笔「看不见的钱」
除了四层模型,还有三笔成本在预算会上经常被跳过:
失败与重试税。Agent 遇到工具调用失败会重试,遇到模糊指令会多轮澄清。一次「本可以 1 次调用搞定」的任务,在 Agent 模式下变成 5—12 次调用并不罕见。按 Anthropic 官方定价,thinking 模式的内部推理 tokens 同样计费,一次「深度分析」可能是你以为的 5—10 倍。
上下文膨胀税。Agent 框架倾向于「每次调用携带完整上下文」——整个仓库、整份对话历史、所有工具定义。一个 500KB 源文件约 125K tokens,塞进 prompt 一次就吃掉大半个月轻度用户的配额。不做上下文裁剪,路由再省钱也白搭。
冷启动与迁移税。换模型、换 Agent 框架、从本机迁到云端,前两周的调试消耗往往是稳定运行期的 2—3 倍。预算里应单独留「实验线」,别和生产线共用一个没上限的 API Key。
自测公式:30 秒估算你的月度 Agent 账单
把下面四个数代进去,能得到 L1 现金成本的粗算(单位:美元/月):
# 变量说明 D = 每天 Agent 任务数 M = 每任务平均 LLM 调用次数(乘数,常见 5—12) T = 每次调用平均 Token 数(含输入+输出,常见 8K—20K) P = 混合路由后的有效单价($/M tokens,常见 1.5—4) # 公式 月 Token 成本 ≈ D × M × T × 30 × P / 1,000,000 # 示例:独立开发者 # D=10, M=8, T=12000, P=2.5 → 10×8×12000×30×2.5/1M = $72/月(仅 L1) # 别忘了加 L2+L3,再 ×1.3 留失败重试余量 月现金总成本 ≈ 月 Token 成本 × 1.3 + L2 订阅 + L3 基础设施
若算出来 L1 只要 $30,但信用卡扣了 $120,差额几乎一定在 L2(订阅 + 超额 API)和 L3(你没意识到的常驻机器)。打开各平台控制台,按「服务」而非「日期」分组对账,通常一眼就能找到漏网之鱼。
让账单可控:三档策略,不按人数一刀切
个人档:只留一个主力工具订阅,API 走单一 Gateway 或直接用厂商 Console 设 hard limit。不必上云,但务必在 OpenRouter / Anthropic 设月度 credit cap。
独立开发者档:值得花一个下午搭 LiteLLM + Virtual Key。把 Cursor、脚本、OpenClaw 分到不同 Key,分别设 $20—$50/月上限。Gateway 放在常开的机器上——本机睡眠就断线,Agent 任务会莫名其妙失败然后疯狂重试,那才是最贵的。
小团队档:必须有的三件套:① per-user Virtual Key + spend cap;② 模型分层路由(fast / smart / deep 三别名);③ 每周 spend 报表对齐上游账单。技术选型上,LiteLLM Virtual Keys 文档 覆盖了最小可行治理;密钥只放在 Gateway 机器,客户端不下发主 Key。
最后的问题:值不值,不由 Token 单价决定
回到开头那个 $180 的独立开发者——如果他用 Agent 每周省下 6 小时手工改测试、整理 PR 描述,按 $50/h 计,月省 $1,200,$180 的账单 ROI 是 6.7 倍。如果他只是多了一个更贵的聊天框,那确实贵了。
AI Agent 的成本结构决定了:账单大小不由「你有没有用 AI」决定,而由「乘数链有多长、上下文有多胖、有没有预算闸」决定。个人档控制在 $40 以内完全可行;独立开发者把 Gateway 搭好,$150 左右可以跑得很舒服;小团队若不治理,四位数账单是常态,但治理后往往能在不砍功能的前提下砍掉三分之一浪费。
下一步不是问「Agent 贵不贵」,而是问:「我这张四层账单里,每一块钱对应哪项可衡量的产出?」能回答这个问题,你就已经比 90% 的团队更清醒了。
FAQ
只用一个 Cursor Pro,不单独买 API,算不算 Agent 成本?算,而且要把订阅和超额 API 分开记账。Cursor Pro 含一定 fast requests 额度,Agent 模式消耗更快,超额后按 API 价计费——很多人以为「包月就 unlimited」,月底才发现叠加扣费。
自建 Ollama 本地模型,是不是零成本?现金 API 账单接近零,但硬件折旧、电费、调模型时间都是成本。Mac mini M4 跑 7B—14B 模型电费不高,但复杂 Agent 任务仍可能需要回调云端大模型,Hybrid 架构很常见。
团队应该先砍模型档次还是先搭 Gateway?先 Gateway。模型降级是单次优化;Gateway 的 Virtual Key、路由和熔断是系统性治理。没有 Gateway,你永远不知道钱是谁、在哪个任务上烧掉的。
Agent 成本会随模型降价持续下降吗?单价会降,但 Jevons 效应会让用量涨得更快——降价解锁更多用例,乘数链也会变长。长期看,治理结构比模型单价对账单的影响更大。
把 Gateway 和 Agent 执行面放在同一台常驻云 Mac
独立开发者和小团队的 Agent 账单里,L3 基础设施往往被低估——本机睡眠就断线,Agent 重试反而烧更多 Token;密钥散落在各台笔记本上,Virtual Key 没法统一签发。一台 7×24 在线的云端 Mac mini M4,可以同时承担 LiteLLM Gateway(launchd 常驻)、OpenClaw 执行面、以及 iOS/macOS 原生工具链调试,密钥只写在服务器 .env,笔电只拿受限 Virtual Key。
M4 待机功耗约 4W,长期跑 Gateway 的电费可忽略;Apple Silicon 统一内存让并发 Agent + Proxy 更从容;macOS 的 Gatekeeper、SIP、FileVault 叠加,比典型 Linux VPS 更适合长期托管 API 密钥。按天计费也适合「先验证 ROI、再决定是否常驻」的节奏。
如果你刚算完四层账单、准备搭第一套有熔断的 Agent 基础设施,从一台 VPSSpark 云 Mac 开始——了解套餐方案,让控制面和执行面住在同一台安全、静音的机器上。