AI Agent 비용은 얼마나 드나? 개인부터 팀까지 완전 청구서

지난주 커뮤니티에서 한 1인 개발자가 이렇게 물었습니다. 「OpenClaw 깔고 Cursor Pro도 결제했는데, 월말 정산하니 $180 나왔어요. 정상인가요?」 댓글은 갈렸습니다——「너무 싸다」 vs 「미쳤다」. 둘 다 맞습니다. 말하는 AI Agent 종류가 다르기 때문입니다.

Agent를 「똑똑한 검색창」으로 가끔만 쓰는 사람도 있고, VPS에서 7×24 돌리며 메일 읽고, 코드 고치고, Slack 알림 보내는 사람도 있습니다. 전자는 월 $20로도 버틸 수 있고, 후자는 혼자서도 세 자릿수 달러가 쉽습니다.「AI Agent 얼마?」라는 질문에 부족한 건 답이 아니라, 공통된 비용 산정 기준입니다.

이 글에서는 청구서를 네 층으로 쪼개고, 개인·1인 개발자·소규모 팀 세 구간의 참고 범위를 제시하며, 바로 써먹을 수 있는 자가 진단 공식도 드립니다. 가격은 2026년 중반 주요 벤더 공개 요금 기준이며, 환율은 $1 ≈ ₩1,400으로 대략 잡았습니다. 실제 금액은 각 콘솔 청구서를 기준으로 하세요.

결론 먼저

개인 가벼운 사용은 $15—$40/월；1인 개발자가 Agent를 생산성 중심으로 쓰면 $80—$250/월；3—10명 소규모 팀이 전원 연결하고 백그라운드 작업까지 돌리면 종합 비용 $800—$3,000/월이 흔하고, 인력 검토 시간은 포함하지 않습니다. Token은 보통 40%—70%에 불과하고, 나머지는 구독·인프라·「Agent 실수 고치는 시간」에 숨어 있습니다.

4층

비용 분해
축

5—12×

Agent 모드
호출 배수

~30%

첫 달
「무효 소비」 비율

Token만 보면 안 됩니다: AI Agent 4층 비용 모델

대부분 AI 청구를 계산할 때 Anthropic이나 OpenRouter 콘솔에서 Token 소비만 봅니다. 「Q&A 모드」에서는 그나마 통하지만, Agent에서는 총비용을 크게 과소평가합니다. 스스로 작업을 실행하는 Agent에는 최소 네 층의 지출이 겹칩니다.

층	포함 내용	누가 놓치기 쉬운가
L1 모델 추론	LLM API Token, thinking tokens, 멀티모달 입력	거의 안 놓침——다만 Agent 배수는 과소평가
L2 도구·플랫폼	Cursor Pro, Claude Code, OpenClaw, 벡터 DB, 검색 API	구독과 API를 혼동해 이중 과금
L3 인프라	상시 VPS / 클라우드 Mac, Gateway, 도메인, 객체 스토리지, 로그	「로컬이면 공짜」라고 생각하는 개인 사용자
L4 인력 검토	Agent 출력 확인, 오류 수정, 알림 처리, prompt / 규칙 작성	재무상 0원, 기회비용은 매우 큼

L1은 명시적 비용으로 청구서에 보입니다. L2—L4는 잠재 비용으로, 「AI는 싸야 하는데」와 「월말에 왜 이렇게?」 사이의 간극을 만듭니다. 아래에서 사용 규모별로 풀어 봅니다.

1구간: 개인 가벼운 사용——Agent를 「똑똑한 검색」으로

전형적 프로필: 가끔 Cursor로 코드 보완, 스마트폰 Agent로 메모 정리, 7×24 백그라운드 작업 없음, Slack / Discord 봇 미연결.

이 구간 L1은 낮습니다. 하루 20회 대화, 회당 평균 2,000 tokens(컨텍스트 포함)이면 월 약 1.2M tokens. Sonnet급(입력 $3/M + 출력 $15/M, 입출력 7:3 가정)이면 L1은 $8—$15/월. OpenRouter 요금 페이지의 Haiku / GPT-4o-mini 라우트면 $3—$8까지 줄일 수 있습니다.

L2가 최대 항목인 경우가 많습니다: Cursor Pro 약 $20/월(고속 모델 할당 포함), 또는 Claude Pro $20/월. 구독 할당을 넘긴 분은 그대로 API 과금——처음 예산 초과하는 사람 대부분이 여기입니다.

L3는 개인 구간에서 거의 0: Agent는 노트북에서 돌고, 종료하면 멈춥니다. L4도 무시 가능——출력을 보는 시간은 일반 사용 범위입니다.

개인 가벼운 사용 합계: 약 $15—$40/월(₩21,000—₩56,000). 상한을 가르는 건 Token이 아니라 Cursor·Claude·OpenClaw를 다 구독해 놓고 하나만 쓰는 패턴입니다.

2구간: 1인 개발자——Agent가 생산성의 중심

전형적 프로필: 매일 2—4시간 Cursor Agent나 Claude Code로 코드 수정, OpenClaw / 자작 스크립트가 PR Review·로그 요약·정기 리포트를 백그라운드 처리, 상시 온라인 Gateway나 VPS로 라우팅 통일.

이 구간 L1은 한 단계 뛰어오릅니다. 10명 설문과 자체 청구 샘플 기준, 하루 5—15개 Agent 작업, 작업당 평균 6—10회 LLM 호출, 1회 8,000—15,000 tokens(레포 컨텍스트 포함). 월 Token량 50M—200M이 일반적입니다.

비용 항목	1인 개발자 전형 범위	비고
L1 모델 추론	$40—$150/월	주로 Sonnet, Opus는 필요할 때만
L2 도구 구독	$20—$60/월	Cursor Pro + 선택 Claude Code / OpenClaw
L3 인프라	$5—$50/월	경량 VPS 또는 일과금 클라우드 Mac Gateway
L4 인력 검토	5—10시간/월	$50/h 기회비용 ≈ $250—$500

L4까지 넣으면 진짜 비용은 $300—$700/월；현금 지출(L1—L3)만 보면 $80—$250/월이 흔합니다.

이 구간의 핵심은 Agent 배수입니다. 지시 한 줄에 뒤에서 LLM 8번 호출은 흔한 일입니다. Token은 싸져 가는데 청구는 왜 오를까?에서 다룬 효과——단가가 내려도 배수 체인이 짧아지지 않으면 청구는 계속 오릅니다.

비용을 잡는 최선은 「안 쓰기」가 아니라 Gateway와 예산 차단기를 세우는 것입니다. LiteLLM으로 계층 라우팅(단순 작업 Haiku, 복잡 작업 Sonnet), 도구별 Virtual Key에 월 상한 설정. 구체적 구축은 클라우드 Mac × OpenRouter 실전 가이드를 참고하세요.

3구간: 소규모 팀(3—10명)——Agent가 워크플로에 들어옴

전형적 프로필: 팀 공유 Gateway, Cursor Business 등 좌석 과금, 1—3개 백그라운드 Agent(고객 지원 요약, CI 실패 분석, 문서 동기화), 감사 로그와 키 분리 필요.

소규모 팀 L1은 「1인분 × 인원」이 아닙니다. 초선형으로 늘어납니다——백그라운드 Agent는 인원에 비례하지 않고, 팀원끼리 Agent를 연쇄 호출합니다(A의 PR이 Review Bot을 깨우고, B의 Bot이 테스트 Agent를 부름).

대략: 5명 팀, 각자 하루 10 Agent 작업이면 월 Token량 500M—2B. 혼합 라우트 평균 $2/M이면 L1만 $1,000—$4,000/월. 라우팅 없이 전원 Sonnet + Opus 기본이면 두 배도 흔합니다.

L2는 인당 과금: Cursor Business 약 $40/인/월 × 5 = $200；Claude Team이나 전용 Agent 플랫폼 추가 시 +$100—$300. L3: 상시 Gateway 머신(클라우드 Mac 또는 VPS) $20—$80/월, 로그 스토리지·벡터 DB(Pinecone / 자체 pgvector) $20—$100/월.

L4는 소규모 팀에서 심하게 과소평가됩니다. 관찰상 처음 3개월, 주 2—4시간을 「Agent 고치기」에 씁니다——prompt 조정, 오탐 처리, 신입에게 Bot 설명. 5명 팀에서 Tech Lead가 겸하면 월 8—16시간 × $80/h ≈ $640—$1,280 기회비용.

소규모 팀이 자주 밟는 함정

각자 마스터 API Key를 직결하고 Gateway 통합 라우팅 없음——5명 5계통 과금이라 총량을 아무도 모름；누군가 실험 스크립트에 max_retries 끄는 걸 잊어 flaky test 한 번에 $200+ 소모. 3명 넘기 전에 Gateway를 깔아 두지 않으면 이전·추적 비용이 더 커집니다.

소규모 팀 현금 지출(L1—L3)은 $800—$3,000/월；L4 기회비용 포함 시 $1,500—$5,000/월. Agent가 0.5명분 주니어 운영이나 20% 고객 지원 공수를 대체하면 ROI는 성립합니다——다만 재무와 엔지니어링이 같은 기준으로 계산할 때입니다.

4층 아래 숨은 「안 보이는 세 가지 비용」

4층 모델 외에 예산 회의에서 자주 빠지는 비용 세 가지가 있습니다.

실패·재시도 세금. Agent는 도구 호출 실패 시 재시도하고, 모호한 지시면 여러 라운드 확인합니다. 「1번이면 될 일」이 Agent 모드에서 5—12번 호출로 부풀어 오르는 건 일상입니다. Anthropic 공식 요금에 따르면 thinking 모드 내부 추론 tokens도 과금——「깊은 분석」 한 번이 생각의 5—10배가 될 수 있습니다.

컨텍스트 팽창 세금. Agent 프레임워크는 「매번 풀 컨텍스트」를 실어 나르기 쉽습니다——레포 전체, 대화 기록, 모든 도구 정의. 500KB 소스 파일은 약 125K tokens, prompt에 한 번 넣으면 가벼운 사용자 반달 할당량이 날아갑니다. 컨텍스트를 자르지 않으면 라우팅으로 아껴도 소용없습니다.

콜드스타트·이전 세금. 모델 교체, Agent 프레임워크 교체, 로컬→클라우드 이전——처음 2주 디버깅 소비는 안정 운영기의 2—3배가 흔합니다. 예산에 「실험 라인」을 따로 두고, 프로덕션과 상한 없는 API Key를 공유하지 마세요.

자가 진단 공식: 30초 만에 월 Agent 청구 대략 계산

아래 네 변수를 넣으면 L1 현금 비용의 거친 추정(단위: 달러/월)을 얻을 수 있습니다.

월 Token 비용 추정

# 변수
                D = 하루 Agent 작업 수
                M = 작업당 평균 LLM 호출 횟수(배수, 5—12가 전형)
                T = 호출당 평균 Token 수(입출력 합, 8K—20K가 전형)
                P = 혼합 라우트 후 실효 단가($/M tokens, 1.5—4가 전형)

                # 공식
                월 Token 비용 ≈ D × M × T × 30 × P / 1,000,000

                # 예: 1인 개발자
                # D=10, M=8, T=12000, P=2.5 → 10×8×12000×30×2.5/1M = $72/월(L1만)

                # L2+L3 더하고 ×1.3으로 실패·재시도 여유
                월 현금 총비용 ≈ 월 Token 비용 × 1.3 + L2 구독 + L3 인프라

L1이 $30인데 카드가 $120면, 차이는 거의 L2(구독 + 초과 API)와 L3(인지 못한 상시 머신)에 있습니다. 각 플랫폼 콘솔에서 「날짜」가 아니라 「서비스」별로 대조하면 누수가 바로 보입니다.

청구를 통제하기: 세 구간 전략, 인원 일괄 적용은 피하세요

개인: 주력 도구 구독은 하나로, API는 단일 Gateway 또는 각사 콘솔 hard limit. 클라우드는 필수는 아니지만 OpenRouter / Anthropic 월 credit cap은 필수입니다.

1인 개발자: 오후 반나절 LiteLLM + Virtual Key 구축할 가치 있습니다. Cursor, 스크립트, OpenClaw를 Key별로 나누고 각 $20—$50/월 상한. Gateway는 상시 온라인 머신에——노트북이 슬립하면 Agent가 실패하고 재시도 지옥이 가장 비쌉니다.

소규모 팀: 필수 3종: ① per-user Virtual Key + spend cap；② 모델 계층 라우트(fast / smart / deep 세 별칭)；③ 주간 spend 리포트와 업스트림 청구 대조. 기술 선택은 LiteLLM Virtual Keys 문서가 최소 거버넌스를 커버；마스터 키는 Gateway 머신에만, 클라이언트에는 내리지 않습니다.

아끼기보다 「제대로 쓰기」

spend 모니터링을 도입한 팀은 첫 달에 20%—30% 무효 소비를 줄이는 경우가 많습니다——아무도 안 읽는 Agent 출력, 매번 풀 컨텍스트 실어 나르는 스크립트, cron에 남은 옛 작업 등. 남은 예산은 「확실히 매출에 기여하는」Agent 워크플로에 쓰고, 모델 일괄 다운그레이드는 피하세요.

마지막 질문: 값어치는 Token 단가가 아니라 ROI로

서두의 $180 1인 개발자——Agent로 주 6시간 테스트 수정·PR 설명을 줄이면 $50/h 기준 월 $1,200 상당. $180 청구 ROI는 6.7배입니다. 비싼 채팅창 하나 더 생긴 것뿐이면, 확실히 비쌉니다.

AI Agent 비용 구조상 청구액은 「AI를 쓰는지」가 아니라 「배수 체인 길이·컨텍스트 두께·예산 차단기 유무」가 정합니다. 개인은 $40 이내 충분히 가능；1인 개발자가 Gateway를 갖추면 $150 전후로 편합니다；소규모 팀은 거버넌스 없으면 네 자릿수가 일상이지만, 거버넌스 후에는 기능을 깎지 않고 낭비 3분의 1을 줄일 수 있습니다.

다음 질문은 「Agent가 비싼가?」가 아니라 「4층 청구의 각 1달러가 어떤 측정 가능한 산출에 대응하는가?」입니다. 이에 답할 수 있으면 이미 90% 팀보다 냉정합니다.

FAQ

Cursor Pro만 쓰고 API를 따로 안 사도 Agent 비용에 포함? 포함합니다. 구독과 초과 API는 별도 장부에. Cursor Pro fast requests 할당은 Agent 모드에서 빨리 소진되고, 초과분은 API 단가——「정액 unlimited」로 오해해 월말 추가 청구, 이 패턴이 많습니다.

자체 Ollama면 제로 비용? API 현금은 거의 0이지만, 하드 감가·전기·튜닝 시간은 비용입니다. Mac mini M4로 7B—14B는 전기비 낮지만, 복잡 Agent는 클라우드 대형 모델로 폴백하는 Hybrid가 흔합니다.

팀은 모델 다운그레이드와 Gateway 중 뭐를 먼저? Gateway 먼저. 다운그레이드는 1회성 최적화；Virtual Key·라우트·차단기는 체계적 거버넌스. Gateway 없으면 누가 어떤 작업에 얼마 썼는지 영원히 모릅니다.

모델 값이 내려가면 Agent 비용도 계속 내려갈까? 단가는 내리지만 Jevons 효과로 사용량은 더 빨리 늘고, 배수 체인도 길어집니다. 장기적으로 거버넌스 구조가 모델 단가보다 청구에 더 큰 영향을 줍니다.