지난주 Telegram 에이전트에게 기존 고객 팔로업을 맡겼다. 대화는 다 남고, 컨텍스트도 크고, ChatGPT Memory까지 켰다—준비 끝이라 생각했다.
3주 뒤 팔로업 메일 직전, 이렇게 물었다.
「어느 회사셨죠? 프로젝트 배경을 다시 알려주실 수 있을까요?」
고객이 스크린샷을 공유 채널에 올렸다. 그때 확실해졌다: 채팅을 기억하는 것과 관계를 기억하는 것은 다르다. 파일럿 팀에 같은 이야기를 하면 모두 고개를 끄덕인다—모델이 멍청해서가 아니라 채팅 기록을 Agent Memory로 착각했기 때문이다.
아래는 OpenClaw에서 고친 과정이다. 용어집이 아니라 현장 시나리오, 그리고 AI Memory(시스템 저장)와 채팅 UI history의 구분. OpenHuman vs ChatGPT Memory 4계층 스택, IDE는 Karpathy 컨텍스트 계층.
시나리오 1: 로그는 있는데 규칙만 사라진다
B2B 지원팀에서 거의 똑같은 이야기를 들었다.
3주차 고객: 「견적은 PDF만, Excel 말고.」 에이전트: 「네, 기록했습니다.」 관리자 확인—대화는 한 글자도 안 빠짐, 「PDF」 검색도 됨.
3개월 뒤 Excel 견적 발송. 고객 폭발: 「제대로 보고 있는 거 맞아요?」
모델 문제가 아니다. 그 문장이 검색·강제 가능한 Memory에 들어가지 않았다. 잡담·잘못된 참조와 섞인 수만 자 속에 묻혀, 새 세션에서 「고객 A = PDF만」이 prompt 맨 위로 오지 않는다.
채팅 기록은 감사용 증거. Agent Memory는 다음 결정용 상태—CRM의 「Excel 금지」 플래그지, 매번 3시간 통화 녹음을 듣는 게 아니다.
시나리오 2: 백만 토큰도 Claude Code 중복 작업을 막지 못했다
Claude Code에서 다른 실패를 겪었다.
monorepo 아키텍처 문서—이틀 작업. 「창 크니까 다음에 이어가지」.
2주 뒤 새 세션: 「저번 repo 문서 작업 계속해.」 또 처음부터 스캔하고 비슷한 개요를 씀. 채팅 일부는 남지만 작업 상태는 없음—어느 서브모듈까지 했는지, docs/에 뭐가 들어갔는지는 도구 출력·디스크 쪽.
Karpathy의 「무한 컨텍스트를 HDD로 쓰지 마라」가 와닿았다. AI Memory에는 한 줄짜리 갱신 가능 체크포인트가 들어가야지, tool stdout 2만 줄이 아니다.
LangGraph memory vs thread state도 같은 방향. 메시지 목록 ≠ 메모리 저장소.
에이전트가 진짜 기억할 세 가지
- 누구인지, 하드 룰—고객 A PDF만, 상사는 긴 음성 싫어함, 팀은 UTC.
- 어디까지 했는지—Issue #482 법무 대기, 어젯밤 알림 ack·원인 미해결, 문서 3장까지.
- 다음에 어떻게—릴리스 체크리스트, 승인선, 온콜 순서.
채팅은 첫 번째에 가끔 걸릴 뿐. 설계 문서에서는 Semantic / Episodic / Procedural—빠진 통에서 망신한다.
우리가 밟은 함정: 전 대화 벡터화
초기 OpenClaw는 전문 embedding으로 때움. 한 달 뒤 반년 전 폐기 배포 절차가 현행 SOP로 부활.
어려운 건 저장이 아니라 삭제·수정·경계. 지금은 source / created_at / expiry 필수. 고객·프로젝트 필터 후 시간 감쇠—허구 정책이 줄었다. 제안서에 넣는 실전 교훈 하나뿐이다.
MCP 결론만 Memory에. Model Context Protocol.
ChatGPT Memory로 충분한가?
ChatGPT Memory는 채팅-only에 좋다. Slack·Telegram·cron·IDE로 나가면 Memory는 OpenAI 앱 안에 갇힌다. 스택 정리: ChatGPT=톤, OpenHuman=업무 사실, OpenClaw+MCP=실행. 채팅만이면 Memory로 됨. 일하는 에이전트는 AI Memory 계층이 필요.
장기 운영: 기억 다음은 생존
Memory 고친 뒤 밤을 못 넘기는 경우가 많다—뚜껑 닫힘, Wi-Fi 끊김, MCP kill. 아침 cron 미실행. 저장소엔 있는데 에이전트는 없는 느낌.
세 층: 기억, 실행(VPS OpenClaw Gateway), 도구(무거운 MCP·xcodebuild를 자는 노트북에서 분리). Memory는 Mac/NAS, 게이트웨이는 Linux VPS, 빌드는 클라우드 Mac. VPS Gateway 배포.
자주 묻는 질문
채팅 저장했는데 왜 잊나요?
원문은 남지만 규칙은 안 남습니다. 추출·검색·만료 없으면 새 세션에 안 실립니다.
PDF만 RAG에 넣으면 되나요?
문서 내용은 됩니다. 「티켓 어디서 멈췄나」「이 런북 폐기인가」는 별도. RAG는 AI Memory의 한 층입니다.
1인 개발 최소 스택?
ChatGPT만 → Memory. Telegram/IDE → 로컬 Memory + OpenClaw. cron → VPS. Memory 없이 7×24는 잊깁고 피곤한 자동화만 늘어납니다.
「건망증」 에이전트를 고치는 중이라면
순서: 무엇을 기억·어떻게 삭제 → OpenClaw 연동 → VPS/클라우드 Mac 분리. VPSSpark는 세 번째—게이트웨이·CI용 Mac 섬. 채팅 ≠ 메모리를 인정한 뒤 이야기다.
Mac 클라우드 요금 · 홈. 클라우드 없어도 사용자·진행·절차 세 가지를 적어라—그게 첫걸음이다.