先週、Telegram 上のエージェントに既存顧客のフォローを任せた。ログは全部残る、コンテキストも巨大、ChatGPT の Memory までオン——完璧だと思っていた。
3週間後、フォローメールを送る直前にこう聞かれた:
「どちらの会社でしたっけ?プロジェクトの背景をもう一度教えてください。」
顧客がスクリーンショットを共有チャンネルに投げてきた。その瞬間、はっきりした:チャットを覚えているだけで、関係性を覚えているわけではない。 パイロット顧客に同じ話をすると、全員うなずく——負けているのは「頭の悪いモデル」ではなく、チャット履歴をAgent Memoryだと思い込んでいたからだ。
以下は OpenClaw で試行錯誤した話。用語集ではなく現場のシナリオと、AI Memory(システムがどう保存するか)とチャット UI の history をどう分けたか。OpenHuman vs ChatGPT Memory(4層スタック)、IDE 向けは Karpathy のコンテキスト階層。
シナリオ1:ログは残っているのに、ルールだけ消える
B2B サポートチームから、ほぼ同じ苦情が来た。
3週目、顧客は「見積は PDF のみ。Excel は不要」と明言。エージェントは「承知、記録しました」。管理画面で確認——会話は一字一句残っている、「PDF」も検索できる。
3か月後、Excel 添付の見積が届く。顧客は激怒:「ちゃんと見てるの?」
モデルがバカなのではない。検索可能で強制実行できる Memory に入っていない。 雑談や誤 CC と混ざった数万字の中に埋もれ、新セッションでは「顧客 A = PDF のみ」が prompt 先頭に来ない。
チャット履歴は監査用の証跡。Agent Memory は次の判断のための状態——CRM の「Excel 禁止」フラグであって、毎回3時間の録音を聞き直すものではない。
シナリオ2:100万トークンでも Claude Code は同じ仕事をやり直す
Claude Code では別の失敗をした。
monorepo の架構ドキュメントを2日かけて作成。「ウィンドウがデカいから次でいいや」と思い込んだ。
2週間後、新セッションで「前のリポのドキュ作業を続けて」。また最初から走査し、似た構成で書き直した。 チャットの一部は残るが、タスク状態は残らない——どのサブモジュールまで終わったか、docs/ に何が入ったかはツール出力とディスク側にある。
Karpathy の「無限コンテキストを HDD にするな」が腑に落ちた。AI Memory に入れるべきは更新可能な1行チェックポイントで、tool stdout 2万行ではない。
LangGraph の memory と thread state の分離も同じ方向。メッセージリスト ≠ メモリストア。
エージェントが本当に覚えるべき3つ(平易に)
- 誰で、何が禁止か——顧客 A は PDF のみ、上司は長い音声が嫌、チームは UTC。
- 前回どこまでか——Issue #482 は法務待ち、昨夜のアラートは ack 済み未分析、ドキュは第3章まで。
- 次はどう進めるか——リリース checklist、承認フロー、オンコール順。
チャット履歴は1つ目にたまに当たるだけ。設計書では Semantic / Episodic / Procedural と呼ぶ——欠けた桶で恥をかく。
実際に踏んだ坑:全会話をベクトル化
OpenClaw 初期は手抜きで全文 embedding。1か月後、半年前の廃止済みデプロイ手順を現行 SOP として復活させた。
本当に難しいのは書き込みではなく削除・更新・境界。今は source / created_at / expiry 必須。顧客・プロジェクトで絞ってから時間減衰——これだけで「でたらめな社内ルール」は減った。銀の弾丸ではないが、提案書に書く唯一の実戦知見だ。
MCP の結論だけ Memory に。仕様は Model Context Protocol。
ChatGPT Memory で足りる?「エージェント」の定義次第
ChatGPT Memory はチャット派には便利。だが Slack・Telegram・cron・IDE に広がると Memory は OpenAI アプリの中に閉じる。スタック全体の整理:ChatGPT は口調、OpenHuman 系は仕事の事実、OpenClaw + MCP は実行。チャットだけなら Memory で足りる。働くエージェントには AI Memory 層が要る。
長期運用では:記憶の次は「生き残り」
Memory を直しても次は夜を越せない——蓋を閉じる、Wi-Fi が切れる、MCP が kill される。朝の cron が動かない。ストアにレコードはあるのにエージェントがいないような違和感。
三層で話す:記憶層、実行層(VPS 上の OpenClaw Gateway)、ツール層(重い MCP と xcodebuild を寝るノートPCから追い出す)。Memory は Mac/NAS、ゲートウェイは Linux VPS、ビルドはクラウド Mac——Archive が vault 同期を止めた経験があるからで、売り文句ではない。VPS 上の Gateway 構築。
よくある質問
ログは残っているのに忘れるのはなぜ?
原文は残ってもルールは残らない。抽出・検索・失効がなければ新セッションに載らない。
PDF を RAG に突っ込めば足りる?
ドキュの中身は答えられるが、「チケットはどこで止まったか」「この手順は廃止か」は別。AI Memory の一层にとどめる。
個人の最小構成は?
ChatGPT のみ → Memory。Telegram/IDE → ローカル Memory + OpenClaw。cron を信頼 → VPS。Memory なしの 7×24 は忘れっぽい自動化だけが増える。
「物忘れ」エージェントを直しているなら
順番は変わらない:何を覚え、どう消すか → OpenClaw で読む → VPS / クラウド Mac を分ける。VPSSpark はその第三段——長時間ゲートウェイと CI 用 Mac 島。チャット ≠ メモリを受け入れた後の話だ。
Mac クラウドプラン または トップ。クラウドがなくても、ユーザー・進捗・手順の3つを書き出す——それが最初の一歩だ。