チャットは残っているのに、なぜ忘れる？

原文は残ってもルールは残らない。抽出・検索・失効がなければ新セッションに制約は載らない。

ChatGPT Memoryだけで足りる？

単一チャットアプリなら可。IM・IDE・cronのエージェントには別のAI Memory層が要る。

AIエージェントを3週間動かしたのに、まるで物忘れ

先週、Telegram 上のエージェントに既存顧客のフォローを任せた。ログは全部残る、コンテキストも巨大、ChatGPT の Memory までオン——完璧だと思っていた。

3週間後、フォローメールを送る直前にこう聞かれた：

「どちらの会社でしたっけ？プロジェクトの背景をもう一度教えてください。」

顧客がスクリーンショットを共有チャンネルに投げてきた。その瞬間、はっきりした：チャットを覚えているだけで、関係性を覚えているわけではない。 パイロット顧客に同じ話をすると、全員うなずく——負けているのは「頭の悪いモデル」ではなく、チャット履歴をAgent Memoryだと思い込んでいたからだ。

以下は OpenClaw で試行錯誤した話。用語集ではなく現場のシナリオと、AI Memory（システムがどう保存するか）とチャット UI の history をどう分けたか。OpenHuman vs ChatGPT Memory（4層スタック）、IDE 向けは Karpathy のコンテキスト階層。

シナリオ1：ログは残っているのに、ルールだけ消える

B2B サポートチームから、ほぼ同じ苦情が来た。

3週目、顧客は「見積は PDF のみ。Excel は不要」と明言。エージェントは「承知、記録しました」。管理画面で確認——会話は一字一句残っている、「PDF」も検索できる。

3か月後、Excel 添付の見積が届く。顧客は激怒：「ちゃんと見てるの？」

モデルがバカなのではない。検索可能で強制実行できる Memory に入っていない。 雑談や誤 CC と混ざった数万字の中に埋もれ、新セッションでは「顧客 A = PDF のみ」が prompt 先頭に来ない。

チャット履歴は監査用の証跡。Agent Memory は次の判断のための状態——CRM の「Excel 禁止」フラグであって、毎回3時間の録音を聞き直すものではない。

シナリオ2：100万トークンでも Claude Code は同じ仕事をやり直す

Claude Code では別の失敗をした。

monorepo の架構ドキュメントを2日かけて作成。「ウィンドウがデカいから次でいいや」と思い込んだ。

2週間後、新セッションで「前のリポのドキュ作業を続けて」。また最初から走査し、似た構成で書き直した。 チャットの一部は残るが、タスク状態は残らない——どのサブモジュールまで終わったか、docs/ に何が入ったかはツール出力とディスク側にある。

Karpathy の「無限コンテキストを HDD にするな」が腑に落ちた。AI Memory に入れるべきは更新可能な1行チェックポイントで、tool stdout 2万行ではない。

LangGraph の memory と thread state の分離も同じ方向。メッセージリスト ≠ メモリストア。

エージェントが本当に覚えるべき3つ（平易に）

誰で、何が禁止か——顧客 A は PDF のみ、上司は長い音声が嫌、チームは UTC。
前回どこまでか——Issue #482 は法務待ち、昨夜のアラートは ack 済み未分析、ドキュは第3章まで。
次はどう進めるか——リリース checklist、承認フロー、オンコール順。

チャット履歴は1つ目にたまに当たるだけ。設計書では Semantic / Episodic / Procedural と呼ぶ——欠けた桶で恥をかく。

実際に踏んだ坑：全会話をベクトル化

OpenClaw 初期は手抜きで全文 embedding。1か月後、半年前の廃止済みデプロイ手順を現行 SOP として復活させた。

本当に難しいのは書き込みではなく削除・更新・境界。今は source / created_at / expiry 必須。顧客・プロジェクトで絞ってから時間減衰——これだけで「でたらめな社内ルール」は減った。銀の弾丸ではないが、提案書に書く唯一の実戦知見だ。

MCP の結論だけ Memory に。仕様は Model Context Protocol。

ChatGPT Memory で足りる？「エージェント」の定義次第

ChatGPT Memory はチャット派には便利。だが Slack・Telegram・cron・IDE に広がると Memory は OpenAI アプリの中に閉じる。スタック全体の整理：ChatGPT は口調、OpenHuman 系は仕事の事実、OpenClaw + MCP は実行。チャットだけなら Memory で足りる。働くエージェントには AI Memory 層が要る。

長期運用では：記憶の次は「生き残り」

Memory を直しても次は夜を越せない——蓋を閉じる、Wi-Fi が切れる、MCP が kill される。朝の cron が動かない。ストアにレコードはあるのにエージェントがいないような違和感。

三層で話す：記憶層、実行層（VPS 上の OpenClaw Gateway）、ツール層（重い MCP と xcodebuild を寝るノートPCから追い出す）。Memory は Mac/NAS、ゲートウェイは Linux VPS、ビルドはクラウド Mac——Archive が vault 同期を止めた経験があるからで、売り文句ではない。VPS 上の Gateway 構築。

よくある質問

ログは残っているのに忘れるのはなぜ？

原文は残ってもルールは残らない。抽出・検索・失効がなければ新セッションに載らない。

PDF を RAG に突っ込めば足りる？

ドキュの中身は答えられるが、「チケットはどこで止まったか」「この手順は廃止か」は別。AI Memory の一层にとどめる。

個人の最小構成は？

ChatGPT のみ → Memory。Telegram/IDE → ローカル Memory + OpenClaw。cron を信頼 → VPS。Memory なしの 7×24 は忘れっぽい自動化だけが増える。