VPSSpark ブログ
← 開発日記に戻る

AIエージェントを3週間動かしたのに、まるで物忘れ

OpenClawメモ · 2026.06.03 · 読了目安 約12分

ストックホルム公共図書館の外観——長期知識を蓄える AI Memory のメタファー(Agent Memory)
図書館の比喩:チャット履歴ではなく、検索できる AI Memory に知識を蓄える話。

先週、Telegram 上のエージェントに既存顧客のフォローを任せた。ログは全部残る、コンテキストも巨大、ChatGPT の Memory までオン——完璧だと思っていた。

3週間後、フォローメールを送る直前にこう聞かれた:

「どちらの会社でしたっけ?プロジェクトの背景をもう一度教えてください。」

顧客がスクリーンショットを共有チャンネルに投げてきた。その瞬間、はっきりした:チャットを覚えているだけで、関係性を覚えているわけではない。 パイロット顧客に同じ話をすると、全員うなずく——負けているのは「頭の悪いモデル」ではなく、チャット履歴Agent Memoryだと思い込んでいたからだ。

以下は OpenClaw で試行錯誤した話。用語集ではなく現場のシナリオと、AI Memory(システムがどう保存するか)とチャット UI の history をどう分けたか。OpenHuman vs ChatGPT Memory(4層スタック)、IDE 向けは Karpathy のコンテキスト階層

シナリオ1:ログは残っているのに、ルールだけ消える

B2B サポートチームから、ほぼ同じ苦情が来た。

3週目、顧客は「見積は PDF のみ。Excel は不要」と明言。エージェントは「承知、記録しました」。管理画面で確認——会話は一字一句残っている、「PDF」も検索できる。

3か月後、Excel 添付の見積が届く。顧客は激怒:「ちゃんと見てるの?」

モデルがバカなのではない。検索可能で強制実行できる Memory に入っていない。 雑談や誤 CC と混ざった数万字の中に埋もれ、新セッションでは「顧客 A = PDF のみ」が prompt 先頭に来ない。

チャット履歴は監査用の証跡Agent Memory次の判断のための状態——CRM の「Excel 禁止」フラグであって、毎回3時間の録音を聞き直すものではない。

シナリオ2:100万トークンでも Claude Code は同じ仕事をやり直す

Claude Code では別の失敗をした。

monorepo の架構ドキュメントを2日かけて作成。「ウィンドウがデカいから次でいいや」と思い込んだ。

2週間後、新セッションで「前のリポのドキュ作業を続けて」。また最初から走査し、似た構成で書き直した。 チャットの一部は残るが、タスク状態は残らない——どのサブモジュールまで終わったか、docs/ に何が入ったかはツール出力とディスク側にある。

Karpathy の「無限コンテキストを HDD にするな」が腑に落ちた。AI Memory に入れるべきは更新可能な1行チェックポイントで、tool stdout 2万行ではない。

LangGraph の memory と thread state の分離も同じ方向。メッセージリスト ≠ メモリストア。

エージェントが本当に覚えるべき3つ(平易に)

  • 誰で、何が禁止か——顧客 A は PDF のみ、上司は長い音声が嫌、チームは UTC。
  • 前回どこまでか——Issue #482 は法務待ち、昨夜のアラートは ack 済み未分析、ドキュは第3章まで。
  • 次はどう進めるか——リリース checklist、承認フロー、オンコール順。

チャット履歴は1つ目にたまに当たるだけ。設計書では Semantic / Episodic / Procedural と呼ぶ——欠けた桶で恥をかく

実際に踏んだ坑:全会話をベクトル化

OpenClaw 初期は手抜きで全文 embedding。1か月後、半年前の廃止済みデプロイ手順を現行 SOP として復活させた。

本当に難しいのは書き込みではなく削除・更新・境界。今は source / created_at / expiry 必須。顧客・プロジェクトで絞ってから時間減衰——これだけで「でたらめな社内ルール」は減った。銀の弾丸ではないが、提案書に書く唯一の実戦知見だ。

MCP の結論だけ Memory に。仕様は Model Context Protocol

ChatGPT Memory で足りる?「エージェント」の定義次第

ChatGPT Memory はチャット派には便利。だが Slack・Telegram・cron・IDE に広がると Memory は OpenAI アプリの中に閉じる。スタック全体の整理:ChatGPT は口調、OpenHuman 系は仕事の事実、OpenClaw + MCP は実行。チャットだけなら Memory で足りる。働くエージェントには AI Memory 層が要る。

長期運用では:記憶の次は「生き残り」

Memory を直しても次は夜を越せない——蓋を閉じる、Wi-Fi が切れる、MCP が kill される。朝の cron が動かない。ストアにレコードはあるのにエージェントがいないような違和感。

三層で話す:記憶層実行層(VPS 上の OpenClaw Gateway)、ツール層(重い MCP と xcodebuild を寝るノートPCから追い出す)。Memory は Mac/NAS、ゲートウェイは Linux VPS、ビルドはクラウド Mac——Archive が vault 同期を止めた経験があるからで、売り文句ではない。VPS 上の Gateway 構築

よくある質問

ログは残っているのに忘れるのはなぜ?

原文は残ってもルールは残らない。抽出・検索・失効がなければ新セッションに載らない。

PDF を RAG に突っ込めば足りる?

ドキュの中身は答えられるが、「チケットはどこで止まったか」「この手順は廃止か」は別。AI Memory の一层にとどめる。

個人の最小構成は?

ChatGPT のみ → Memory。Telegram/IDE → ローカル Memory + OpenClaw。cron を信頼 → VPS。Memory なしの 7×24 は忘れっぽい自動化だけが増える。

「物忘れ」エージェントを直しているなら

順番は変わらない:何を覚え、どう消すかOpenClaw で読むVPS / クラウド Mac を分ける。VPSSpark はその第三段——長時間ゲートウェイと CI 用 Mac 島。チャット ≠ メモリを受け入れた後の話だ。

Mac クラウドプラン または トップ。クラウドがなくても、ユーザー・進捗・手順の3つを書き出す——それが最初の一歩だ。

期間限定

記憶は直した。今夜もエージェントは生き残れる?

OpenClaw · Memory · ゲートウェイ · クラウドMac

ホームへ
期間限定 プランを見る