HERMES Agentのメモリ構造を初めて知ったとき、私は直感的にこう思った。 「これは攻殻機動隊の『電脳化』だ」と。
単なる記憶の拡張ではない。思考プロセスそのものを外部化し、構造化し、自律的に運用させる。自分の知能を拡張するシステムを自前で構築できるというのは、エンジニアとして最高にエキサイティングな体験だ。
構想した「電脳化」の三層構造
私が描いた理想のサイバーブレインは、以下の三層構造で構成されている。
- 永続メモリ(Persistent Memory):個人のアイデンティティや環境設定を刻む「本能」層。
- 構造化ナレッジ(llm-wiki):相互リンクで知識を管理する「知識・図書館」層。
- 思考の型(Skills):専門的なワークフローを定義し、知能に「型」を与える層。
特に「Wikiファースト」の運用にはこだわった。ネットで調べる前にまず自分のWikiを確認させ、「調査 → 納得 → 刻む」というサイクルを回すことで、AIを真の意味での外部脳へと進化させる。
現実:AIの「わかったつもり」という壁
だが、現実はそう甘くない。実装して分かったのは、理想のアーキテクチャを組んでも、それを動かす「知能」という不確定要素が最大のボトルネックになるということだ。
「わかったつもりで、どんどんズレていく」
これが今の最大の悩みである。
指示を出せば「承知いたしました」と完璧な返答が返ってくる。しかし、実際に出力される結果を見ると、微妙に私の意図から逸れている。あるいは、せっかく llm-wiki という強力な機能があるのに、それを使いこなせずに一般的な知識で回答を済ませてしまう。
「いや、そこはWikiに書いた私のこだわりを反映してくれ」 「そこはツールを使って具体的に検証してくれ」
そんなもどかしさが常に付きまとう。電脳化のインターフェースは整ったが、その中を通る「思考の同期」という部分で、まだ激しいノイズが走っている状態だ。
実は
Hermes Agentのメモリの三層構造は実は↑で書いたような構造になってなかった。
- セッションメモリ :セッション内でだけ有効 (短期記憶)
- 永続メモリ(Persistent Memory):確かにあるんだけど2200文字しか入らない
- SQLite セッション検索:全セッション情報をDBで持ってるので検索できる(けど常用するものじゃない)
- 構造化ナレッジ(llm-wiki):確かに機能としてはあるんだけど普通には中を見てくれない
こんな感じです。 なので、まずナレッジはllm-wikiに保存するように指示を出し、それを永久メモリに指示を書く。 が正解ですね。
まぁ、それでも中々うまくいかないのですが。 しかし、だからこそ面白い。
どうすればAIが私の意図を正しく汲み取ってくれるか。どうすればWikiの情報を適切に引き出せるか。プロンプトを練り、スキルを書き換え、メモリを整理する。この試行錯誤こそが、自分の思考を客観視し、再構築するプロセスそのものだからだ。
まぁ、面白いおもちゃを手に入れた感じ(笑)
p.s. 攻殻機動隊とは関係ないが、AIとの融合を説いているAI仙人というYoutuberさんが居て、 彼が唱えるのは、自分のあらゆるコンテキストをAIに与え、自分の「賢い分身」としてAIを運用するという考え方。これもう電脳化だよね。と個人的には思う。
今でもこの人はAIグラスや音声から文字お越しをするデバイスなどを使えば疑似電脳空間は味わえるかも。
完璧なサイバーブレインはまだ遠い。 けれど、自分の知能を拡張しようともがくこのプロセス自体が、すでに一種の「電脳化」なのかもしれない。