ファイルは人間とエージェントが相互作用するインターフェースです
46日前原文(madalitso.me)
概要
- AIエージェント分野でファイルシステムの再評価が進行中
- ファイルによる永続的な文脈管理の重要性と課題
- 標準化やフォーマットの分断問題
- ファイル vs データベースの役割分担の現状
- 個人コンピューティングの未来とファイルシステムの価値
AIエージェントとファイルシステムの再発見
- かつてベクターデータベース企業で「AI用途に特化したデータベース」の必要性を伝える仕事を担当
- 現在、AIエージェント業界でファイルシステム活用への関心が急速に高まっている状況
- LlamaIndexの「Files Are All You Need」やLangChain、Oracleなどがファイルシステムとデータベースの比較・活用を議論
- Jerry Liu(LlamaIndex)は「多機能エージェントより少数ツール+ファイルシステム」の時代を指摘
- Karpathyは「Claude Codeが成功する理由はローカル環境で動作し、ユーザーデータや文脈に直接アクセスできる点」と分析
- 実際のAI活用の大半がコーディングエージェントであり、CLIツールとしてのClaude Codeが商業的にも成功
文脈ウィンドウと記憶の違い
- LLMのコンテキストウィンドウは「記憶」ではなく、ホワイトボードのような一時的なもの
- Claude Codeの「context left until auto-compact」通知が示すように、文脈が圧縮・消失する不安
- ファイルシステムは「書き残し・後から読み返す」ことで永続的な文脈を実現
- CLAUDE.mdやaboutme.mdなど、エージェントが読める文脈ファイルが普及
- しかし、ETH Zürichの論文によると「文脈ファイルがタスク成功率を下げ、推論コストを増加させる」場合も
- エージェントがファイルを過剰に参照し、目的達成が遅延
- 文脈ファイルは最小限・必要十分な要件に絞るべきとの結論
ファイルフォーマットの標準化とAPI化
- 現在、CLAUDE.mdやAGENTS.md、copilot-instructions.mdなど多様な文脈ファイル形式が乱立
- Dan Abramovの「ソーシャルファイルシステム」論は「ファイルフォーマット=API」の考え方を強調
- 各アプリが自分の形式をネームスペースで管理し、競合を回避
- データベースは各アプリの「フォルダの派生データ」として機能
- エージェント文脈ファイルも「統一」より「共存と非衝突」が重要
- AnthropicのSKILL.md形式は、MicrosoftやOpenAIなど複数社が採用するオープン標準へ
- NanoClawは「スキル=ファイル」として、ポータブル・監査可能・合成可能な仕組みを実現
- MarkdownやSKILL.mdを理解できれば、パートナーシップや標準化会議不要で機能共有が可能
ボトルネックの変化とファイルvsデータベース
- 従来は「ストレージがボトルネック」だったが、現在は「文脈がボトルネック」
- モデル自体は十分賢いが「記憶力が弱い」ため、ファイルシステムが永続的文脈管理に有効
- ファイルシステムはインターフェースとして優秀だが、同時アクセス・大規模検索・重複排除等ではデータベースが必要
- ファイル=人間とエージェントの窓口、データベース=基盤という棲み分けが現実的
ファイルシステムと個人コンピューティングの未来
- ファイルシステムは「個人コンピューティング」の再定義をもたらす可能性
- データや文脈、スキル、記憶がユーザー所有のフォーマットで保存
- aboutme.mdはどのAIエージェントでも利用可能
- スキルファイルやプロジェクト文脈がツール間で持ち運び可能
- ファイルは「オープンプロトコル」として、アプリ間の相互運用性レイヤーに
- 標準化や相互運用の理想と現実のギャップも存在
- CLAUDE.mdやAGENTS.mdなどの分断
- 良い文脈ファイルを作る難しさ、悪いファイルは逆効果という課題
- Dan Abramovの「記憶や設計はソフトウェアの寿命を超えるべき」という価値観
- ファイルシステムは「最良の技術」ではなく「すでにあなたのもの」である点が最大の強み