自己改善エージェント(Self-Improving / Self-Evolving Agent)
概要
自己改善エージェントは、AIエージェント が 自分自身の構成要素(スキル・ハーネス・重み)を、人間の反復介入なしに更新していく 仕組みを指します。従来の AI 開発は「人間がスキャフォールドを書き直し、モデルを再学習する」という人手のループがボトルネックでしたが、このアプローチではエージェント自身が評価結果をもとに改良を回します。2026 年前半の研究フィード(Daily/ llm/)で急速に存在感を増しているテーマです。
何を「改善」するのか
自己改善の対象は階層的に整理できます。
- スキル(手続き・プロンプト断片) — 凍結したエージェントの外部パラメータとして扱い、検証スコアが上がった編集だけを採用する(SkillOpt)
- ハーネス(足場・実行環境)+重み — スキャフォールドの修正とモデル重み更新を 同時に 回す(SIA)
- 研究プロセスそのもの — 仮説・実験・知見を木構造で蓄積し、探索と実験を自律的に進める(Arbor)
主要な研究(Daily フィード)
- SkillOpt — エージェントスキルを自己進化させる、制御可能なテキスト空間オプティマイザー。スコア付きロールアウトを「追加・削除・置換」の制限された編集に変換し、検証性能が向上した場合のみ受理する。6 ベンチマークで手書きスキルや TextGrad・EvoSkill を上回り、+19.1〜+24.8 ポイントの改善。推論時オーバーヘッドを増やさないのが利点。SkillOpt_Executive_Strategy_for_Self_Evolving_Agent_Skills
- SIA(Self-Improving AI) — 「人間こそがボトルネック」という問題意識から、重み更新とハーネス修正を同一の自己改善ループで扱う。中国法分類・GPU カーネル最適化・RNA デノイジングの 3 ドメインで検証し、両レバーの併用がスキャフォールド反復単独を上回った(LawBench +25.1%、GPU +12.4%、デノイジング +20.4%)。SIA_Self_Improving_AI_with_Harness_Weight_Updates
- Arbor — 仮説ツリー精緻化による汎用自律研究エージェント。永続的コーディネータと一時的実行者を組み合わせ、仮説・成果物・証拠・蒸留知見を時間軸でリンクする。Codex や Claude Code をベースラインに 2.5 倍以上の相対ゲイン、MLE-Bench Lite で 86.36%。AI for Science の自動化とも接続する。Arbor_Toward_Generalist_Autonomous_Research
- MemPro — エージェントの記憶を静的なストレージではなく「進化可能なプログラム」として捉え、記憶の統合・検索(MCR)パイプラインの構造自体を Evolving Agent が反復改善する。失敗パターンを特定して改善版を生成(エージェントメモリ)。MemPro_Agentic_Memory_Systems_as_Evolvable_Programs
- MiniMax-M2(M2.7) — 大規模 MoE の実モデルでも、自律デバッグ・自己修正という自己改善的振る舞いが現れている(Mixture of Experts)。The_MiniMax-M2_Series
実践での自己改善(スキルとメモリ)
研究だけでなく、開発現場のコーディングエージェント(AIコーディングアシスタント)でも、軽量な自己改善が取り入れられています。会話から得た学びを 自動で構造化・保存 し、セッションをまたいで再利用することで、毎回同じ指示を繰り返す手間を減らす「自己改善スキル」の実践が紹介されています。研究的な重み更新までは行わず、エージェントメモリ とスキル蓄積による継続的改善に寄せたアプローチです。AI Agent Self-Improvement Skills
論点・リスク
- 評価が要(かなめ) — 「改善したかどうか」を判定する検証可能なシグナル(テスト・ベンチマーク)がなければ自己改善は暴走する。LLMの評価 / ベンチマーク が前提条件になる。
- 安全性 — 自己のハーネスや重みを書き換える能力は、制御や監督の難易度を上げる(AIエージェントの安全性)。
- 人間の主導権 — 自動ループへの過度な依存は、設計判断の質を見えなくする恐れがある(エージェントオーケストレーション の検証可能性の議論を参照)。