自己改善エージェント（Self-Improving / Self-Evolving Agent）

概要

自己改善エージェントは、AIエージェントが 自分自身の構成要素（スキル・ハーネス・重み）を、人間の反復介入なしに更新していく 仕組みを指します。従来の AI 開発は「人間がスキャフォールドを書き直し、モデルを再学習する」という人手のループがボトルネックでしたが、このアプローチではエージェント自身が評価結果をもとに改良を回します。2026 年前半の研究フィード（Daily/ llm/）で急速に存在感を増しているテーマです。

何を「改善」するのか

自己改善の対象は階層的に整理できます。

スキル（手続き・プロンプト断片） — 凍結したエージェントの外部パラメータとして扱い、検証スコアが上がった編集だけを採用する（SkillOpt）
ハーネス（足場・実行環境）＋重み — スキャフォールドの修正とモデル重み更新を 同時に 回す（SIA）
研究プロセスそのもの — 仮説・実験・知見を木構造で蓄積し、探索と実験を自律的に進める（Arbor）

主要な研究（Daily フィード）

SkillOpt — エージェントスキルを自己進化させる、制御可能なテキスト空間オプティマイザー。スコア付きロールアウトを「追加・削除・置換」の制限された編集に変換し、検証性能が向上した場合のみ受理する。6 ベンチマークで手書きスキルや TextGrad・EvoSkill を上回り、+19.1〜+24.8 ポイントの改善。推論時オーバーヘッドを増やさないのが利点。SkillOpt_Executive_Strategy_for_Self_Evolving_Agent_Skills
SIA（Self-Improving AI） — 「人間こそがボトルネック」という問題意識から、重み更新とハーネス修正を同一の自己改善ループで扱う。中国法分類・GPU カーネル最適化・RNA デノイジングの 3 ドメインで検証し、両レバーの併用がスキャフォールド反復単独を上回った（LawBench +25.1%、GPU +12.4%、デノイジング +20.4%）。SIA_Self_Improving_AI_with_Harness_Weight_Updates
Arbor — 仮説ツリー精緻化による汎用自律研究エージェント。永続的コーディネータと一時的実行者を組み合わせ、仮説・成果物・証拠・蒸留知見を時間軸でリンクする。Codex や Claude Code をベースラインに 2.5 倍以上の相対ゲイン、MLE-Bench Lite で 86.36%。AI for Science の自動化とも接続する。Arbor_Toward_Generalist_Autonomous_Research
MemPro — エージェントの記憶を静的なストレージではなく「進化可能なプログラム」として捉え、記憶の統合・検索（MCR）パイプラインの構造自体を Evolving Agent が反復改善する。失敗パターンを特定して改善版を生成（エージェントメモリ）。MemPro_Agentic_Memory_Systems_as_Evolvable_Programs
MiniMax-M2（M2.7） — 大規模 MoE の実モデルでも、自律デバッグ・自己修正という自己改善的振る舞いが現れている（Mixture of Experts）。The_MiniMax-M2_Series

実践での自己改善（スキルとメモリ）

研究だけでなく、開発現場のコーディングエージェント（AIコーディングアシスタント）でも、軽量な自己改善が取り入れられています。会話から得た学びを 自動で構造化・保存 し、セッションをまたいで再利用することで、毎回同じ指示を繰り返す手間を減らす「自己改善スキル」の実践が紹介されています。研究的な重み更新までは行わず、エージェントメモリとスキル蓄積による継続的改善に寄せたアプローチです。AI Agent Self-Improvement Skills

論点・リスク

評価が要（かなめ） — 「改善したかどうか」を判定する検証可能なシグナル（テスト・ベンチマーク）がなければ自己改善は暴走する。LLMの評価 / ベンチマークが前提条件になる。
安全性 — 自己のハーネスや重みを書き換える能力は、制御や監督の難易度を上げる（AIエージェントの安全性）。
人間の主導権 — 自動ループへの過度な依存は、設計判断の質を見えなくする恐れがある（エージェントオーケストレーションの検証可能性の議論を参照）。

自己改善エージェント（Self-Improving / Self-Evolving Agent）

概要

何を「改善」するのか

主要な研究（Daily フィード）

実践での自己改善（スキルとメモリ）

論点・リスク

関連ページ

参考資料