ツール利用(Tool Use)
概要
ツール利用は、AIエージェント が望ましい結果を達成するために実行できる 特定の機能(ツール) を呼び出す仕組みです。LLM 単体ではできない計算・外部システム操作・最新情報の取得などを、ツールを介して実現します。トークン化 における <TOOL_CALL> / <TOOL_RESULT> などの特殊トークンが、この呼び出しと結果のやり取りを支えます。
ツールの種類
| 種類 | 概要 | 例 |
|---|---|---|
| ローカルツール | エージェントと共にデプロイされる | 算術計算、タイムゾーン変換、カレンダー操作、地図操作 |
| API ベースのツール | 外部システムと結合 | 天気情報、株式市場データ、翻訳サービス |
| プラグインツール | 外部プラットフォーム連携 | Expedia、Zapier |
| ステートフルツール | 状態を持つ操作 | スコープを限定した操作のみ登録するのが重要 |
実装例(LangChain)
HumanMessage/AIMessageでメッセージをやり取り@toolデコレータでツールを定義- Hugging Face Transformers ライブラリ、Glama.ai、mcp.so などのエコシステム
MCP との関係
ツールを標準化された形で接続するプロトコルが MCP(Model Context Protocol)です。MCP サーバー/クライアントによりツール接続を統一できますが、セキュリティ上の問題も指摘されています。
ツール実行の形態
- 単一ツール実行
- 並列ツール実行
- チェーン(連鎖)
- グラフ(依存関係を持つ実行)
実行の仕方は エージェントオーケストレーション のパターン(ReAct など)と密接に関係します。
Code Mode — ツール呼び出しからコード生成へ
従来の構造化ツール呼び出しの代わりに、AI がコードを直接書いて実行する 方式(Cloudflare の「Code Mode」など)が注目されています。複数ツールの組み合わせをコードで表現することでトークン消費を抑え、効率を上げられます。実行は隔離されたサンドボックス(AIエージェントの安全性)で行うのが前提。AI エージェント向けインフラ(Workers AI / Sandboxes / Durable Objects)を一体で提供するプラットフォーム議論とともに語られます。参考: AIエージェントはCloudflareに賭けろ
なぜツールに委譲するのか(決定論的ホライゾン)
ツール利用は「便利な拡張」にとどまらず、LLM 単体の推論が構造的に破綻する領域を補う必須手段でもあります。“The Deterministic Horizon” は、決定論的な状態追跡では拡張推論がむしろ性能を落とし、19〜31ステップ付近を超えるとツールへの委譲が必要になることを示しました(ツール統合推論86〜94% vs 純粋推論24〜42%)。「いつ考えるのをやめてツールに任せるか」は メタ認知 の判断そのものです(LLMの推論)。The_Deterministic_Horizon_When_Extended_Reasoning_Fails
ツール選択の最適化(Daily フィード)
ツールが増えるほど「正しいツールを選ぶ」こと自体が難しくなります。
- Try, Check and Retry — 分割統治でツールを選択するツール呼び出しフレームワーク。BFCL・ACEBench で平均 +25.10% のゲイン。Try_Check_and_Retry
- FinRetrieval — 財務データの正確な取得を測るベンチマーク。Claude Opus は構造化 API で 90.8% だがウェブ検索では 19.8% に低下し、取得経路(ツール)の質 が成否を分けることを示す(ベンチマーク / RAG)。FinRetrieval_Financial_Data_Retrieval_Benchmark
関連ページ
参考資料
- Building Applications with AI Agents(Tool Use の章)