[Wiki] [一覧]

LLMの推論(Reasoning)

概要

LLMの推論(Reasoning)は、大規模言語モデル が複数ステップの論理・演繹・計画を通じて答えにたどり着く能力です。単純な事実想起ではなく、思考の過程 を要するタスク(数学、演繹、計画立案など)で問われます。推論の質・効率・安定性の評価と改善が、研究フィード(Daily/)の主要テーマの一つです。

推論を引き出す技法

評価の観点

推論が「効かない」境界(決定論的ホライゾン)

長く考えるほど良いとは限りません。The Deterministic Horizon は、デコーダ専用の Attention 機構の構造的限界(「注意ボトルネック定理」)により、決定論的な状態追跡タスクでは拡張推論がかえって性能を下げることを実証。19〜31ステップ付近に「決定論的ホライゾン」があり、ここを超えると ツールへの委譲(tool delegation)が必要になる。ツール統合推論は86〜94%の精度を達成(純粋なニューラル推論は24〜42%)。「いつ考えるのをやめてツールに任せるか」という ツール利用 / メタ認知 の判断に直結する(ICML 2026)。The_Deterministic_Horizon_When_Extended_Reasoning_Fails

推論の「忠実性」

高い正答率でも、示された推論が実際の計算・行動を反映しているとは限りません。述べた推論と結論・行動のズレ(忠実性ギャップ)は別建ての論点として 推論の忠実性 にまとめています。

関連概念

研究テーマ(Daily フィード)

関連ページ