[Wiki] [一覧]

Chain-of-Thought(思考連鎖)

概要

Chain-of-Thought(CoT, 思考連鎖)は、大規模言語モデル最終的な答えだけでなく、そこに至る中間推論ステップを明示的に出力させる プロンプト技法です。複雑な推論(算術・常識・論理)の精度を大きく向上させ、LLMの推論 を引き出す代表的手法となりました。

仕組み

「順を追って考えてみましょう(Let’s think step by step)」のような指示や、推論過程を含む例示(Few-shot CoT)により、モデルに思考を展開させます。

問題: りんごが3個、みかんが5個ある。果物は全部で何個?
思考: りんごが3個。みかんが5個。合計は 3 + 5 = 8。
答え: 8個

派生・関連技法

効率化:長い思考をどう圧縮するか

拡張 CoT は強力ですが計算コストが高く、思考を圧縮・短縮する研究が進んでいます。

出力した思考は本当の思考か(忠実性)

CoT は「思考を見せる」ものですが、示された思考が実際の内部計算や最終行動を反映しているとは限りません。述べた推論と結論・行動がズレる「忠実性ギャップ」や、隠した推論トレースが抽出されうる問題は 推論の忠実性 にまとめています。CoT を安全監視に使う場合、この前提(CoT が忠実であること)が崩れると監視が形骸化します(AIエージェントの安全性)。

位置づけ

関連ページ