創発的能力(Emergent Abilities)
概要
創発的能力(Emergent Abilities)とは、大規模言語モデル が ある規模を超えると、小さなモデルには見られなかった能力を突然示す 現象を指します。Wei ら(2022)が報告し、スケーリング則 による滑らかな改善とは別に、特定タスクで非連続的に性能が立ち上がる例が観察されました。
例
- 多段の算術・記号推論
- Few-shot Learning / In-context Learning による未知タスクへの適応
- Chain-of-Thought による推論能力
- 指示追従
これらは「次の単語を予測する」という単純な学習目的(事前学習)から立ち現れる点が驚きとされました。
論争:本当に「創発」か?
創発的能力には批判もあります。「創発は 評価指標の選び方による見かけの現象(mirage) で、連続的な指標で測れば滑らかに改善している」という主張です。研究フィード(Daily/)でも、推論をスカラー指標だけで測る危うさが指摘されています(ベンチマーク / LLMの評価)。