[Wiki] [一覧]

スケーリング則(Scaling Laws)

概要

スケーリング則(Scaling Laws)は、大規模言語モデル の性能(損失)が、モデルのパラメータ数・データ量・計算量 に対して予測可能なべき乗則で改善する、という経験的法則です。Kaplan ら(2020)が示し、「大きくすれば賢くなる」という LLM 開発の指針を裏づけました。

何を主張するか

Chinchilla 則(計算最適性)

DeepMind の Chinchilla(2022)は、与えられた計算予算では、モデルサイズとデータ量をバランスよく増やすべき(多くの既存モデルはデータ不足だった)と示しました。これにより「むやみに大きくする」より「データも十分に」という設計へ転換しました。

含意

関連ページ