スケーリング則（Scaling Laws）

概要

スケーリング則（Scaling Laws）は、大規模言語モデルの性能（損失）が、モデルのパラメータ数・データ量・計算量 に対して予測可能なべき乗則で改善する、という経験的法則です。Kaplan ら（2020）が示し、「大きくすれば賢くなる」という LLM 開発の指針を裏づけました。

DeepMind の Chinchilla（2022）は、与えられた計算予算では、モデルサイズとデータ量をバランスよく増やすべき（多くの既存モデルはデータ不足だった）と示しました。これにより「むやみに大きくする」より「データも十分に」という設計へ転換しました。