[Wiki] [一覧]

知識蒸留(Knowledge Distillation)

概要

知識蒸留(Knowledge Distillation)は、大きく高性能な 教師モデル(Teacher) の振る舞いを、より小さな 生徒モデル(Student) に学習させて、性能を保ちつつ軽量化する手法です。大規模言語モデル の推論コスト削減や、エッジでの実行を可能にします。書籍『実践 LLM アプリケーション開発』でも蒸留(Distillation)が軽量化手法として触れられています。

仕組み

LLM での応用

関連する軽量化技術

研究テーマ(Daily フィード)

関連ページ