[Wiki] [一覧]

LoRA(Low-Rank Adaptation)

概要

LoRA(Low-Rank Adaptation)は、大規模言語モデルファインチューニング少数の追加パラメータだけで行う 手法です。元の重みを凍結したまま、低ランクの差分行列だけを学習することで、メモリと計算を大幅に削減します。PEFT(Parameter-Efficient Fine-Tuning, パラメータ効率的微調整) の代表格です。

仕組み

利点

研究フィード(Daily/)では、ごく少数のパラメータで推論を学ぶ極端な例(TinyLoRA など)も話題になっています。

関連手法

関連ページ