[Wiki] [一覧]

自己教師あり学習(Self-Supervised Learning)

概要

自己教師あり学習(Self-Supervised Learning, SSL)は、人手のラベルを必要とせず、データ自身から「正解(ラベル)」を作り出して学習する 手法です。大規模言語モデル事前学習 を支える中心的な考え方であり、膨大な未ラベルテキストを活用できる点が、LLM 発展の鍵となりました。

仕組み

言語モデルでの学習目的

事前学習 の学習目的は、おおむね自己教師ありです。

教師あり/教師なしとの関係

種類ラベル
教師あり学習人手ラベルが必要分類(ファインチューニング の SFT)
教師なし学習ラベルなし・構造発見クラスタリング
自己教師あり学習データから自動生成次単語予測、MLM

関連ページ

参考資料