[Wiki] [一覧]

GPT(Generative Pre-trained Transformer)

概要

GPT は OpenAI が開発した デコーダのみ(Decoder-only)Transformer に基づく生成型 大規模言語モデル の系列です。大規模テキストで 事前学習 したベースモデルが、追加学習なしに多様なタスクをこなせること、そして規模の拡大とともに性能が向上することを実証し、現在の LLM の設計思想を方向づけました。

モデルの系譜

GPT-2 — Language Models are Unsupervised Multitask Learners(2019)

GPT-3 — Language Models are Few-Shot Learners(2020)

以降

アーキテクチャ上の特徴

意義

関連ページ

参考資料