[Wiki] [一覧]

位置符号化(Positional Encoding)

概要

位置符号化は、Transformer において トークンの位置情報をモデルに明示的に与える ための仕組みです。LSTM など従来のアーキテクチャは入力を逐次処理するため位置情報が自然に保持されますが、Transformer はすべての計算を並列に行うため、位置情報を明示的に補う必要があります。Attention 機構だけでは語順を区別できないため、位置符号化が不可欠です。

なぜ必要か

主な方式

方式略称概要
絶対位置埋め込みAbsolute Position Embedding各絶対位置に対応するベクトルを加算(オリジナル Transformer)
線形バイアスによるアテンションALiBi(Attention with Linear Biases)アテンションスコアに距離に応じた線形バイアスを加える
ロータリー位置埋め込みRoPE(Rotary Position Embedding)埋め込みを回転させて相対位置を表現。多くの現代 LLM で採用
位置符号化なしNoPE(No Positional Encoding)明示的な位置符号化を用いない構成

RoPE や ALiBi は、学習時より長い系列への外挿(ロングコンテキスト対応)にも関わる重要な技術です。

Transformer 内での位置づけ

入力 → 埋め込み層(Embedding Layer)→ 位置符号化 → マルチヘッド Attention → … という流れで、埋め込み直後に適用されます。

関連ページ

参考資料