[Wiki] [一覧]

Seq2Seq(Sequence to Sequence)

概要

Seq2Seq(系列から系列への学習)は、Sutskever et al.(2014)が「Sequence to Sequence Learning with Neural Networks」で提案した、エンコーダ-デコーダ 型のニューラルネットワーク手法です。可変長の入力シーケンスを可変長の出力シーケンスへ変換する枠組みであり、機械翻訳をはじめとする系列生成タスクの基礎となりました。Transformer 以前の重要なマイルストーンです。

仕組み

2つの LSTM(長・短期記憶) ネットワークを用います。

  1. エンコーダ LSTM:入力系列を固定次元のベクトル(文脈ベクトル)に符号化
  2. デコーダ LSTM:そのベクトルから目的の系列を復号(生成)
入力系列 → [Encoder LSTM] → 固定長ベクトル → [Decoder LSTM] → 出力系列

主な成果

限界とその後の発展

系譜における位置づけ

Seq2SeqAttentionTransformerGPT / 大規模言語モデル

関連ページ

参考資料