ニューラルネットワーク
概要
ニューラルネットワーク(Neural Network)は、脳のニューロンを模した「ノード(ユニット)」を層状に結合した機械学習モデルです。データから特徴を自動的に学習する ディープラーニング(深層学習) の基盤であり、Transformer や 大規模言語モデル もその発展形です。
基本要素
- ニューロン(ユニット) — 入力に重みを掛けて合計し、活性化関数を通す
- 層(Layer) — 入力層・隠れ層・出力層。隠れ層が多いものを「深い(Deep)」と呼ぶ
- 重みとバイアス — 学習で調整されるパラメータ
- 活性化関数 — 非線形性を与える(ReLU, GELU など)
- 損失関数(Loss Function) — 予測と正解のずれを測る指標
学習の仕組み
- 順伝播(Forward) — 入力から出力を計算
- 損失計算 — 出力と正解の誤差を求める
- 誤差逆伝播(Backpropagation) — 勾配を計算
- 勾配降下法 — 重みを更新して損失を減らす
代表的なアーキテクチャ
| 種類 | 用途 |
|---|---|
| 多層パーセプトロン(MLP) | 基本的な全結合ネット |
| CNN(畳み込み) | 画像 |
| RNN / LSTM | 系列(Seq2Seq の基盤) |
| Transformer | 言語・マルチモーダル(現在の主流) |
関連ページ
参考資料
- つくりながら学ぶ!LLM自作入門(ニューラルネット・多層パーセプトロン・損失関数)