[Wiki] [一覧]

説明可能AI(XAI)

概要

説明可能AI(Explainable AI, XAI)は、AI モデルの判断の 根拠を人間が理解できる形で示す 技術・研究分野です。大規模言語モデル のような複雑なモデルはブラックボックス化しやすく、信頼・説明責任・AIの倫理 の観点から説明可能性が重要になります。

関連する論点

なぜ重要か

注意機構の機械的解釈(Mechanistic Interpretability)

Attention の内部回路を解析し、モデルの挙動を機械的に説明する研究が活発です。

訓練データへの帰属(Capability Provenance)

内部回路ではなく 「どの訓練データがその能力を支えているか」 を遡る、データ側からの解釈可能性アプローチもあります。

研究テーマ(Daily フィード)

関連ページ