プロンプトエンジニアリング(Prompt Engineering)
概要
プロンプトエンジニアリングは、大規模言語モデル から望ましい出力を引き出すために プロンプト(入力指示)を設計・最適化する 技術です。Few-shot Learning / In-context Learning の発見により、プロンプトの設計が性能に大きく影響することが分かり、GPT-3 を起点に独立した実践分野として確立しました。ファインチューニング が不要なタスク適応の主流手段です。
効果的なプロンプト設計の原則
- 明確なタスク説明 — 何をすべきかを明確に伝える
- 質の高い例 — 代表的で多様な例を選ぶ(Few-shot)
- 形式の統一 — 入出力の形式を一貫させる
- 思考プロセスの明示 — Chain-of-Thought など
主な技法
| 技法 | 概要 |
|---|---|
| Zero-shot Prompting | 例なし、タスク説明のみで指示 |
| Few-shot Prompting | 数個の例を提示(In-context Learning) |
| Chain-of-Thought (CoT) | 「順を追って考えて」と推論過程を明示させ、複雑な推論の精度を上げる |
| 役割設定(Role Prompting) | モデルに役割・ペルソナを与える |
例
プロンプト:
以下は感情分析のタスクです。
例:
- テキスト:「このカフェは最高です!」 → 感情:ポジティブ
- テキスト:「遅れて来た」 → 感情:ニュートラル
新しいテキスト:「このサービスは最悪」
感情:?
モデル世代でプロンプティングは変わる(Daily フィード)
プロンプト設計はモデルの世代・特性に依存します。Claude Fable 5 / Mythos 5 のプロンプティングガイドは、エフォート・指示追従・長時間実行・メモリ・スキャフォールディングの変化を整理しています。Claude_Fable5_Prompting
- 長期的な自律性・初回正確性・ビジョン・並列サブエージェント管理が Opus 4.8 比で向上
- 高エフォートでは1リクエストが数分実行されることもあり、低エフォートでも従来の xhigh を上回る場合がある → エフォート設定を含めた設計が重要に(Claude Code / 長期タスク)
限界と注意点
- 複雑な推論タスクでは精度が低下する場合がある
- タスクによって性能が大きく変わる
- 例の順序や選択に左右される(脆弱性)
- より確実な知識のグラウンディングには RAG が、より深い適応には ファインチューニング が選択肢となる
関連ページ
参考資料
- Brown, T., et al. (2020). “Language Models are Few-Shot Learners.”
- 実践 LLM アプリケーション開発 --- プロトタイプを脱却し、実用的な実装に迫るための包括的な手引き