RAG とは
Retrieval-Augmented Generation の略。
生成 AI(LLM)が回答を生成する際に、Web から関連情報を「検索して取り出す」→「その情報を使って回答を生成する」という 2 段階のプロセス。
RAG の仕組み
Without RAG(従来の LLM)
ユーザー質問 → LLM が学習データだけで回答 → ユーザーに提示
(時代遅れ・ハルシネーション多い)
With RAG(現代の AI 検索)
ユーザー質問
↓
【検索フェーズ】Web から関連情報を取得
↓
【生成フェーズ】LLM が取得情報を使って回答を生成
↓
ユーザーに提示(精度が高い・出典明確)
ChatGPT Search と RAG の関係
ChatGPT Search・Perplexity AI・Google AI Overview は、すべて RAG で動作している。
ユーザーの質問に対して、リアルタイムで Web 検索を実行し、見つかった情報を活用して回答を生成する。
RAG の特徴:
- 新しい情報に対応 — 学習後の情報でも Web から取得すれば回答可能
- 出典を示しやすい — 「この情報はこのサイトから」と明記できる
- ハルシネーション低下 — Web の確実な情報を使うため、ウソが減る
Web サイト運営者への影響
RAG を理解することで、AEO 対策が効果的になる。
RAG が参照しやすい情報:
- 構造化データ(Schema.org)で明示されたもの
- FAQ Page スキーマで体系化されたもの
- 著者情報が明確なもの
- 統計・出典が明記されたもの
→ つまり、AI 検索では「検索アルゴリズムに最適化する」のではなく、「AI が自動抽出しやすい形式で情報を示す」ことが重要。
RAG 最適化のチェックリスト
□ JSON-LD で構造化データを埋め込み(RAG が形式を認識できる)
□ FAQ を 5+ 個実装(RAG が Q&A を自動抽出)
□ 冒頭 1 文に結論を置く(RAG が優先度 1 で抽出)
□ 統計・出典を明記(RAG が「信頼できる情報」と判定)
□ 著者情報を充実(RAG が「信頼できる情報源」と判定)
RAG を意識した AEO 対応は、AI 時代の必須戦略。