生成AIのRAG(検索拡張生成)をわかりやすく解説｜精度向上のポイントも

RAG（検索拡張生成）って何？
どう実践するのか知りたい！

この記事を読むことで、上記のような疑問が解決します。

出力結果を改善する手法の一つです。

こんにちは、シントビ管理人のなかむーです。

今回紹介するRAGを学ぶことで、ChatGPTなどの生成AI言語モデルをさらに有効活用できるでしょう。

今回も文系目線でわかりやすく解説していきます。

それではRAGについて、一緒に学んでいきましょう。

この記事でわかること

RAGの概要、メリット
RAGを実際に使う方法

初心者にもわかるように噛み砕いて説明します。ぜひ参考にしてください。

この記事の目次

RAG（検索拡張生成）とは？RAGの仕組みをざっくり解説
RAGで得られる3つのメリット
RAGの実例解説｜精度向上のポイントも
生成AIスキルを高めたい方はスクールもおすすめ！
RAGを活用して、生成AIの精度を高めよう！

RAG（検索拡張生成）とは？RAGの仕組みをざっくり解説

RAG（Retrieval-Augmented Generation）は、日本においては検索拡張生成と訳される、LLMの回答精度を高める技術です。読み方は「ラグ」です。

Retrieval-Augmented Generationを分解すると

Retrieval：検索、情報取得
Augmented：拡張された、強化された
Generation：生成

検索拡張生成をもう少し具体的に説明すると、「検索で強化された生成」つまり外部から情報を探してきて、それをもとにもっと正確な回答を作る技術になります。

検索と生成を一体化するため、モデルが学習していない最新・専門知識も扱えます。図書館で本を探してからレポートを書くイメージを持つと理解しやすいでしょう。検索には「ベクトル検索」という技術が使われ、意味が近い文書を高速で見つけます。

難しく考える必要はありません。「RAG＝外部の情報を検索して生成する」と認識しておけば十分です。

プロンプトエンジニアリングとの違いは？

プロンプトエンジニアリングは、LLM に渡すプロンプトの書き方だけを工夫して回答品質を高める技術です。一方 RAG は「良いプロンプト」を作るだけでなく、外部データを探し、見つけた文章をプロンプトに追加してから生成させる点が異なります。

つまり RAG は検索とプロンプトエンジニアリングを合わせた上位アプローチです。その分、検索エンジンの活用やデータベースの設定が必要ですが、回答の信頼性を大きく底上げできます。

プロンプトエンジニアリング
プロンプトを工夫して、回答品質を高める
RAG
外部データを検索して、回答品質を高める

RAGに当たるもの、当たらないもの

「外部データを検索」は少し曖昧な表現に感じますね。そこで理解を深めるため、具体例を示します。

RAGに当たるもの

RAGに当たるものは以下のようなものです。

Webブラウザ検索
例：ChatGPTやGeminiの検索機能を利用する
社内やクラウド上のドキュメント検索
例：ClaudeがGoogle Drive Catalogingでドキュメントを検索する
データベース/APIクエリ
例：最新の為替レートをAPIで取得して計算させる

RAGに当たらないもの

単なるプロンプトエンジニアリング（検索を使用していない）
ファインチューニング（検索を使用していない）
PDFデータを貼り付けて生成させる（動的な検索ステップがない）
人がブラウザ結果をコピペしてLLMに学習させる（Retrieval と Generation が分離）

LLMが自動で検索をするステップがあるかどうか、がポイントです。

RAGの活用例

RAGは個人、法人さまざまな場面で活用できます。以下はほんの一例です。

Webニュースまとめ
カスタマーサポートのチャットボット
社内FAQ
最新の旅行プラン提案
税務や法務のサポート
など

膨大なデータから探す必要がある場合や、最新の情報にアクセスする必要がある場合に有効です。

RAGの実装や運用で気をつけたいポイント

RAGの導入時は「データの質」と「検索精度」が最重要です。例えば、誤字だらけの資料を入れると誤答を招きます。また検索と生成を組み合わせるため、応答が遅くならないよう調整が必要です。

社外秘文書を扱う際はアクセス権と暗号化も必須。さらに、検索結果を盲信せず、人間が定期的に品質を確認する運用も組み込みましょう。

これらを押さえることで、低コストでも安定したRAGを維持できます。

特にWeb検索を用いる場合、データの品質が重要な問題です。ネット上の情報は必ずしも正しいとは限りませんので。

RAGで得られる3つのメリット

RAGを行なうことで得られる3つのメリットを解説します。

ハルシネーションを抑制できる

LLMはときに自信満々に誤情報を作る「ハルシネーション」を起こします。RAGは検索で得た実在文書をプロンプトに添えるため、根拠に基づきやすく、事実に沿った回答を出しやすくなります。

また、ChatGPTやClaudeは検索結果のURLや文書タイトルを一緒に返します。利用者自身が内容を検証すれば、信頼性が高まるでしょう。これにより、法律や医療など誤りが許されない領域でも安全に使いやすくなります。

再学習不要でコスト削減

通常、LLMに自社データを学習させたい場合、ファインチューニングという再学習が必要で、計算費用や専門人材がネックになります。RAGならモデルはそのままに、検索対象データベースを更新するだけで内容を最新化できるため、GPU時間やクラウド料金を大幅に節約可能です。

データ量が増えても学習し直さないので運用が簡単になり、中小チームでも導入しやすいのが魅力です。結果として、試験導入から本番拡張までスピード感を持って進められます。

RAGの実例解説｜精度向上のポイントも

それではRAGの効果を実例を用いて確認してみましょう。テーマは、変化の激しい”ChatGPTで利用できるモデル”(笑)です。

今回Claude 3.7 Sonnetを利用し、Web検索機能をオン・オフにして試しています。

まずはWeb検索をオフにした状態です。

プロンプト（Web検索をオフ）

ChatGPTで利用できるモデルを教えて

Claudeの回答

ChatGPTで利用できる主なモデルには以下のようなものがあります：

GPT-4o（最新の高性能モデル）
GPT-4（GPT-4oの前のバージョン）
GPT-3.5 Turbo（より速く、コストパフォーマンスに優れたモデル）

これらのモデルには無料版と有料版（ChatGPT Plus）があり、有料版ではより高性能なモデルや機能にアクセスできます。

なお、OpenAIは時々新しいモデルをリリースしたり、既存のモデルを更新したりするため、現在利用できるモデルは変わっている可能性があります。最新情報はOpenAIの公式サイトで確認するとよいでしょう。

Claudeの学習データは2024年10月末です。そのため、最近のモデルは当然含まれておりません。

最新情報は公式サイトを確認してね、というのは親切ですね、

続いて、Web検索をオンにした状態です。

プロンプト（Web検索をオン&期間なし）

ChatGPTで利用できるモデルを教えて

Claudeの回答

あなたのご質問にお答えいたします。ChatGPTで利用できるモデルについて調べてみましょう。

現在ChatGPTで利用できるモデルについて、最新情報をまとめてご説明します。

主要モデル

GPT-3.5 Turbo：
- 無料プランで利用可能
- 高速で処理速度が良く、基本的なテキスト生成や日常的な質問に適しています
- コンテキストウィンドウは16,385トークン
- 学習データの期限は2021年9月まで
GPT-4o：バランスの良いオールラウンダーモデルで、テキストだけでなく画像や音声といったマルチモーダル機能も備えています。例えば、冷蔵庫の中の写真を見せて「何が作れるか」と相談することも可能です。
GPT-4.5： 2025年2月に研究プレビューとしてリリースされたモデルで、特に事前学習（教師なし学習）のスケールアップによる性能向上が特徴です。
o3シリーズ： 2025年4月に最新の推論モデル「OpenAI o3（オープンエーアイ・オースリー）」がリリースされました。最新技術を取り入れた次世代モデルで、より高度なタスクに対応する予定で、科学研究や先進的なデータ処理を想定しています。
o1シリーズ：文系テーマや簡単な質問に素早く答えるモデルです。歴史レポートや社会学系の概要取得などに使いやすいとされています。
o4-miniシリーズ： 2025年4月に「OpenAI o4-mini（オープンエーアイ・オーフォー）」がリリースされました。
GPT-4o mini：手頃な価格と汎用性、強化されたパフォーマンスが特徴です。GPT-3.5 Turboよりも60%も低価格で、ChatGPTの無料、プラス、チームプランを使用している開発者にも利用しやすくなっています。

以下省略。

ほぼ正解ですね。ほぼと言っているのは、2025年4月28日時点において、「GPT-3.5 Turbo」「o1シリーズ」は利用できません。また現在利用できるGPT-4が記載されていません。引用した記事に少し古いものが混ざっていました。（といっても2025年3月）

精度を高めるために、引用してよい記事の期間（◯月◯日以降）を入れてみましょう。

プロンプト（Web検索をオン&期間あり）

ChatGPTで利用できるモデルを教えて。なお、参照してよい記事は2025年4月20日以降に公開されたものに限ります。

Claudeの回答

ChatGPTで利用できる最新のモデルについて調べてみますね。2025年4月20日以降の情報を探します。

2025年4月現在、ChatGPTで利用できる主なモデルについてまとめました。

無料プランで利用できるモデル

GPT-4o mini：基本的な対話機能を提供するモデル
GPT-4o：制限付きで利用可能な標準モデル
o4-mini：「Think」オプションで利用できる推論モデル

有料プラン（$20/月）で追加で利用できるモデル

GPT-4o：OpenAIが継続的に更新している標準モデル
GPT-4.5：プレビュー版として利用可能な最新の非推論モデル 2025年2月にリリースされ、ChatGPT Proユーザーは現在GPT-4.5を試すことができます

Proプラン（$200/月）で追加で利用できるモデル

o1シリーズ：o1、o1-mini、o1-proを含む推論モデル

注目すべき変更点

2025年4月30日から、GPT-4はChatGPTから削除され、GPT-4oに完全に置き換えられる予定です
GPT-4.1シリーズ（GPT-4.1、GPT-4.1 mini、GPT-4.1 nano）は、コーディングに特化したモデルとして2025年4月にリリースされましたが、これらはAPIを通じてのみ利用可能で、ChatGPTアプリでは使用できません

なお、GPT-4.5はAPI経由での提供が2025年7月14日に終了予定で、GPT-4.1がより低コスト・低遅延で同等以上の性能を提供するため切り替えが推奨されています。

OpenAIは現在、モデル名の体系を混乱させているという批判を受け、CEOのサム・アルトマン氏は2025年後半に命名スキームを改善すると発表しています。

惜しいです。o1シリーズではなく、o3シリーズでした。（参照した記事に誤りがあったようです）ただし、期間を入れていないものよりも精度が高いのが分かりました。さらに期間を絞ったりするとうまくいくかもしれません。

ChatGPTのモデルのように日々刻々と変わるものにおいては、Web検索＋期間指定（いつ以降）のように範囲を絞るが有効です。

これは大量のデータの中から検索させる場合も同様で、適切に範囲を絞ることで精度を高められます。例えば商品情報を検索させる場合、商品名やジャンルなどを入力し、無関係な情報を排除すると良いでしょう。

無関係な情報を排除する