RAGとは?社内文書をAIに答えさせる仕組み
この記事の要点
RAGとは、AIが回答を生成する前に外部の文書を検索して参照する技術です。社内規程・製品マニュアル・過去の事例など独自の情報をAIに答えさせたい場合に使います。仕組み・ファインチューニングとの違い・導入事例を解説します。
結論
RAGは、社内文書や独自データをAIに参照させて回答を生成させる技術です。汎用のAIは自社の規程・製品仕様・過去の事例を知りません。RAGを使うと、AIが回答の前にそれらの文書を検索し、内容を引用しながら答えを生成します。ハルシネーションのリスクを下げながら、独自情報に基づいたQ&Aを実現できます。
RAGの仕組み
RAGは「検索・参照・回答」の3ステップで動きます。
ユーザーの質問
↓
① 文書データベースを検索
(質問に関連する文書の断片を取得)
↓
② 取得した文書をAIのプロンプトに追加
(「以下の情報をもとに答えてください」として渡す)
↓
③ AIが参照情報をもとに回答を生成
↓
回答(出典の文書も表示できる)
ステップ1:文書の事前処理
まず、参照させたい文書(PDF・Word・社内wiki・メールなど)をデータベースに格納します。このとき、文書をそのまま保存するのではなく「ベクトル」と呼ばれる数値の形式に変換します。これにより、意味的に近い文書を高速で検索できるようになります。
たとえば「有給休暇の申請方法」という質問に対して、「年次有給休暇規程」の関連部分が検索で引っかかるような状態を作ります。
ステップ2:質問への関連文書の検索
ユーザーが質問を送ると、システムは文書データベースから質問に関連する文章を検索して取得します。キーワード検索ではなく意味的な類似度で検索するため、質問と同じ言葉が文書に含まれていなくても、内容が近ければヒットします。
ステップ3:参照情報を加えた回答生成
取得した文書の断片を「この情報をもとに回答してください」という形でAIに渡します。AIは自分が学習時に持っている知識だけでなく、渡された文書の内容を参照しながら回答します。
回答に使った情報の出典(どの文書の何ページか)を表示する設定にすれば、ユーザーが原文を確認することもできます。
RAGとファインチューニングの違い
RAGとよく比較されるのがファインチューニングです。どちらも「AIに特定の情報を扱わせる」目的で使いますが、アプローチが根本的に異なります。
| 比較項目 | RAG | ファインチューニング |
|---|---|---|
| 仕組み | 外部文書を検索して参照 | AIモデル自体を再学習 |
| 情報の更新 | 文書を更新するだけでよい | 再学習が必要 |
| ハルシネーション | 参照元が明確なため低減しやすい | 学習データ依存で変わらない場合も |
| 費用 | インフラ・検索コストが主 | 学習コストが高い |
| 得意な用途 | 最新情報・大量文書の参照 | 文体・形式の統一・特定タスクの精度向上 |
| 苦手な用途 | 文体変換・語調の統一 | 情報の頻繁な更新 |
RAGが向く場面:
- 社内規程・製品仕様が頻繁に更新される
- 大量の過去事例・FAQ・マニュアルを検索してほしい
- 「どの文書を根拠に答えたか」を後から確認したい
ファインチューニングが向く場面:
- 特定の文体・語調・出力形式を一貫して使わせたい
- 専門領域の用語・知識を深く学習させたい
- 参照文書のサイズが限られており、学習コストを許容できる
詳しくはファインチューニングとは?基礎と使いどころを参照してください。
業務での活用例
社内問い合わせ対応の自動化
課題: 人事・総務への問い合わせが1日50件以上あり、同じ質問が繰り返されていた
RAGの使い方: 就業規則・給与規程・各種申請フォームをデータベース化し、社員がチャットで質問できるシステムを構築
結果: 問い合わせの60%がRAGで自己解決され、人事担当者への直接相談は例外・判断が必要なケースのみに絞られた
カスタマーサポートの一次対応
課題: 製品の問い合わせに対して、サポート担当者がマニュアルを探して回答するのに平均12分かかっていた
RAGの使い方: 製品マニュアル・FAQを格納したRAGシステムをサポート担当者のツールに組み込み、質問を入力すると関連マニュアルの箇所と回答案が表示される
結果: 回答作成時間が平均3分に短縮。担当者は内容確認と送信のみに集中できるようになった
法務・コンプライアンスの確認
課題: 契約書レビュー時に、社内の過去判断事例・規程を確認するのに時間がかかっていた
RAGの使い方: 過去の契約書・審査履歴・法務ガイドラインをRAGで検索し、類似事例と判断基準を表示
結果: レビューの準備工程が従来比40%短縮。ただし最終判断は必ず法務担当者が行う体制は維持している
RAGの導入時に考えること
1. 文書の品質が精度を左右する
RAGは「文書データベースの中から関連情報を引っ張ってくる」仕組みです。格納されている文書が古い・曖昧・重複しているとすると、AIの回答もその品質を引き継ぎます。データの整備が先です。
精度を上げるために必要な文書の条件:
- 最新の状態に保たれている
- 内容が重複していない
- 検索しやすい単位(章・節・FAQ単位)に分割されている
2. 参照元の確認の仕組みを作る
RAGを使っても、AIがすべての質問に正確に答えられるわけではありません。回答の根拠となった文書の場所を表示し、ユーザーが原文を確認できる設計にすることが重要です。
3. 対象外の質問への対応
文書に記載がない質問に対しては、AIが「情報がありません」と答える設定にすることを推奨します。情報がないのに回答を生成させると、ハルシネーションが発生します。詳しくはハルシネーションとはを参照してください。
4. アクセス権限の設計
社内文書には機密情報が含まれる場合があります。誰がどの文書にアクセスできるかの権限設計は、導入前に決める必要があります。部門ごと・役職ごとにアクセスできる文書を分ける実装が一般的です。
RAGを始めるための選択肢
クラウドサービスを使う場合
文書をアップロードしてQ&Aチャットを作れるサービスが増えています。Azure AI Search・Amazon Kendra・Google Vertex AI Search Enterpriseなどのエンタープライズ向けサービスや、よりシンプルなSaaS製品も多数あります。最新の対応機能・料金は各公式サイトで確認してください。
自前で構築する場合
オープンソースのフレームワーク(LangChain・LlamaIndexなど)を使ってRAGパイプラインを構築できます。エンジニアが必要ですが、文書の処理方法・検索ロジック・UIを自社要件に合わせてカスタマイズできます。
ノーコード・ローコードツール
プログラミングなしにRAG的な機能を使えるツールも増えています。Notionへの質問機能・SharePointのCopilot・各種ナレッジベースツールのAI検索機能などが該当します。
まとめ
RAGは「社内文書をAIに読み込ませて回答させる」最も実用的な方法です。ファインチューニングと比べてコストが低く、文書の更新がしやすいため、企業での導入が増えています。
精度を左右するのはAIモデルの性能より文書の品質です。まず既存の文書を整理することが、RAGの精度向上への最短経路です。
生成AIと従来AIの違いとLLMとはも合わせて読むと、RAGが何の技術の上に成り立っているかの理解が深まります。
よくある質問
RAGとは何ですか
RAGは、AIが回答を生成する前に外部の文書データベースを検索し、見つけた情報を参照しながら回答を生成する技術です。独自の情報(社内文書・製品仕様など)をAIに扱わせるために使います。
RAGとファインチューニングの違いは何ですか
RAGは外部の文書を検索して参照しながら回答します。ファインチューニングはAI自体を特定のデータで再学習させます。情報の追加・更新が頻繁な場合はRAGが向いており、文体・形式を定着させたい場合はファインチューニングが向いています。
RAGはどんな企業に向いていますか
社内に大量のPDF・Word・社内wikiなどのドキュメントがあり、それをQ&A形式で検索・参照したい企業に向いています。法令・製品仕様・規程など更新頻度の高い情報を扱う場合に特に有効です。
RAGの導入には何が必要ですか
文書データの整備、ベクトルデータベース(文書を検索しやすい形に変換して格納するDB)、AIモデルのAPIが基本的な構成要素です。クラウドサービスを利用すれば、自前でインフラを構築しなくても始められます。