生成AIの基礎

RAGとは?社内文書をAIに答えさせる仕組み

RAGとは?社内文書をAIに答えさせる仕組み

この記事の要点

RAGとは、AIが回答を生成する前に外部の文書を検索して参照する技術です。社内規程・製品マニュアル・過去の事例など独自の情報をAIに答えさせたい場合に使います。仕組み・ファインチューニングとの違い・導入事例を解説します。

結論

RAGは、社内文書や独自データをAIに参照させて回答を生成させる技術です。汎用のAIは自社の規程・製品仕様・過去の事例を知りません。RAGを使うと、AIが回答の前にそれらの文書を検索し、内容を引用しながら答えを生成します。ハルシネーションのリスクを下げながら、独自情報に基づいたQ&Aを実現できます。


RAGの仕組み

RAGは「検索・参照・回答」の3ステップで動きます。

ユーザーの質問

① 文書データベースを検索
    (質問に関連する文書の断片を取得)

② 取得した文書をAIのプロンプトに追加
    (「以下の情報をもとに答えてください」として渡す)

③ AIが参照情報をもとに回答を生成

回答(出典の文書も表示できる)

ステップ1:文書の事前処理

まず、参照させたい文書(PDF・Word・社内wiki・メールなど)をデータベースに格納します。このとき、文書をそのまま保存するのではなく「ベクトル」と呼ばれる数値の形式に変換します。これにより、意味的に近い文書を高速で検索できるようになります。

たとえば「有給休暇の申請方法」という質問に対して、「年次有給休暇規程」の関連部分が検索で引っかかるような状態を作ります。

ステップ2:質問への関連文書の検索

ユーザーが質問を送ると、システムは文書データベースから質問に関連する文章を検索して取得します。キーワード検索ではなく意味的な類似度で検索するため、質問と同じ言葉が文書に含まれていなくても、内容が近ければヒットします。

ステップ3:参照情報を加えた回答生成

取得した文書の断片を「この情報をもとに回答してください」という形でAIに渡します。AIは自分が学習時に持っている知識だけでなく、渡された文書の内容を参照しながら回答します。

回答に使った情報の出典(どの文書の何ページか)を表示する設定にすれば、ユーザーが原文を確認することもできます。


RAGとファインチューニングの違い

RAGとよく比較されるのがファインチューニングです。どちらも「AIに特定の情報を扱わせる」目的で使いますが、アプローチが根本的に異なります。

比較項目RAGファインチューニング
仕組み外部文書を検索して参照AIモデル自体を再学習
情報の更新文書を更新するだけでよい再学習が必要
ハルシネーション参照元が明確なため低減しやすい学習データ依存で変わらない場合も
費用インフラ・検索コストが主学習コストが高い
得意な用途最新情報・大量文書の参照文体・形式の統一・特定タスクの精度向上
苦手な用途文体変換・語調の統一情報の頻繁な更新

RAGが向く場面:

  • 社内規程・製品仕様が頻繁に更新される
  • 大量の過去事例・FAQ・マニュアルを検索してほしい
  • 「どの文書を根拠に答えたか」を後から確認したい

ファインチューニングが向く場面:

  • 特定の文体・語調・出力形式を一貫して使わせたい
  • 専門領域の用語・知識を深く学習させたい
  • 参照文書のサイズが限られており、学習コストを許容できる

詳しくはファインチューニングとは?基礎と使いどころを参照してください。


業務での活用例

社内問い合わせ対応の自動化

課題: 人事・総務への問い合わせが1日50件以上あり、同じ質問が繰り返されていた

RAGの使い方: 就業規則・給与規程・各種申請フォームをデータベース化し、社員がチャットで質問できるシステムを構築

結果: 問い合わせの60%がRAGで自己解決され、人事担当者への直接相談は例外・判断が必要なケースのみに絞られた

カスタマーサポートの一次対応

課題: 製品の問い合わせに対して、サポート担当者がマニュアルを探して回答するのに平均12分かかっていた

RAGの使い方: 製品マニュアル・FAQを格納したRAGシステムをサポート担当者のツールに組み込み、質問を入力すると関連マニュアルの箇所と回答案が表示される

結果: 回答作成時間が平均3分に短縮。担当者は内容確認と送信のみに集中できるようになった

法務・コンプライアンスの確認

課題: 契約書レビュー時に、社内の過去判断事例・規程を確認するのに時間がかかっていた

RAGの使い方: 過去の契約書・審査履歴・法務ガイドラインをRAGで検索し、類似事例と判断基準を表示

結果: レビューの準備工程が従来比40%短縮。ただし最終判断は必ず法務担当者が行う体制は維持している


RAGの導入時に考えること

1. 文書の品質が精度を左右する

RAGは「文書データベースの中から関連情報を引っ張ってくる」仕組みです。格納されている文書が古い・曖昧・重複しているとすると、AIの回答もその品質を引き継ぎます。データの整備が先です。

精度を上げるために必要な文書の条件:

  • 最新の状態に保たれている
  • 内容が重複していない
  • 検索しやすい単位(章・節・FAQ単位)に分割されている

2. 参照元の確認の仕組みを作る

RAGを使っても、AIがすべての質問に正確に答えられるわけではありません。回答の根拠となった文書の場所を表示し、ユーザーが原文を確認できる設計にすることが重要です。

3. 対象外の質問への対応

文書に記載がない質問に対しては、AIが「情報がありません」と答える設定にすることを推奨します。情報がないのに回答を生成させると、ハルシネーションが発生します。詳しくはハルシネーションとはを参照してください。

4. アクセス権限の設計

社内文書には機密情報が含まれる場合があります。誰がどの文書にアクセスできるかの権限設計は、導入前に決める必要があります。部門ごと・役職ごとにアクセスできる文書を分ける実装が一般的です。


RAGを始めるための選択肢

クラウドサービスを使う場合

文書をアップロードしてQ&Aチャットを作れるサービスが増えています。Azure AI Search・Amazon Kendra・Google Vertex AI Search Enterpriseなどのエンタープライズ向けサービスや、よりシンプルなSaaS製品も多数あります。最新の対応機能・料金は各公式サイトで確認してください。

自前で構築する場合

オープンソースのフレームワーク(LangChain・LlamaIndexなど)を使ってRAGパイプラインを構築できます。エンジニアが必要ですが、文書の処理方法・検索ロジック・UIを自社要件に合わせてカスタマイズできます。

ノーコード・ローコードツール

プログラミングなしにRAG的な機能を使えるツールも増えています。Notionへの質問機能・SharePointのCopilot・各種ナレッジベースツールのAI検索機能などが該当します。


まとめ

RAGは「社内文書をAIに読み込ませて回答させる」最も実用的な方法です。ファインチューニングと比べてコストが低く、文書の更新がしやすいため、企業での導入が増えています。

精度を左右するのはAIモデルの性能より文書の品質です。まず既存の文書を整理することが、RAGの精度向上への最短経路です。

生成AIと従来AIの違いLLMとはも合わせて読むと、RAGが何の技術の上に成り立っているかの理解が深まります。

よくある質問

RAGとは何ですか

RAGは、AIが回答を生成する前に外部の文書データベースを検索し、見つけた情報を参照しながら回答を生成する技術です。独自の情報(社内文書・製品仕様など)をAIに扱わせるために使います。

RAGとファインチューニングの違いは何ですか

RAGは外部の文書を検索して参照しながら回答します。ファインチューニングはAI自体を特定のデータで再学習させます。情報の追加・更新が頻繁な場合はRAGが向いており、文体・形式を定着させたい場合はファインチューニングが向いています。

RAGはどんな企業に向いていますか

社内に大量のPDF・Word・社内wikiなどのドキュメントがあり、それをQ&A形式で検索・参照したい企業に向いています。法令・製品仕様・規程など更新頻度の高い情報を扱う場合に特に有効です。

RAGの導入には何が必要ですか

文書データの整備、ベクトルデータベース(文書を検索しやすい形に変換して格納するDB)、AIモデルのAPIが基本的な構成要素です。クラウドサービスを利用すれば、自前でインフラを構築しなくても始められます。