ハルシネーションはなぜ起こるのですか？

生成AIは次に来る確率が高い単語を予測して文を組み立てる仕組みで動いている。真偽を判定する機構を持たないため、データになくても統計的に「それらしい」内容を生成してしまう。

ハルシネーションを完全になくす方法はありますか？

現時点では完全な排除は難しい。RAGや出典明記の指示、人間による最終確認を組み合わせて低減するのが現実的なアプローチ。

どのAIがハルシネーションを起こしにくいですか？

モデルや用途によって傾向は異なる。最新の比較は公式情報や第三者ベンチマークで確認してほしい。

業務でハルシネーションを防ぐには何から始めればよいですか？

プロンプトに「根拠を示せ、示せない場合はわからないと答えよ」と加えることが、コストゼロで始められる最初の一手。

ハルシネーションとは？生成AIの誤情報を防ぐ対策

結論

ハルシネーションとは、生成AIが存在しない事実を確信を持って出力する現象である。架空の文献、実在しない人物のコメント、誤った統計数値などを、本物の情報と見分けがつかない形で生成する。完全な回避は現時点では不可能だが、プロンプトの工夫・RAGの活用・人間による最終確認の3点セットで業務上のリスクを大幅に下げられる。

ハルシネーションが業務に与える実害

2023年、米国の弁護士がChatGPTに判例調査を依頼し、存在しない裁判例を裁判所に提出して懲戒処分を受けた事例が広く報道された。判例名・裁判所名・争点まで整合性のある偽情報が生成されており、担当者は本物と区別できなかった。

日本の業務でも同様の事態は起きやすい。具体例を挙げると次のようなケースがある。

存在しないホワイトペーパーや調査レポートの引用
実際より高い製品スペックや価格の出力
人名・役職・所属の取り違え
法律条文の番号や施行日の誤り

いずれも出力文面は流暢で、確信に満ちた語調で書かれている。疑わなければ見逃す。

なぜ生成AIは誤情報を出すのか

生成AIの本質は「次に来る確率が最も高いトークンを予測するシステム」である。文脈から統計的にもっともらしい言葉を選んで並べていくため、「それらしく聞こえるが実在しない情報」を作り出すことができてしまう。

重要なのは、AIが「うそをついている」わけではない点だ。AIは真偽を判定していない。ただ確率の高い文字列を出力しているだけで、その内容が現実に存在するかどうかを検証する仕組みを持っていない。

この構造は、トレーニングデータに含まれる情報の密度とも関係している。情報量が少ない領域、古い情報、専門性が高い領域ほど、AIは「それらしい補完」に頼りやすくなる。

ハルシネーションが起きやすい4つの状況

業務で特に注意が必要な場面を整理する。

1. 固有名詞が絡む問い合わせ 「〇〇社の最新決算は？」「△△法の第何条に規定がある？」といった問いに対して、AIは記憶にある断片から補完する。社名・人名・条文番号が実際と異なっても、出力は自信ありげに見える。

2. 引用・出典を求める場面 「この主張の根拠となる論文を挙げてほしい」という依頼に対し、実在しないタイトル・著者・巻号を組み合わせた論文情報を出力することがある。論文データベースで確認しないと見破れない。

3. 最新情報を聞く場面 多くのモデルには学習データの締め切りがある。それ以降の出来事については特に推測・補完が増える。「最新の〇〇は」という質問は危険信号と思っておくとよい。

4. 長い会話の後半 会話が長くなるほど、前半のコンテキストが圧縮・省略されていく。後半で出力される情報の整合性が低下しやすい傾向がある。

誤情報を見分ける3つのサイン

出力を受け取った後に確認すべきポイントを3点挙げる。

① 具体的な数値・固有名詞・日付が含まれているか 数字が出てきたら、その数字を一次情報で裏取りする。「〇〇%」「〇〇年〇月」「第〇条」はすべて要確認の対象。

② 出典が示されているか AIが自発的に出典を示す場合でも、URLが存在するかどうか・著者名が実在するかどうかを確認する。出典があるように見えても、でたらめなケースは多い。

③ 質問と回答が都合よく一致しすぎていないか 質問への答えが完璧すぎる場合は疑ってかかる価値がある。人間の専門家でも「わからない」「調べてみる」と言うような問いに、AIが迷いなく完全回答を返してくるときは要注意。

ハルシネーションを減らす5つの対策

対策1: プロンプトで「わからない」と答えさせる

最も手軽な対策はプロンプトに制約を加えることである。

根拠が確認できない情報は「情報がないため回答できません」と答えてください。
推測で回答する場合は、必ず「推測ですが」と冒頭に明記してください。

この指示を入れるだけで、AIが不確かな領域でもっともらしい回答を作り上げる頻度が下がる。プロンプトの書き方の基本についてはプロンプトの書き方を参照してほしい。

対策2: 出典・根拠を必ず求める

回答の根拠を、信頼できる情報源とともに示してください。
情報源を示せない場合は、その旨を明記してください。

出典を求めることで、AIが補完によって情報を作り出した場合に「出典が示せない」という形で検出しやすくなる。

対策3: RAGでAIの参照先を限定する

RAGとは、AIが回答を生成する前に指定した文書を検索して参照させる仕組みである。自社の規程集・製品仕様書・過去の提案書などをRAGで参照させると、AIの回答根拠が実在する社内文書に限定されるため、ハルシネーションの発生を大幅に抑えられる。

クラウド型のAIツールの多くでRAG相当の機能が提供されている。料金や機能の詳細は各ツールの公式情報で確認してほしい。

対策4: 回答の検証ステップを業務フローに組み込む

AIの出力を「下書き」として扱い、最終確認を人間が行う体制を整える。特に外部公開するコンテンツ・法的効力を持つ文書・数値を含む資料は、担当者の目視確認を必須ステップにする。

生成AIをどう業務フローに組み込むかについては会社で生成AIを使うときの注意点でも詳しく触れている。

対策5: ハルシネーションが起きにくいタスクを選ぶ

生成AIが得意とするのは、実在する情報の「変換・整形・要約」である。自分で用意したテキストを要約させる・会議メモを整理させる・自分が書いた文章を校正させるといった用途は、AIがゼロから事実を作り出す必要がないため、ハルシネーションのリスクが格段に低い。

生成AIが苦手なことは何かについては生成AIでできること・できないことを読んでほしい。

業務領域別の注意ポイント

業務領域	リスクの高い使い方	安全な使い方
法務・コンプライアンス	条文・判例の確認	自社規程の文章整形
財務・経理	数値データの参照	自分が入力した数値の表作成
営業・提案	競合他社情報の調査	自社情報を渡した上での提案書下書き
広報・マーケティング	統計・調査の引用	自分で書いたコピーの改善
人事・採用	法律や制度の確認	求人原稿の文章表現の整理

いずれの領域でも、「AIが生成した情報そのものを一次情報として扱わない」という原則を守ることが基本。

ハルシネーションとAIツールの進化

モデルの改善が進むにつれてハルシネーションの頻度は下がってきているが、ゼロにはなっていない。各社が取り組んでいる主な技術的アプローチとして、学習時の強化学習による事実整合性の向上、回答時に外部情報を参照するグラウンディング、回答の不確実性を明示する仕組みなどがある。ただし、いずれも一定の効果はあっても根本解決ではない。

2026年6月時点では、ハルシネーションが完全に解消されたモデルは存在しない。具体的なモデルごとの性能は最新のベンチマーク情報で確認してほしい。

まとめ

ハルシネーションはプロンプトの工夫・RAG・人間確認の組み合わせで業務上の影響を下げられる。まず今日からできる一手は、プロンプトに「根拠を示せ、示せない場合はわからないと言え」と加えること。次のステップとして、AIの回答を最終判断の材料ではなく「起点としての下書き」と位置づける業務フローを整備していくとよい。