職種別AI仕事術

コンサルタントのアンケート設問をAIで作る方法

コンサルタントのアンケート設問をAIで作る方法

この記事の要点

コンサルタントがヒアリング設計や従業員アンケートの設問をAIで作成する手順を解説。バイアスを排除した設問と回答選択肢を、経験の少ないメンバーでも高品質に作れます。

結論

コンサルタントがアンケートや構造化インタビューの設問を作る際、AIを使うと設問の網羅性と中立性の確保が格段に楽になります。「何を明らかにしたいか」という調査目的と仮説を自分で決めてからAIに渡せば、バイアスを排除した設問の初稿が数十分で出ます。

設問設計で特に難しいのは、聞きたいことを聞けていない設問と誘導的な設問を排除する作業です。AIは設問のバイアスチェックにも使えるため、品質管理の工程も効率化できます。

使うAIツール

ツール向いている用途
ChatGPT(GPT-4o)設問の初稿生成・回答選択肢の生成
Claude(claude.ai)複雑な調査設計・バイアスレビュー・設問の改善提案
Gemini AdvancedGoogle Formsと連携した設問生成

アンケートの対象がクライアントの従業員や顧客の場合、個人情報・業界機密を含む前提情報は匿名化または抽象化してから入力してください。「製造業クライアントの製造部門従業員へのアンケート」のような形で入力します。

手順:アンケート設問をAIで作る

ステップ1:調査目的と仮説を定義する

設問を作る前に、次の3点を自分で決めます。この3点が決まっていない状態でAIに依頼すると、表面的な設問しか出てきません。

  • 調査で明らかにしたいこと:「業務効率化の障壁は何か」「現状の組織コミュニケーションの課題はどこか」
  • 持っている仮説:「情報共有の問題よりスキル不足の方が大きい」「管理職が変革に消極的である可能性がある」
  • 回答者の属性と文脈:役職・部門・日常業務の内容

これを先に決めてからAIに渡すことで、「この仮説を検証するための設問」という軸が明確になります。

ステップ2:設問生成プロンプト

以下の調査目的に合ったアンケート設問を作成してください。

【調査目的】
製造業クライアントの工場において、デジタルツール導入後の現場定着を阻む要因を特定する。

【持っている仮説】
1. ツールの操作複雑さより「入力の手間が増えた」という知覚的コストが定着を妨げている
2. 現場リーダーのデジタルに対する態度が、メンバーの利用率に影響している
3. ツール導入の目的(なぜ入れるのか)が現場に伝わっていない

【回答者】工場の現場作業員(20〜50代、デジタル経験は様々)

【設問の要件】
- 設問数:20〜25問
- 形式:5段階評価(リッカート尺度)が中心、自由記述2問を含む
- 各仮説を検証できる設問を3〜5問ずつ含める
- 誘導尋問・二重否定・複合設問を避ける
- 専門用語を避け、現場作業員が理解できる平易な言葉を使う

出力形式:設問番号、設問文、回答形式(5段階or自由記述)、どの仮説を検証するか

このプロンプトで、仮説ごとに対応した設問と回答形式の初稿が出ます。

ステップ3:バイアスチェックを依頼する

生成された設問リストに対して、バイアスチェックを別プロンプトで依頼します。

以下のアンケート設問リストをバイアスの観点でレビューしてください。

チェックする項目:
1. 誘導尋問(特定の回答を誘導する表現があるか)
2. 二重否定(読みにくい否定構造がないか)
3. 複合設問(1問に2つ以上のことを聞いていないか)
4. 仮定の事実を前提にしている設問(「〇〇が不十分だと感じますか?」のように問題を前提にするもの)
5. 選択肢のバランス(肯定的な選択肢と否定的な選択肢が均等か)

問題のある設問は番号と問題の種類を指摘し、改善案を添えてください。

このチェックを入れることで、人間だけでは見落としがちなバイアスを体系的に排除できます。

ステップ4:回答選択肢を最適化する

リッカート尺度を使う設問では、選択肢のラベルが回答の分布に影響します。

以下の設問の回答選択肢を最適化してください。

設問:「業務の中でデジタルツールを使う際に感じる手間はどのくらいですか?」

現在の選択肢:まったくない・少しある・ある・かなりある・非常にある

以下の観点で改善案を出してください:
- 「ある」「かなりある」の境界が曖昧な場合の修正方法
- 中間点が「どちらでもない」になっている場合の問題点
- 選択肢のラベルが回答者に同じ意味で伝わるかの確認

コンサル固有の具体例

例1:組織変革プロジェクトの従業員意識調査

小売業クライアントで、新しい評価制度の導入前に従業員の意識・懸念を把握するアンケートを設計しました。経営と現場の認識ギャップを測ることが目的でしたが、「ギャップがあるか」という問いかけ方自体が誘導的になるリスクがありました。

AIに「評価制度に関する設問で、経営への批判や不満を聞く設問が誘導的にならないようにするにはどうすればよいか」と投げたところ、「現状への不満を直接聞く」のではなく「現在の評価制度で大切だと感じる要素は何か」「改善してほしいと思う点は何か」のように、肯定的な観点と改善提案の形で聞く設問の書き方が提案されました。

この方法で回答者が防衛的にならずに本音を書きやすいアンケートが設計でき、自由記述の回答率が事前の想定より20ポイント高くなりました。

例2:ヒアリングガイドの設計

半構造化インタビューの設問ガイドをAIで作った例です。10名の現場リーダーへのインタビューで、「現状業務の課題」と「AI活用への期待・懸念」を聞く構成が必要でした。

「半構造化インタビュー用のガイドとして、オープンクエスチョンと掘り下げ質問(プローブ)のセットで設計してください」と指示したところ、主質問1つに対して掘り下げ質問3つというセット構成で出力されました。

例:主質問「現在の業務の中で最も時間がかかっていると感じる部分はどこですか?」、掘り下げ①「その作業が時間のかかる原因として考えられることは何でしょうか?」、掘り下げ②「もしその時間が半分になったとしたら、浮いた時間を何に使いたいですか?」、掘り下げ③「過去にその課題を解決しようとしたことはありますか?」

インタビューの深さがインタビュアーの経験に左右されにくくなり、経験の少ないメンバーがインタビューしても一定の質が保てました。

課題整理のプロセスについては課題整理をAIで進める手順を参照してください。調査設計と課題整理は連動しており、仮説が整理されているほど設問の質が上がります。

うまくいかない場合

設問が表面的で現状を把握できない

AIが出す設問は「一般的なアンケート設問」から入るため、表面的になりやすいです。「持っている仮説に対して反証できる設問も含めてください」と追加すると、仮説が正しくない場合にも気づけるような設問が加わり、調査の信頼性が上がります。

設問数が多くなりすぎる

AIは指定した仮説を全部カバーしようとするため、設問数が膨らみがちです。「最も重要な仮説に絞って10問以内にしてください」と制約を追加するか、「優先度の低い設問を5問削除してください」と出力を削らせる指示を続けて行います。

業界特有の言葉が適切に反映されない

AIは一般的な日本語の使い方を学習しているため、クライアントの業界用語や社内用語が設問に反映されません。「この業界では『ロスト』が在庫廃棄の意味で使われる」のような補足をプロンプトに追加するか、AIが出した設問を人間が業界表現に書き換えてください。

選択肢の回答分布が偏る

事前のパイロットテスト(数名への試答)なしに本番を行うと、設問によって回答が極端に一方に偏るケースがあります。AIに「この設問で回答が90%以上『非常に重要』に集まる可能性がある場合、設問の問い方を変えてください」と指示することで、弁別力の低い設問を事前に改善できます。

設問設計の品質チェックリスト

AIで設問を作った後、配布前に確認する6点です。

  1. 調査目的と仮説を検証できる設問が揃っているか
  2. 誘導尋問・二重否定・複合設問がないか
  3. 回答者が10〜15分で答えられる設問数か
  4. 自由記述設問が最低1〜2問含まれているか
  5. 選択肢のラベルが均等で偏っていないか
  6. 業界・企業固有の表現が正確に使われているか

仮説立案をAIで加速する方法と組み合わせると、仮説の精度が上がり、それに対応したアンケート設問の質も上がります。

成果物作成をAIで効率化する方法も参照してください。アンケートの回答データを成果物に落とし込む工程もAIが支援できます。

まとめ

アンケート設問作成でAIが最も役立つのは、仮説に対応した設問の網羅的な初稿生成とバイアスチェックです。調査目的と仮説を自分で決めてからAIに渡すことで、「何を聞くべきか」が明確になり、設問の精度が上がります。

バイアスチェックを別ステップでAIに依頼する習慣を持つことで、誘導的な設問が残ったまま本番を迎えるリスクを大幅に減らせます。AIが出した設問を叩き台にして、業界表現の調整と設問数の絞り込みを人間が行うことが実用的な運用です。

よくある質問

アンケート設問作成でAIに任せてはいけない部分はどこですか?

調査の目的と仮説の設定はAIに任せてはいけません。何を明らかにしたいかが決まらないまま設問を作ると、回答を集めても意思決定に使えないデータになります。また、クライアントの業界特有の言葉遣いや組織文化に合わせた表現の調整は人間が行う必要があります。

リッカート尺度(5段階評価)と自由記述はどう使い分けますか?

定量的な比較が必要な設問(満足度・重要度・頻度)にはリッカート尺度が向いています。なぜそう感じるか・具体的な経験を把握したい場合は自由記述を使います。アンケートが長くなるとリッカート尺度の設問が増えがちですが、自由記述1〜2問は質的な洞察を得るために残しておくことを推奨します。

設問数の上限は何問が適切ですか?

対象者と調査方法によります。従業員アンケートでは20〜25問・10〜15分以内が完答率を保てる上限の目安とされることが多いです。ただし対象者の業務負荷や調査の重要性によって変わるため、一律に決めることはできません。事前に数名に試答してもらい、所要時間を測るのが確実です。

AIで設問を作る際に気をつけるバイアスの種類は?

誘導尋問(答えを誘導する設問)、二重否定(読みにくい設問)、複数の概念が入った設問(1問で2つのことを聞く)の3つが特に注意が必要です。AIにプロンプトで『これらのバイアスが含まれていないかレビューしてください』と依頼すると指摘してくれます。