アンケート自由回答をAIで分析する方法
この記事の要点
自由記述のアンケート回答は、ChatGPTへの貼り付けとカテゴリ分類の指示で短時間に集計できます。100件から1000件超のスケール別の対応方法、感情分析と要点抽出の手順をプロンプト例とともにまとめました。
結論:自由記述はカテゴリ分類→感情分析→要点抽出の順に処理する
自由記述のアンケート回答は、ChatGPTに貼り付けてカテゴリ分類を指示することで、手作業の何倍もの速さで集計できます。基本の流れは、回答をカテゴリに仕分ける、各カテゴリの感情をポジティブ・ネガティブ・中立に分ける、カテゴリごとの代表的な意見を要約する、という3ステップです。
件数が100件以内なら一度に処理できます。500件・1000件超の場合は分割して処理し、最後に集計します。この記事では、各ステップの具体的なプロンプトと、件数別の対応方法を詳しく説明します。
なぜ自由記述の分析は手作業では大変なのか
選択式の回答は集計が簡単です。件数を数えてパーセントを出せば終わります。しかし自由記述は違います。500件の回答があれば、500の異なる文章があります。それを読んで、何かテーマでまとめて、グラフにするまでの工程は、担当者が数日かけることもめずらしくありません。
手作業での分析には、担当者の主観が入るという問題もあります。同じ回答を2人の担当者が読んだとき、カテゴリの判断が食い違うことがあります。AIを使うとカテゴリの定義を固定して一貫した基準で処理できます。
事前準備:データを整える
AIに渡す前に、データを整えておくことが重要です。回答を番号つきのリストにしておくと、後の集計で参照しやすくなります。Excelやスプレッドシートから回答列をコピーして、以下のような形にします。
1. 対応が丁寧で、質問にすぐ答えてもらえた
2. 待ち時間が長かった
3. 説明が分かりにくかった
4. スタッフの対応が親切だった
5. 料金の説明がもう少し詳しければよかった
このとき、個人情報の処理を忘れてはいけません。名前、メールアドレス、電話番号、所属会社名など、個人を特定できる情報が含まれていれば、AIに入力する前に削除します。これは社内ポリシーと、使用するAIのデータ利用規約の両方で確認が必要です。
ステップ1:カテゴリ分類
最初のステップは、回答を意味のまとまりでカテゴリに仕分けることです。カテゴリはAIに自動生成させることもできますし、事前に決めておくこともできます。
事前にカテゴリを決めておく場合のプロンプトは次のようになります。
以下のアンケートの自由回答を、指定したカテゴリのいずれかに分類してください。
# カテゴリ
- スタッフ対応
- 待ち時間
- 料金・費用
- 説明の分かりやすさ
- 施設・環境
- その他
# 出力形式
番号, カテゴリ名
(例: 1, スタッフ対応)
# 回答一覧
(ここに番号つき回答を貼り付け)
カテゴリが事前に決まっていない場合、または何のテーマが多いか先に確認したい場合は、AIにカテゴリを生成させます。
以下のアンケート自由回答から、内容の共通テーマを5〜8個のカテゴリとして抽出してください。
その後、各回答をどのカテゴリに当てはまるか分類してください。
# 回答一覧
(ここに貼り付け)
ステップ2:感情分析
カテゴリに分類したあと、各回答の感情をポジティブ・ネガティブ・中立に分けます。これにより「スタッフ対応」に関する回答のうち、何割がポジティブで何割がネガティブかが把握できます。
以下のアンケート回答について、それぞれの感情をポジティブ、ネガティブ、中立のいずれかで分類してください。
# 判断基準
- ポジティブ: 満足・好意的・感謝・称賛を示す回答
- ネガティブ: 不満・批判・改善要望を示す回答
- 中立: 事実の記述のみ、または判断しにくい回答
# 出力形式
番号, 感情
(例: 1, ポジティブ)
# 回答一覧
(ここに貼り付け)
カテゴリと感情を組み合わせると、たとえば「スタッフ対応:ポジティブ30件、ネガティブ5件」「待ち時間:ネガティブ20件、中立3件」のような集計が作れます。
ステップ3:要点抽出とサマリー作成
カテゴリごとの感情が整理できたら、各カテゴリの代表的な意見を要約します。これが最終的なレポートの核になります。
以下は「スタッフ対応」カテゴリに分類されたアンケート回答です。
このカテゴリの回答から、以下を作成してください。
1. 主要なテーマ(3〜5点の箇条書き)
2. ポジティブな意見の代表例(2〜3件の引用)
3. ネガティブな意見・改善要望の代表例(2〜3件の引用)
4. このカテゴリ全体の1段落サマリー
# 回答一覧
(カテゴリ「スタッフ対応」の回答をここに貼り付け)
引用を使うことで、数字だけでなく実際の声をレポートに盛り込めます。サマリーだけでは伝わらない温度感が、引用によって伝わります。
件数別の対応方法
100件以内
1回のメッセージで全件貼り付けて処理できます。カテゴリ分類と感情分析を1回の指示で同時に依頼することも可能です。
以下の回答を、カテゴリに分類しつつ、各回答の感情もポジティブ/ネガティブ/中立で判定してください。
# カテゴリ
(カテゴリ一覧)
# 出力形式
番号, カテゴリ, 感情
# 回答
(全件貼り付け)
500件
100件ずつ5回に分けて処理します。Excelで100行ごとにシートを分けると管理しやすくなります。各バッチで同じプロンプトを使うことで、分類基準が統一されます。5回分の結果をExcelに集約して、Excelのピボットテーブルで集計します。
1000件超
Pythonと組み合わせた処理が現実的です。ChatGPTのAPIを使い、100件ずつバッチ処理するスクリプトを書くことで自動化できます。APIの利用料金がかかりますが、手作業よりもはるかに高速に処理できます。Pythonの知識が必要なため、社内のエンジニアと協力するか、社内のシステム担当者に相談することを推奨します。
人手で処理する場合でも、500件と同様に分割して進めます。ただし件数が多いほど、分類の一貫性を保つためにカテゴリ定義を明文化しておくことが重要です。
集計と可視化
分類結果をExcelに転記したら、ピボットテーブルでカテゴリ別・感情別の件数を集計します。棒グラフや円グラフで可視化すると、報告資料として使いやすくなります。
AIに直接集計させることもできます。
以下は分類結果の一覧です。
カテゴリ別の件数と、カテゴリごとの感情比率(ポジティブ/ネガティブ/中立の割合)を表形式でまとめてください。
# 分類結果
番号, カテゴリ, 感情
1, スタッフ対応, ポジティブ
2, 待ち時間, ネガティブ
(以下続く)
Markdown形式で表を出力させると、そのまま報告書に貼り付けられます。
精度を上げる5つのコツ
カテゴリ定義を具体的にする。「スタッフ対応」だけでなく、「スタッフの言葉遣い、態度、対応速度に関する回答」と定義すると、境界線上の回答の仕分けが安定します。
サンプルを渡す。プロンプトにカテゴリごとの例文を1〜2件添えると、AIが基準を把握しやすくなります。
結果をランダムサンプリングで確認する。全件確認は不要ですが、各カテゴリから5〜10件を抜き取って人間が読み、分類が適切かをチェックします。
あいまいな回答は「その他」にまとめる。無理に既存カテゴリに押し込むと、集計の信頼性が下がります。「その他」に集まった回答を別途読んで、新しいカテゴリが必要かを判断します。
同じプロンプトを保存しておく。定期的なアンケートなら、分類プロンプトを保存して毎回使い回すことで、調査間の一貫性が保てます。
よくある失敗と回避策
回答が長くて文字数制限に引っかかるケースがあります。1回のメッセージに収まるよう、回答を短く整形するか、件数を減らして分割します。
AIが似たような意見を別カテゴリに分けてしまうケースもあります。カテゴリの定義が重なっていないか確認し、定義を見直します。
感情分析でネガティブの件数が実感より多い、または少ないケースもあります。批判的な語気が強い回答と、事実として問題点を指摘している回答の基準が混在していることが原因であることが多いです。判断基準をプロンプトに明記することで改善できます。
分析結果のレポート化
最終的なレポートは、以下の構成が実務で使いやすいです。
- 調査概要(回答数、実施時期、質問内容)
- カテゴリ別件数グラフ
- カテゴリ別感情比率
- 各カテゴリのサマリーと代表引用
- 改善優先度マトリクス(件数×感情の組み合わせで優先度を出す)
AIにこの構成に沿った草稿を作らせることもできます。
以下の集計データとサマリーをもとに、経営層向けのアンケート分析レポートの草稿を作成してください。
構成は、調査概要→主要発見点→カテゴリ別分析→改善提言の順にしてください。
# 集計データ
(集計表を貼り付け)
# 各カテゴリのサマリー
(前のステップで作成したサマリーを貼り付け)
草稿を人間が確認し、数字の正確性と解釈の適切さをチェックしてから仕上げます。
プロンプト設計の原則
アンケート分析でAIを使う際に共通するプロンプト設計の原則を3つ挙げます。
出力形式を固定することです。番号とカテゴリをカンマ区切りで出力させると、そのままExcelに貼り付けられます。形式が毎回変わると後処理が増えます。
判断の根拠を求めないことです。全件に理由をつけさせると出力が長くなり、後処理が大変になります。判断基準に迷う回答だけ「判断に迷った場合はその理由を添える」と指示すると、確認が必要な回答を効率よく見つけられます。
推測や補完を禁止することです。回答に書かれていない背景をAIが補うことがあります。「回答文に書かれていない内容は推測しないこと」を明記すると、分析結果の信頼性が上がります。
プロンプトの工夫については プロンプトの書き方 も参考になります。
情報収集との組み合わせ
顧客アンケートの分析結果を、競合の顧客レビューや口コミと組み合わせて比較分析することもできます。自社の顧客が評価しているポイントと、競合への不満が重なる部分を見つけると、差別化のヒントが得られます。
情報収集にAIを活用する方法については 情報収集・リサーチをAIで速くする が参考になります。
注意点:AIの分析結果の取り扱い
AIが出力したカテゴリや感情の判定は、高い精度で動きますが完璧ではありません。とくに次の点に注意が必要です。
皮肉や反語を含む回答は、感情の判定がずれることがあります。「丁寧すぎて逆に不自然だった」のようなコメントは、文面だけ読むとポジティブと判定されることがあります。
業界特有の用語や文脈は、一般的な判断基準が合わないことがあります。専門知識が必要な分野のアンケートは、AIの分類をそのまま使わず、専門知識を持つ人が確認します。
最終的な解釈と意思決定は人間が行います。AIは仕分けと集計を速くしてくれる道具であり、データから何を読み取るかは分析者の判断です。
まとめ
自由記述のアンケート分析は、カテゴリ分類・感情分析・要点抽出の3ステップをAIに処理させることで、大幅に時間を短縮できます。100件以内なら一括処理、500件は100件ずつ分割、1000件超はAPIの活用が現実的です。プロンプトの出力形式を固定し、Excelと組み合わせて集計することで、そのままレポートに使えるデータが得られます。AIの分析結果はサンプルチェックを行い、解釈は人間が担います。
そのまま使えるプロンプトの書き方については そのまま使えるビジネスプロンプト集 も合わせて参照してください。
よくある質問
自由記述の回答が何件あればAI分析が効果的ですか
30件程度から効果が出ます。件数が少ないと人手でも十分に処理できますが、50件を超えてくるとカテゴリ分類の手間が大きくなるため、AIを使うと時間を短縮できます。
ChatGPTに一度に貼り付けられる文字数に上限はありますか
モデルによって異なります。無料版は1回のやりとりで処理できる量が限られるため、100件を超える場合はバッチに分割する必要があります。有料版はより多くを一度に処理できますが、正確な上限は公式で確認してください。
AIの分類結果はそのまま信頼できますか
カテゴリの大まかな仕分けは実用精度で動きます。ただし境界線上の回答や、ニュアンスが重要な感情分析は人間がサンプルチェックをすることを推奨します。
個人情報が含まれるアンケートデータをAIに入力していいですか
入力前に個人を特定できる情報を除去するか、データが学習に使われない法人向けプランを使ってください。社内の情報管理ポリシーも必ず確認してください。