データ集計・分析をAIで補助する方法
この記事の要点
ExcelデータをAIに渡して集計・グラフ提案・コメント生成させる手順、ChatGPTの高度なデータ分析機能の使い方、AIが計算ミスをすることへの注意と検算の重要性を解説します。
結論:データ集計はAIに渡すだけで補助ができるが、検算は必ず行う
ExcelやCSVのデータをAIに渡してやりたいことを説明すると、集計、平均、グループ別の比較、グラフの提案などを補助してくれます。専門的なツールを使わなくても、手元のデータを素早く分析する補助として活用できます。
ただし、AIは計算ミスをします。基本的な集計でも、特定の条件での集計や複数のステップが必要な計算では誤りが出ることがあります。特に意思決定に使う数字は、元のデータで必ず検算します。
この記事では、ExcelデータをAIで分析する手順、ChatGPTの高度なデータ分析機能の使い方、そして検算の重要性と方法を解説します。
どんな分析にAIが向くか
AIによるデータ補助が効果的な場面と、向いていない場面を最初に整理します。
AIが得意な場面は次のとおりです。
定型レポートの文章化です。毎月同じ形式で数字をまとめる作業で、AIにデータを渡してコメントを生成させると、文章化の時間が短縮できます。
分析の切り口の提案です。どんなグラフや比較軸が有効かを提案させると、自分では思い浮かばなかった視点が出てきます。
Excelの関数・操作の補助です。「このデータで月別の上位3品目を出すにはどうすればよいか」という質問に、関数の書き方を教えてくれます。
一方で、向いていない場面もあります。非常に大きなデータセットの処理は、AIの入力上限を超えることがあります。統計的な有意性の検定や、複雑なモデリングは専門のツールと知識が必要です。データ品質の確認も、AIは渡されたデータをそのまま信じるため、異常値や欠損値の検出は人間が行います。
テキストベースでの分析補助
ChatGPTやClaudeなどの生成AIで、テキストとして数値データを分析する方法です。
少量のデータ(数十〜数百行程度)であれば、テキストとして貼り付けて分析できます。
以下の月次売上データを分析してください。
| 月 | 製品A | 製品B | 製品C | 合計 |
|----|-------|-------|-------|------|
| 1月| 1,240 | 890 | 450 | 2,580 |
| 2月| 1,180 | 920 | 510 | 2,610 |
| 3月| 1,380 | 850 | 490 | 2,720 |
| 4月| 1,450 | 780 | 560 | 2,790 |
| 5月| 1,320 | 810 | 600 | 2,730 |
# 確認したいこと
1. 各製品の前月比の変化
2. 最も成長率が高い製品
3. 合計売上の傾向
# 注意
- データにない情報は推測せず、示されたデータのみで分析する
- 計算結果は必ず数値で示す
「データにない情報は推測せず」という指示が重要です。この指示がないと、AIが「外部要因の影響で〜と考えられます」といった根拠のない推測を含めることがあります。
出力された分析結果は、元データと照合して計算が正しいかを確認します。
ChatGPTの高度なデータ分析機能
ChatGPT PlusおよびTeamプランでは、Excelファイルをアップロードするとその場でデータ処理ができる高度なデータ分析機能が使えます。
この機能の特徴は、ファイルをアップロードするだけで、Pythonのコードを書かずにデータを処理できることです。裏でPythonが実行されており、会話形式でどんな分析をしたいかを伝えると、コードを書いて実行し、結果を返します。
使い方の手順です。
ChatGPTのチャット画面で、添付ファイルのアイコンからExcelファイルまたはCSVファイルをアップロードします。
ファイルが読み込まれたら、やりたいことを自然な言葉で指示します。
アップロードしたファイルを分析してください。
# 確認したいこと
1. 月別の売上合計と前月比
2. カテゴリ別の売上構成比(グラフも作成)
3. 上位5件の製品の一覧
# 注意
- 計算は正確に行い、結果の数値を必ず表示する
- グラフは日本語ラベルで作成する
グラフが生成されたら、ダウンロードして報告書に使えます。
重要な注意点は、ファイルに含まれる情報の機密性です。社外秘の情報や個人情報が含まれるファイルは、データが学習に使われない設定を確認してから使います。ChatGPT TeamプランとEnterpriseプランでは、入力データが学習に使われない設定が可能ですが、最新のポリシーは公式サイトで確認してください。
Excelの操作・関数の補助
データを直接AIに渡すのではなく、Excelの操作方法を教えてもらう使い方も効果的です。
例として、「複数の条件で集計するExcelの関数を教えてほしい」という質問に、SUMIFS関数の書き方と使い方を説明してくれます。この方法なら、データ自体をAIに渡さずに済みます。
Excelでの集計方法を教えてください。
# やりたいこと
A列に日付、B列に担当者名、C列に金額が入ったデータがあります。
特定の担当者(山田)の2026年4〜6月の合計金額を出したい。
# 環境
Excel 2021
どの関数を使えばよいですか。実際の式の例も示してください。
AIが書いた関数の式を、実際のExcelに入力して動作を確認します。式の構造が分かれば、担当者名や期間を変えて応用できます。
ピボットテーブル・グラフの活用補助
Excelのピボットテーブルやグラフ作成の手順を、AIに教えてもらいながら進める方法です。
Excelのピボットテーブルの作り方を教えてください。
# データの構成
A列:日付、B列:地域、C列:製品名、D列:売上金額
# 作りたい集計
行:地域別、列:月別、値:売上合計
# 知りたいこと
1. ピボットテーブルの作成手順
2. 集計を「合計」から「平均」に変える方法
3. このデータに適したグラフの種類と、その理由
ピボットテーブルの操作手順を説明してもらいながら、実際に手を動かして覚えると、次回から自分で設定できるようになります。
分析コメントの生成
月次レポートや週次レポートで、数字の推移をコメントとして書く作業に時間がかかる場合、AIに数字を渡してコメントのドラフトを生成させられます。
以下の数字を基に、経営陣への週次レポート用のコメントを作成してください。
# 今週の数字
- 新規問い合わせ:48件(先週比 +12件、前年同週比 +23%)
- 商談化率:62%(先週比 -3%、前年同週比 +5%)
- 成約件数:8件(先週比 -2件、前年同週比 +14%)
- 解約件数:1件(先週比 変化なし)
# コメントの条件
- 数字にある変化のみ言及する(原因の推測は含めない)
- 注目すべき変化を先に書く
- 150字以内
- 「要確認:〜」として、担当者がコメントを追加すべき箇所を示す
出力されたコメントは、担当者が元データと照合し、必要な背景コメントを加えて使います。「原因の推測は含めない」という指示をつけることで、根拠のないコメントを防ぎます。
AIによる計算ミスへの注意と検算
AIは計算ミスをします。特に次のケースで誤りが出やすいです。
複数ステップの計算です。「前月比を出して、さらにその平均を出して」のように、計算を重ねるほど誤りが積み重なるリスクが上がります。
条件付き集計です。「Aという条件かつBという条件で集計」のような複数条件の集計で、条件の解釈が曖昧だと間違えます。
パーセンテージの計算です。分子と分母の設定や、割合の計算の順序で誤りが出やすい。
検算の方法として推奨する手順は次のとおりです。
AIが出した計算結果の数値を、元のデータでExcelまたは電卓を使って手計算または関数で確認します。特に意思決定に使う数字や、報告書に載せる数字は必ず検算します。
以下の計算結果を確認したいです。
計算過程を示してください(元の数値→計算の手順→結果)。
どの数値をどう計算したかが分かる形にしてください。
(AIの分析結果を貼り付け)
計算過程を示させると、どこで誤りが起きているかを確認しやすくなります。
RAGの基礎として、AIが情報を処理する仕組みを理解すると、誤りが出やすい状況を予測しやすくなります。
データをAIに渡す前の前処理
データの品質が低いと、分析の結果も信頼できません。AIに渡す前に基本的な前処理を行います。
個人情報の除去です。氏名、メールアドレス、電話番号、住所など、個人を識別できる情報は削除またはマスキングします。分析に必要な属性情報のみを残します。
欠損値の確認です。空白のセルや、明らかに異常な値が含まれていないかを確認します。AIは欠損値をそのまま扱うため、欠損が多いデータは分析前に方針を決めます。
表記の統一です。「東京都」「東京」「Tokyo」が混在していると、グループ別集計が正確に出ません。分析に使う項目の表記を統一します。
データ型の確認です。日付を文字列として入力していると、月別の集計がうまくいかないことがあります。Excelの列の型が正しいかを確認します。
分析結果の可視化
AIが出した集計結果をグラフにするとき、どのグラフが適切かをAIに提案させることも有効です。
以下のデータをグラフで可視化したいです。
このデータに最適なグラフの種類を3つ提案し、それぞれの理由を説明してください。
また、Excelでの作り方も簡単に示してください。
# データの概要
- 5製品の月別売上(12か月分)
- 各製品の合計と割合も見たい
グラフの種類の選択では、「時系列の変化」には折れ線グラフ、「構成比」には円グラフや積み上げ棒グラフ、「項目間の比較」には棒グラフが基本です。AIが提案するグラフ種類の妥当性を、自分で判断して採用します。
活用の範囲を広げる
データ分析の補助が使えるようになると、以下の業務にも応用できます。
顧客データの傾向分析です。購入頻度、購入金額、最終購入日のデータを渡して、セグメントの分類を補助させることができます。ただし、顧客の個人情報の扱いには細心の注意を払います。
アンケートの集計と分析です。自由記述の回答をまとめてカテゴリ分類させたり、数値回答の統計を出させたりできます。
業務データの異常値の発見です。日次のデータを渡して、通常と異なるパターンがないかを確認させることができます。ただし、AIの指摘を鵜呑みにせず、自分でも確認します。
プロンプトの書き方の基本として、データ分析の指示を正確に伝えるための構造を学ぶと、より精度の高い出力が得られます。
コストとツールの選択
データ分析の補助に使えるツールは複数あります。コストとできることを整理します。
無料で使えるChatGPTの基本プランでは、テキストとして数値データを貼り付けての分析が可能です。ファイルのアップロードと実行機能はPlusプラン以上が必要です。
ClaudeやGeminiも同様に、テキストでのデータ分析補助ができます。それぞれ入力できるデータ量(コンテキストウィンドウ)が異なるため、大量のデータを扱う場合は上限を確認します。
Copilot for Microsoft 365を導入している企業では、ExcelへのCopilot機能が使える場合があります。Excelの操作画面から直接AI補助が使えるため、ファイルをコピーして別ツールに渡す手間が省けます。
いずれのツールも、機密性の高いデータを扱う場合は、データが学習に使われないプランの確認が必要です。最新のプランや機能は各サービスの公式情報で確認してください。
まとめ
ExcelデータをAIに渡しての集計・分析補助、ChatGPTの高度なデータ分析機能によるファイル直接処理、Excelの関数・操作方法の補助という3つのアプローチで、データ分析業務を効率化できます。AIは計算ミスをするため、意思決定や報告書に使う数字は元データで検算することが必須です。個人情報を含むデータは事前に除去し、機密情報は学習に使われないプランで扱います。
よくある質問
AIはExcelの関数を使わなくても集計できますか
できます。データを貼り付けてやりたいことを説明すると、合計・平均・グループ別集計などを行い、結果を出力します。ただしAIが計算ミスをすることがあるため、重要な数字は元のデータで検算します。
ChatGPTの高度なデータ分析機能とは何ですか
ChatGPT PlusおよびTeamプランで使えるデータ分析機能で、Excelファイルをアップロードするとその場でPythonコードを実行してデータを処理・集計・グラフ化できます。ブラウザ上でデータを分析できるため、Pythonの知識がなくても使えます。
AIにデータを渡すときの個人情報の扱いはどうすればよいですか
氏名・メールアドレス・電話番号などの個人を識別できる情報はAIに渡す前に削除またはマスキングします。分析に必要な属性情報のみを残し、個人が特定できない形にしてから渡します。
AIの分析結果はどの程度信頼できますか
集計・平均・比率など基本的な計算は概ね正確ですが、誤りが出ることがあります。特に複雑な条件付き集計や、データの解釈を伴う分析は、結果を元のデータと照合する確認が必要です。分析結果をそのまま意思決定に使う前に必ず検証します。