職種別AI仕事術

コンサルタントのデータ集計・分析をAIで行う手順

コンサルタントのデータ集計・分析をAIで行う手順

この記事の要点

ExcelやCSVのデータをAIで集計・分析する手順を解説。売上推移・市場シェア・アンケート集計など、コンサルタントが提案資料に使えるインサイトをAIから引き出す方法。

結論

データの集計と分析にAIを使うとき、最も効果が出るのは「分析コードを書かせる」「インサイトを言語化させる」の二点です。売上推移のCSVをChatGPTに渡してPythonコードを生成させると、ピボットテーブル・可視化・前年比計算が10分以内に終わります。コンサルタントが本当に時間を使いたい「そのデータが何を意味するか」の解釈と提案への接続は人間が担う、この役割分担が実務での定着につながります。


使うAIツール

ツール・機能適した作業
ChatGPT Advanced Data AnalysisCSVのアップロード、コード実行、グラフ出力
Claude.aiデータの解釈・インサイトの言語化・資料への接続
Excel Copilot(Microsoft 365)Excel内での集計・コード生成
Python(pandas/matplotlib)大規模データ、再現可能な分析フロー

ChatGPTのAdvanced Data Analysis(旧Code Interpreter)はCSVやExcelをアップロードしてPythonコードを自動実行できます。グラフ出力まで一貫して処理できるため、単発の分析タスクに向いています。再現可能な分析フローを構築するには、AIが生成したコードをPythonスクリプトとして保存して使い回します。


データ集計・分析の手順

ステップ1:データを整備してから渡す

AIへの入力データは「ゴミを入れればゴミが出る」が基本です。集計前に以下を確認します。

  • ヘッダー行が明確か(列名が日本語でも英語でも構いません)
  • 欠損値の扱いを決めているか(ゼロ埋め、除外、平均代入など)
  • 集計単位が統一されているか(円と千円が混在していないかなど)
  • 機密情報・個人情報が含まれていないか

この整備を省くと、AIが誤った前提で集計を行い、後から修正が必要になります。

ステップ2:分析の目的を明示してからコードを生成させる

「このデータを分析して」という指示では、AIは汎用的な集計しか行いません。何のためのデータ分析かを明示します。

以下のCSVデータを分析してください。

目的:2023〜2024年の製品別売上推移を把握し、成長製品と縮小製品を特定する

実施してほしい分析:
1. 製品カテゴリ別の年度売上合計(2023年・2024年)
2. 前年比成長率の計算(降順でソート)
3. 全体売上に占める各カテゴリのシェア変化
4. 成長率と絶対額を軸にしたマトリクス分類(成長×大・成長×小・縮小×大・縮小×小)

データ:
[CSVをここに貼り付け]

Pythonコードと実行結果の両方を出力してください。
コードには処理の内容を日本語でコメントを入れてください。

「Pythonコードと実行結果の両方を出力」と指示することで、コードの再利用と結果確認が両立します。

ステップ3:グラフを出力させる

数値だけでなく可視化まで依頼します。ChatGPTのAdvanced Data Analysisはグラフ画像を直接出力できます。

先ほどの分析結果を以下のグラフで可視化してください。

グラフ1:製品カテゴリ別の売上推移(積み上げ棒グラフ、2023年・2024年)
グラフ2:成長率ランキング(横棒グラフ、上位10カテゴリ)
グラフ3:マトリクス分類の散布図(X軸:成長率、Y軸:2024年売上)

グラフの凡例は日本語で、提案資料に貼り付けやすい解像度で出力してください。

ステップ4:インサイトを言語化させる

数値の整理が終わったら、解釈と示唆を言語化させます。

先ほどの分析結果を踏まえ、クライアントへの提案資料に使えるインサイトを整理してください。

フォーマット:
- このデータが示す主要な発見(3点、各2〜3文)
- クライアントが対処すべき優先課題(2点)
- さらに分析が必要な論点(確認できていない点も含め)
- 各発見の「だから何か」(次のアクションの方向性)

注:数値の解釈が推測の場合はその旨を明示してください。
データの範囲外の断言はしないでください。

この最後のステップが、データ集計を「提案素材」に変換する工程です。


具体的な活用例

例1:クライアントの売上データ分析(5,000行のCSV)

製造業クライアントの3年分の売上データ(月次・SKU別・地域別、5,000行)を分析する作業で、従来はアナリストが2〜3日かけていました。ChatGPTのAdvanced Data Analysisにアップロードし、「地域別・SKU別の売上トレンドと前年比を算出し、縮小と成長のカテゴリを分類する」というプロンプトで処理したところ、集計と可視化が2時間で完了しました。ただし、カテゴリ定義の確認と最終数値の照合は担当者が行っています。

例2:アンケート集計と自由記述の分析

500件のアンケート結果(選択式+自由記述)の集計と分析で、AIを二段階で使いました。選択式の集計はChatGPT Advanced Data Analysisで処理し、自由記述テキスト400件はClaude.aiに貼り付けて「主要なテーマ5つに分類し、代表的なコメントを各テーマ3件ずつ抽出してください」と指示しました。二日かかっていた集計作業が半日に短縮されました。


うまくいかない場合の対処

集計結果の数値が合わない:AIが集計の前提(除外条件・集計単位)を誤解していることが多いです。「このデータの集計前提を教えてください。どの行を除外しましたか、集計の単位は何ですか」と確認してから数値を検証します。

コードが実行エラーになる:データの型の問題(数値として読み込むべき列が文字列になっているなど)が原因の場合が多いです。「エラーの原因を特定して修正コードを出力してください」と指示すると自己修正します。

グラフが見づらい:「グラフのフォントサイズを14ptに、凡例を右側に、軸ラベルは日本語で」など具体的なフォーマット指定を追加します。

同じ分析を毎月繰り返す場合:AIに生成させたPythonコードをスクリプトとして保存し、次月以降は同じスクリプトを使い回します。月次更新のたびにAIに頼む必要がなくなります。


分析の品質を上げる補助テクニック

仮説検証型の分析

「このデータから何かわかりますか」ではなく「○○という仮説をデータで検証してください」と指示すると、AIの分析が目的指向になります。

以下の仮説をデータで検証してください。
仮説:「地方拠点の売上が前年比で落ちているのは、大口顧客の離脱ではなく新規顧客の獲得不足が原因である」

確認すべき観点:
- 既存顧客の購入頻度・単価の変化
- 新規顧客数の推移
- 地方拠点のみに絞ったコホート分析

データで確認できる点・できない点を分けて整理してください。

異常値の検出

このデータの中で、通常のパターンから外れている値を特定してください。
外れ値の判定基準(平均±2σ、前年比±30%など)を提案してから実施してください。
各外れ値について、考えられる原因も仮説として挙げてください。

Excel作業との連携

データ分析の自動化についてはコンサルタントのExcel作業をAIで自動化する方法でExcel固有の操作をカバーしています。分析で得たインサイトを提案書に落とし込む手順はコンサルタントの提案書作成をAIで効率化する方法を参照してください。

仮説構築についてはコンサルタントの仮説立案をAIで加速する方法が、この分析フローの続きになります。


まとめ

データ集計・分析でAIが最も力を発揮するのは、分析コードの生成とインサイトの言語化です。ChatGPTのAdvanced Data Analysisで集計・可視化を10〜30分で完了させ、解釈と提案への接続に人間の判断を集中させる。この分担で、従来2〜3日かかっていたデータ分析業務のうち、繰り返し作業の大部分を圧縮できます。集計の前提と最終数値の確認だけは必ず人間が行います。

よくある質問

AIは統計分析もできますか?

回帰分析や相関分析など基本的な統計はAIがコードを書いて実行できます。ChatGPTのAdvanced Data Analysisモードは、Pythonコードを自動生成して実行し、グラフも出力します。複雑な多変量解析はRやPythonの専門ツールと組み合わせます。

データをAIに入力するとき、個人情報はどう扱いますか?

氏名・住所・顧客IDなど個人を特定できる情報はAIに入力しないのが原則です。匿名化・集計済みデータに変換してから入力します。社内規定とセキュリティポリシーに従ってください。

AIの集計結果は信用できますか?

計算ミスや解釈の誤りが起きることがあります。特に集計の前提(除外条件、集計単位)を誤解した結果は出力が正しそうでも間違っていることがあります。重要な数値は手計算または関数で確認します。

大きなデータファイルはAIで処理できますか?

ChatGPTのAdvanced Data Analysisは数十万行のCSVを直接処理できます。それ以上のデータはSQLや専門ツールで前処理してから渡します。最新の制限は公式サイトで確認してください。