営業の文字起こしをAIで整形する方法
この記事の要点
商談録音の文字起こしをAIで整形すると、話者分離・要約・ネクストアクション抽出が10分以内に完了する。Whisper+ChatGPTを使った具体的な手順とプロンプトを解説。
結論
商談後に手動で議事録を書いている時間は、AIで8割削減できる。録音ファイルをWhisperに通すと話者付きの生テキストが得られ、そこにChatGPTで整形プロンプトを当てると「誰が何を言ったか」「課題は何か」「次のアクションは何か」が整理されたドキュメントが10分以内に出来上がる。営業担当が本来使うべき時間は商談後のメモ作成ではなく、次の提案準備や顧客フォローだ。
使うAIツール
整形フローに必要なツールは2種類に絞られる。
文字起こし
- Whisper(OpenAI製、無料・高精度): APIまたはローカル実行
- Notta・Otter.ai・Fathom: ブラウザやアプリで完結、初心者向け
- Google Meet・Zoom組み込み文字起こし: 会議中にリアルタイム生成
整形・要約
- ChatGPT(GPT-4o): プロンプト次第で高精度な構造化
- Claude 3.5 Sonnet: 長文テキストの要約・分析に強い
- Gemini 1.5 Pro: Googleドキュメントとの連携がスムーズ
一番手軽なのはNottaやFathomで録音→自動文字起こし→AIサマリーまで一括処理する方法だ。ただしカスタマイズ性は低い。精度と柔軟性を求めるなら「Whisper文字起こし→ChatGPTで整形」の二段構えが現時点では最も実用的だ。
手順(ステップ別)
ステップ1: 録音ファイルを用意する
スマートフォンのボイスメモ、Zoomのローカル録画、Googleミートの録音機能など、手元にある手段で録音してよい。ファイル形式はmp3・m4a・wavどれでも問題ない。30分の商談なら容量は50MB前後が目安だ。
対面商談の場合はICレコーダーを机に置くか、スマートフォンのボイスメモを起動したまま商談に入る。顧客に「後で議事録を送るために録音させてください」と一言断るのが礼儀だ。
ステップ2: Whisperで文字起こしする
ローカルPCで実行する場合は以下の手順で動く。
pip install openai-whisper
whisper meeting.mp3 --language ja --output_format txt
APIを使う場合はOpenAIのDashboardでAPIキーを取得し、以下のPythonスクリプトを実行する。
import openai
client = openai.OpenAI()
with open("meeting.mp3", "rb") as f:
result = client.audio.transcriptions.create(
model="whisper-1",
file=f,
language="ja"
)
print(result.text)
出力されるテキストは話者ラベルなしの連続テキストだ。「えーと」「あのー」などのフィラーも含まれるため、次のステップで整形する。
ステップ3: ChatGPTで整形する
以下のプロンプトをそのまま使える。文字起こしテキストを[ここに文字起こしテキストを貼る]の部分に置き換えて実行する。
あなたは営業支援AIです。以下は商談の文字起こしテキストです。
次の4つの形式に整形してください。
1. 話者別の発言まとめ(話者A=営業、話者B=顧客として分類)
2. 顧客の課題・懸念点(箇条書き3〜5点)
3. 合意事項・決定事項(箇条書き)
4. ネクストアクション(担当者名・期日付きで箇条書き)
出力は日本語で、フィラー(えーと、あのーなど)は除去してください。
固有名詞や数字は変更しないでください。
---文字起こしテキスト---
[ここに文字起こしテキストを貼る]
GPT-4oに30分分のテキスト(約5,000〜8,000字)を送っても処理できる。出力は2〜3分で返ってくる。
ステップ4: 出力を確認・修正する
AIの出力は必ず確認が必要だ。特にチェックすべき箇所は3つある。
- 話者の分類ミス(顧客の発言が営業に割り当てられているケース)
- 数字の誤読(「3社」が「3者」になるなど)
- ネクストアクションの期日が曖昧なまま出力されているケース
確認後、CRMの活動メモやSlackのチャンネルに貼り付ける。整形済みテキストをそのまま顧客への議事録メールにも転用できる。
ステップ5: テンプレートを固定してルーティン化する
一度うまくいったプロンプトはChatGPTの「マイGPT」機能やチームの共有ドキュメントに保存しておく。商談後のワークフローを「録音→Whisper→ChatGPTにプロンプト貼り付け→CRM登録」の4ステップに標準化すると、新人営業でも同じ品質のメモが作れるようになる。
営業固有の具体例
事例1: 初回訪問後の議事録作成
SaaS企業の営業担当が、製造業の中堅企業に初回訪問した。45分の商談録音をWhisperに通すと約7,000字の生テキストが出た。整形プロンプトを当てた結果、顧客課題として「在庫管理のExcel管理に限界を感じている」「現場とのリアルタイム連携が取れていない」が抽出され、ネクストアクションとして「2週間後にデモ実施、担当者はIT部門の田中部長に同席いただく」が明示された。商談後のメモ作成が手書き30分→AI整形5分に短縮された。
事例2: 複数商談のサマリーを週次レポートに転用
担当者が1週間で8件の商談を行った。各商談の整形済みテキストをまとめてChatGPTに送り、「各商談のステータスと主要課題を表形式でまとめてください」と指示した。マネージャー向け週次レポートの下書きが30分かかっていたところ、5分で完成するようになった。商談の多い月末はとくに効果が出やすい。
うまくいかない場合のポイント
文字起こし精度が低い場合
専門用語や社名が多い商談は誤変換が増える。Whisperの--initial_promptオプションに頻出する固有名詞を事前に渡すと精度が改善する。
whisper meeting.mp3 --language ja --initial_prompt "会社名: 株式会社○○、製品名: ○○システム"
AIの要約が表面的すぎる場合 プロンプトに「顧客が感情的に強調していた点」「繰り返し出てきたキーワード」を明示的に抽出するよう指示を加える。プロンプトを具体的にするほど出力の質は上がる。
出力が長すぎてCRMに収まらない場合 整形プロンプトの末尾に「全体を500字以内にまとめてください」と追加する。または箇条書きの数を「それぞれ最大3点」と制限する。
話者が3名以上いる場合 Nottaなど話者識別に対応したツールで文字起こしすると話者ラベルが付く。整形プロンプトに「話者はA(営業)・B(顧客側技術担当)・C(顧客側意思決定者)の3名」と明示することで分類精度が上がる。
関連記事
よくある質問
文字起こしツールとAI整形ツールは別々に使う必要がありますか?
必ずしも別々でなくても構いません。Notta・Fathomのように録音→文字起こし→要約を一体化したツールもあります。ただし精度を上げたい場合はWhisperで文字起こし後にChatGPTで整形する二段構えが有効です。
話者が3人以上いる商談でも整形できますか?
できます。話者ラベルを付けられるツール(Whisper APIのdiarization、Notta等)を使い、整形プロンプトに『話者はA・B・Cの3名』と明示すると精度が上がります。
機密情報が含まれる商談録音をAIに送っても大丈夫ですか?
ChatGPT等のクラウドサービスに機密情報を送る場合は、社内規定とツールの利用規約を確認してください。ローカルで動くWhisper+ローカルLLMを組み合わせる構成なら外部送信を回避できます。
整形後のテキストをCRMに自動登録できますか?
SalesforceやHubSpotはAPI・Zapier連携に対応しており、整形済みテキストを活動メモとして自動登録するフローを組めます。まずは手動コピーで効果を確認してから自動化に移行するのが現実的です。