職種別AI仕事術

営業の文字起こしをAIで整形する方法

営業の文字起こしをAIで整形する方法

この記事の要点

商談録音の文字起こしをAIで整形すると、話者分離・要約・ネクストアクション抽出が10分以内に完了する。Whisper+ChatGPTを使った具体的な手順とプロンプトを解説。

結論

商談後に手動で議事録を書いている時間は、AIで8割削減できる。録音ファイルをWhisperに通すと話者付きの生テキストが得られ、そこにChatGPTで整形プロンプトを当てると「誰が何を言ったか」「課題は何か」「次のアクションは何か」が整理されたドキュメントが10分以内に出来上がる。営業担当が本来使うべき時間は商談後のメモ作成ではなく、次の提案準備や顧客フォローだ。

使うAIツール

整形フローに必要なツールは2種類に絞られる。

文字起こし

  • Whisper(OpenAI製、無料・高精度): APIまたはローカル実行
  • Notta・Otter.ai・Fathom: ブラウザやアプリで完結、初心者向け
  • Google Meet・Zoom組み込み文字起こし: 会議中にリアルタイム生成

整形・要約

  • ChatGPT(GPT-4o): プロンプト次第で高精度な構造化
  • Claude 3.5 Sonnet: 長文テキストの要約・分析に強い
  • Gemini 1.5 Pro: Googleドキュメントとの連携がスムーズ

一番手軽なのはNottaやFathomで録音→自動文字起こし→AIサマリーまで一括処理する方法だ。ただしカスタマイズ性は低い。精度と柔軟性を求めるなら「Whisper文字起こし→ChatGPTで整形」の二段構えが現時点では最も実用的だ。

手順(ステップ別)

ステップ1: 録音ファイルを用意する

スマートフォンのボイスメモ、Zoomのローカル録画、Googleミートの録音機能など、手元にある手段で録音してよい。ファイル形式はmp3・m4a・wavどれでも問題ない。30分の商談なら容量は50MB前後が目安だ。

対面商談の場合はICレコーダーを机に置くか、スマートフォンのボイスメモを起動したまま商談に入る。顧客に「後で議事録を送るために録音させてください」と一言断るのが礼儀だ。

ステップ2: Whisperで文字起こしする

ローカルPCで実行する場合は以下の手順で動く。

pip install openai-whisper
whisper meeting.mp3 --language ja --output_format txt

APIを使う場合はOpenAIのDashboardでAPIキーを取得し、以下のPythonスクリプトを実行する。

import openai

client = openai.OpenAI()
with open("meeting.mp3", "rb") as f:
    result = client.audio.transcriptions.create(
        model="whisper-1",
        file=f,
        language="ja"
    )
print(result.text)

出力されるテキストは話者ラベルなしの連続テキストだ。「えーと」「あのー」などのフィラーも含まれるため、次のステップで整形する。

ステップ3: ChatGPTで整形する

以下のプロンプトをそのまま使える。文字起こしテキストを[ここに文字起こしテキストを貼る]の部分に置き換えて実行する。

あなたは営業支援AIです。以下は商談の文字起こしテキストです。
次の4つの形式に整形してください。

1. 話者別の発言まとめ(話者A=営業、話者B=顧客として分類)
2. 顧客の課題・懸念点(箇条書き3〜5点)
3. 合意事項・決定事項(箇条書き)
4. ネクストアクション(担当者名・期日付きで箇条書き)

出力は日本語で、フィラー(えーと、あのーなど)は除去してください。
固有名詞や数字は変更しないでください。

---文字起こしテキスト---
[ここに文字起こしテキストを貼る]

GPT-4oに30分分のテキスト(約5,000〜8,000字)を送っても処理できる。出力は2〜3分で返ってくる。

ステップ4: 出力を確認・修正する

AIの出力は必ず確認が必要だ。特にチェックすべき箇所は3つある。

  • 話者の分類ミス(顧客の発言が営業に割り当てられているケース)
  • 数字の誤読(「3社」が「3者」になるなど)
  • ネクストアクションの期日が曖昧なまま出力されているケース

確認後、CRMの活動メモやSlackのチャンネルに貼り付ける。整形済みテキストをそのまま顧客への議事録メールにも転用できる。

ステップ5: テンプレートを固定してルーティン化する

一度うまくいったプロンプトはChatGPTの「マイGPT」機能やチームの共有ドキュメントに保存しておく。商談後のワークフローを「録音→Whisper→ChatGPTにプロンプト貼り付け→CRM登録」の4ステップに標準化すると、新人営業でも同じ品質のメモが作れるようになる。

営業固有の具体例

事例1: 初回訪問後の議事録作成

SaaS企業の営業担当が、製造業の中堅企業に初回訪問した。45分の商談録音をWhisperに通すと約7,000字の生テキストが出た。整形プロンプトを当てた結果、顧客課題として「在庫管理のExcel管理に限界を感じている」「現場とのリアルタイム連携が取れていない」が抽出され、ネクストアクションとして「2週間後にデモ実施、担当者はIT部門の田中部長に同席いただく」が明示された。商談後のメモ作成が手書き30分→AI整形5分に短縮された。

事例2: 複数商談のサマリーを週次レポートに転用

担当者が1週間で8件の商談を行った。各商談の整形済みテキストをまとめてChatGPTに送り、「各商談のステータスと主要課題を表形式でまとめてください」と指示した。マネージャー向け週次レポートの下書きが30分かかっていたところ、5分で完成するようになった。商談の多い月末はとくに効果が出やすい。

うまくいかない場合のポイント

文字起こし精度が低い場合 専門用語や社名が多い商談は誤変換が増える。Whisperの--initial_promptオプションに頻出する固有名詞を事前に渡すと精度が改善する。

whisper meeting.mp3 --language ja --initial_prompt "会社名: 株式会社○○、製品名: ○○システム"

AIの要約が表面的すぎる場合 プロンプトに「顧客が感情的に強調していた点」「繰り返し出てきたキーワード」を明示的に抽出するよう指示を加える。プロンプトを具体的にするほど出力の質は上がる。

出力が長すぎてCRMに収まらない場合 整形プロンプトの末尾に「全体を500字以内にまとめてください」と追加する。または箇条書きの数を「それぞれ最大3点」と制限する。

話者が3名以上いる場合 Nottaなど話者識別に対応したツールで文字起こしすると話者ラベルが付く。整形プロンプトに「話者はA(営業)・B(顧客側技術担当)・C(顧客側意思決定者)の3名」と明示することで分類精度が上がる。

関連記事

よくある質問

文字起こしツールとAI整形ツールは別々に使う必要がありますか?

必ずしも別々でなくても構いません。Notta・Fathomのように録音→文字起こし→要約を一体化したツールもあります。ただし精度を上げたい場合はWhisperで文字起こし後にChatGPTで整形する二段構えが有効です。

話者が3人以上いる商談でも整形できますか?

できます。話者ラベルを付けられるツール(Whisper APIのdiarization、Notta等)を使い、整形プロンプトに『話者はA・B・Cの3名』と明示すると精度が上がります。

機密情報が含まれる商談録音をAIに送っても大丈夫ですか?

ChatGPT等のクラウドサービスに機密情報を送る場合は、社内規定とツールの利用規約を確認してください。ローカルで動くWhisper+ローカルLLMを組み合わせる構成なら外部送信を回避できます。

整形後のテキストをCRMに自動登録できますか?

SalesforceやHubSpotはAPI・Zapier連携に対応しており、整形済みテキストを活動メモとして自動登録するフローを組めます。まずは手動コピーで効果を確認してから自動化に移行するのが現実的です。