商品企画の文字起こしをAIで整形する方法
この記事の要点
インタビューや会議の文字起こしをAIで整形する手順を解説。発言者分離・要点抽出・企画書用まとめまで、コピペで使えるプロンプト付き。
結論
商品企画の文字起こしは、AIに「発言者分離・フィラー除去・要点抽出」の3段階を指示するだけで、生の録音データから企画書に貼れる品質まで整形できます。1時間のユーザーインタビューが30分かかっていた作業を、プロンプト2〜3回の操作で終わらせられます。
使うAIツール
Claude(Anthropic)はコンテキスト上限が大きく、1時間分の文字起こし全文を一度に貼り付けて処理できます。ChatGPTはGPT-4oモデルを使えば同等の整形品質が出ます。どちらも企業向けプランであれば入力データの学習利用をオフにできるため、社内情報を扱う商品企画の業務では必ずプランを確認してから使ってください。
文字起こし自体の生成にはWhisperベースの「Notta」「Otter.ai」「Clova Note」などが使われていますが、本記事では既に文字起こしテキストが手元にある状態からの整形作業を説明します。
手順
ステップ1:フィラーと重複を除いた素起こしを作る
生の文字起こしには「えー」「あの」「そうですね」といったフィラーや、同じ内容の繰り返しが大量に含まれています。まずこれを除去します。
以下はユーザーインタビューの文字起こし原文です。
次の条件で整形してください。
1. 「えー」「あのー」「まあ」などのフィラーをすべて削除する
2. 同一の意味内容が連続している場合は1回にまとめる
3. 発言の意味は変えない。言葉を補ったり、言い換えたりしない
4. 発言者ラベル(例:「インタビュアー:」「Aさん:」)はそのまま残す
---
[ここに文字起こし原文を貼る]
---
このプロンプトで出てくる出力は「意味を変えずに読みやすくした素起こし」です。次のステップに進む前に、発言者名が正しく割り振られているかを目視確認してください。自動文字起こしツールが話者を間違える箇所は、この段階で直しておくと後の処理が正確になります。
ステップ2:発言者ごとに発言を整理する
複数人が入り乱れた文字起こしは、そのままだと企画に使いにくいです。発言者別にまとめ直すと、ユーザーの生の声を整理したメモとして使えます。
以下は整形済みのインタビュー文字起こしです。
発言者ごとに発言内容をまとめてください。
出力形式:
## [発言者名]の発言まとめ
- [発言の要点1]
- [発言の要点2]
(発言者が増えた場合は同じ形式で追加する)
補足や解釈は加えず、発言内容だけを箇条書きにしてください。
---
[ステップ1の出力を貼る]
---
ステップ3:企画書用の課題・ニーズ抽出
商品企画の実務では、文字起こしをそのまま企画書に貼ることはほぼありません。「ユーザーが感じている課題」「潜在的なニーズ」「機能への言及」を分けて抽出する形が求められます。
以下はユーザーインタビューの文字起こしです。
商品企画の資料として使うため、次の3カテゴリに分けて情報を抽出してください。
## 課題・不満
(ユーザーが現状に対して不便・不満を感じている発言)
## ニーズ・要望
(「こうなってほしい」「あれば使う」など、欲しい機能・状態への言及)
## 現在の行動・ワークアラウンド
(課題に対してユーザーが今どう対処しているかの発言)
- 発言の根拠となる原文を1〜2文ずつ引用として添付する
- 推測や補足を加えない
- インタビュアー側の発言は除く
---
[文字起こしを貼る]
---
この出力はユーザーリサーチのサマリーとして、そのままPRD(製品要件定義書)の冒頭に貼れる品質になります。
具体例1:SaaS企業の機能追加インタビューで使った場合
あるSaaS企業の商品企画チームが、既存ユーザー5人へのインタビュー音声を処理したケースを紹介します。録音時間は合計2時間20分。Notta で自動文字起こしし、出力テキスト約18,000字をClaudeに投入しました。
ステップ1〜3のプロンプトを順番に実行したところ、「課題・ニーズ・ワークアラウンド」の3カテゴリ整理が40分で完了しました。従来は担当者2人がテキストを読み込み、付箋でグルーピングしていた作業で、3〜4時間かかっていた工程です。
注意点として、ユーザーが業界用語を使っていた箇所でAIが一般的な語義に引き寄せた要約をした部分が3箇所ありました。原文照合で修正できましたが、専門用語が多い領域では確認コストを見込んでおく必要があります。
具体例2:社内ステークホルダーヒアリングでの活用
新製品の方向性を決めるために、営業・カスタマーサクセス・開発の3部門から各2名ずつ、計6名にインタビューした社内ヒアリングで使ったケースです。
ここでは発言者が部門ごとに異なる立場を持つため、ステップ2の「発言者別まとめ」をそのまま使うのではなく、以下のプロンプトで「部門別の関心事」として整理し直しました。
以下はステークホルダーインタビューの文字起こしです。
発言者の所属部門ごとに、関心・懸念・優先事項を抽出してください。
出力形式:
## [部門名]の関心事
- 優先事項: [箇条書き]
- 懸念: [箇条書き]
発言の引用(1文)を各項目に添付してください。
推測や補足は加えないでください。
---
[文字起こしを貼る]
---
この出力を使うと、部門間の意見の対立点が一覧化され、ロードマップ優先順位の議論を始める前の整理資料として機能しました。
うまくいかない場合
出力が長すぎて途中で切れる
モデルのコンテキスト上限を超えると出力が途中で止まります。文字起こしを時間軸で分割し、前半・後半に分けて処理してから結合するか、最初から「前半30分分だけ処理する」と指定してください。
発言の要点がずれて抽出される
「課題・ニーズ・ワークアラウンド」のカテゴリが混在して出力される場合は、プロンプトに「曖昧な場合は複数カテゴリに入れてよい。ただし分類理由を1文で添付すること」と追記すると精度が上がる傾向にあります。
固有名詞(製品名・社名・人名)が誤変換される
Whisperベースのツールは固有名詞を音に引きずられて変換します。プロンプトに「以下の固有名詞が登場する場合は正確に使ってください:[製品名リスト]」と追記するか、ステップ1の後に固有名詞だけ検索・置換してください。
AIが発言者の意図を解釈して要約してしまう
「補足や解釈を加えない」と明記してもAIが補足を入れる場合は、プロンプトの末尾に「発言に含まれない情報は一切追加しないこと」と繰り返し明記します。どうしても改善しない場合は、別のモデルで試してみてください。
整形後の使い方
整形・抽出した内容は、そのままユーザーリサーチの一次資料として保管するか、要件定義の根拠データとして活用できます。要件定義のAI活用については要件定義をAIで整理する方法で詳しく説明しています。
ユーザーインタビューの分析を体系的に行う場合はユーザーインタビューをAIで分析する方法も参照してください。インタビュー1件の整形から、複数インタビューのパターン抽出まで手順を説明しています。
FAQ
Q. 文字起こしの整形にどのAIツールを使えばよいですか?
ChatGPT、Claude、Geminiのいずれも対応できます。長文を扱う場合はコンテキスト上限の大きいClaudeが安定しやすい傾向にあります。最新の制限は各サービスの公式情報で確認してください。
Q. 文字起こしの精度が低くてもAIで整形できますか?
ある程度は補正できますが、固有名詞の誤認識や文脈の断絶が多い場合は出力品質が下がります。ツールのノイズキャンセル設定を上げて再録音するか、整形前に人手で粗修正を入れるほうが結果が安定します。
Q. プロンプトに文字起こし全文を貼っても問題ありませんか?
社内情報・個人情報を含む場合は、サービスの学習利用設定をオフにするか、企業契約版を使ってください。無料プランで機密情報をそのまま投入するのは避けるべきです。
Q. 整形後の議事録は必ず人間が確認すべきですか?
必須です。AIは発話の意図を取り違えることがあります。特に数字・固有名詞・意思決定事項は必ず原文と突き合わせてください。
よくある質問
文字起こしの整形にどのAIツールを使えばよいですか?
ChatGPT、Claude、Geminiのいずれも対応できます。長文を扱う場合はコンテキスト上限の大きいClaudeが安定しやすい傾向にあります。最新の制限は各サービスの公式情報で確認してください。
文字起こしの精度が低くてもAIで整形できますか?
ある程度は補正できますが、固有名詞の誤認識や文脈の断絶が多い場合は出力品質が下がります。ツールのノイズキャンセル設定を上げて再録音するか、整形前に人手で粗修正を入れるほうが結果が安定します。
プロンプトに文字起こし全文を貼っても問題ありませんか?
社内情報・個人情報を含む場合は、サービスの学習利用設定をオフにするか、企業契約版を使ってください。無料プランで機密情報をそのまま投入するのは避けるべきです。
整形後の議事録は必ず人間が確認すべきですか?
必須です。AIは発話の意図を取り違えることがあります。特に数字・固有名詞・意思決定事項は必ず原文と突き合わせてください。