職種別AI仕事術

事務・アシスタントがPDF資料をAIで要約する方法

事務・アシスタントがPDF資料をAIで要約する方法

この記事の要点

スキャンPDF・テキストPDFを問わず、事務・アシスタントがAIツールで内容を素早く把握する具体的な手順とプロンプト例。OCR処理の方法も解説する。

結論:PDFの種類を見極めてから方法を選ぶと作業が最短になる

取引先からの見積書・提案書、行政機関から届く通知文、社内規程の改訂版など、事務・アシスタント業務ではPDF形式の資料を扱う機会が非常に多い。AIで要約しようとしたときに「文字が選択できない」「アップロードしたのに内容を読んでくれない」といった壁にぶつかるのは、PDFの種類に合った方法を選んでいないためだ。

PDFには大きく2種類ある。テキストデータが埋め込まれた「テキストPDF」と、紙をスキャンした画像データの「スキャンPDF」だ。この違いを最初に判断することで、その後の手順が変わる。

PDFの種類を確認する方法

PDFを開いて文字をマウスでドラッグしてみる。文字が反転して選択できれば「テキストPDF」だ。何も選択されずに画像全体が動くような場合は「スキャンPDF」の可能性が高い。

Acrobat Readerのファイル情報(プロパティ)でも確認できる。スキャンPDFはフォント情報が空欄になっていることが多い。

使うAIツールの特徴

ツールPDF対応方法スキャンPDF適した用途
Claude Proファイルアップロード画像として解析テキストPDF・構造化要約
ChatGPT PlusファイルアップロードGPT-4oが画像解析汎用的な要約・質問応答
NotebookLMファイルアップロード(最大50本)テキストPDFのみ安定複数PDFの横断参照
Microsoft CopilotSharePoint・OneDrive連携Office環境で強い社内ファイルの直接処理
Adobe Acrobat AIPDF上で直接操作OCR後に対応契約書・フォーム類

手順:テキストPDFをAIで要約する

ステップ1:テキストをコピーして貼り付ける方法

テキスト選択できるPDFの場合、全文をコピーしてAIのチャット欄に貼り付ける方法が最も確実だ。ファイルアップロードよりもテキストとして認識されやすく、精度が上がりやすい。

ページ数が多い場合は章ごとに分割して送る。「第1章のテキストです」と明記しながら順番に送り、最後に「以上が全章の要約です。統合してください」とまとめる。

ステップ2:ファイルアップロードを使う方法

Claude ProやChatGPT PlusではPDFファイルを直接アップロードできる。ファイルアップロード後にプロンプトを入力するだけでよい。

ただし、ファイルサイズや文字量の上限がある。100ページを超えるような資料は分割したほうが精度が安定する。

テキストPDF要約のプロンプト例

添付のPDFは取引先から届いた新規契約の提案書です。
上司への報告(口頭5分程度)の準備として、
以下の形式でまとめてください。

1. 提案の概要(3文以内)
2. 主なサービス内容と料金(表形式)
3. 契約条件・期間・解約規定
4. 自社にとってのメリットとリスク(各2点以内)
5. 決定が必要な事項と希望回答期限

日付・金額・社名は原文の表記をそのまま使ってください。

手順:スキャンPDFをAIで要約する

ステップ1:OCRでテキスト化する

スキャンPDFはまずテキストデータに変換する。主な方法を以下に示す。

方法A:Google ドライブを使う(無料)

  1. スキャンPDFをGoogle ドライブにアップロードする
  2. ファイルを右クリック→「アプリで開く」→「Googleドキュメント」を選ぶ
  3. 自動でOCR処理が実行され、テキストが抽出される
  4. 内容を確認してコピーし、AIに貼り付ける

方法B:Adobe Acrobatを使う

  1. AcrobatでPDFを開く
  2. 「ツール」→「スキャンとOCR」→「テキストを認識」を実行する
  3. テキストPDFに変換されるので、全文コピーしてAIに貼り付ける

方法C:AIの画像解析を使う Claude ProやGPT-4oはPDFの画像を直接解析できる。ファイルをアップロードして「このPDFの内容を要約してください」と入力する。ただし、手書き文字や文字が薄いスキャン資料は精度が落ちることがある。

ステップ2:テキスト精度を確認してから要約する

OCR後のテキストには誤認識が含まれることがある。特に数字・カタカナ・固有名詞は確認が必要だ。「0(ゼロ)」と「O(オー)」、「1(いち)」と「l(エル)」の混同はよく起きる。

金額や期日が含まれる資料は、OCR後のテキストを目視確認してから要約に使う。

スキャンPDF要約のプロンプト例(OCR後のテキストを貼り付ける場合)

以下のテキストはスキャンPDFをOCRで読み取ったものです。
文字の誤認識が含まれる可能性があります。

添付書類は[市区町村名]から届いた許認可申請の通知書です。
担当者向けの対応メモとして、以下の形式でまとめてください。

1. 通知の種別(許可・不許可・条件付き許可など)
2. 適用条件や付帯事項
3. 対応期限
4. 次に必要な手続き

数字・固有名詞は原文の表記をそのまま使ってください。
不明瞭な部分があれば「要原文確認」と記載してください。

---
[OCR後のテキストを貼り付け]

うまくいかない場合の対処法

ファイルアップロードで内容を正しく読んでくれない

テキストとして直接貼り付ける方法に切り替える。PDFのコピー制限がかかっている場合はAcrobatでパスワードを解除してからコピーする(所有権があるファイルのみ)。

OCR後のテキストが乱れていて要約精度が低い

プロンプトに「このテキストはOCRで抽出したため誤認識が含まれます。文脈から推測して整理してください」と一文加える。また「要確認と思われる箇所には★を付けてください」と指示すると、確認が必要な部分が分かりやすくなる。

表や図の内容が要約に反映されない

PDFの表や図はOCRで正確に変換されないことが多い。「この資料には表が含まれています。表の数値を正確に拾ってください」と明示するか、表の部分だけ手入力で補足する。

複数PDFをまとめて要約したい

NotebookLMにPDFをアップロードすると、複数ファイルを横断して参照できる。月ごとの報告書や複数取引先の提案書を比較するのに向いている。

事務・アシスタント固有の活用場面

行政機関からの通知PDFをすぐに関係部署に転送できる形にする

補助金採択通知・各種許認可通知・税務署からの問い合わせ文書などは、PDFで届くことが多い上に文章が長く、担当部署や上司にすぐ内容を共有しにくい。OCRでテキスト化した後にAIで要約し、「何の通知か・対応期限・次のアクション」を3点で整理する。転送メールの本文に貼り付けるだけで関係者が状況を即座に把握できる。

取引先の契約書PDFのチェックポイントを洗い出す

新規取引先から届いた契約書PDFをテキストPDFに変換し、「解約条件・損害賠償・知的財産権・機密保持の条項を抜き出し、自社に不利な可能性がある箇所を指摘してください」と入力すると、確認すべきポイントが一覧化される。法務担当に確認を依頼する前の準備として使うと、相談の精度が上がる。

書類のドラフト作成も同様にAI支援できる(事務・アシスタントの書類作成をAIで効率化する方法)。

関連記事

よくある質問

PDFをAIに読み込ませる方法はいくつありますか?

主に3つある。①テキスト選択できるPDFはコピー&ペーストでテキストを貼り付ける。②ファイルアップロード機能があるAIツール(Claude Pro、ChatGPT Plus等)にPDFファイルをそのまま渡す。③スキャンPDFはAdobe AcrobatやAdobeのOCR機能でテキスト化してから使う。

スキャンPDFはAIで読めますか?

文字認識(OCR)が必要になる。Adobe AcrobatのOCR機能、Google ドライブにアップロードしてGoogleドキュメントで開く方法、Microsoft OneNoteに貼り付ける方法などでテキスト化できる。Claude ProやGPT-4oはPDF画像を直接解析できる場合もあるが、精度は文書の状態による。

機密PDFをAIに渡しても大丈夫ですか?

社外のAIサービスに機密情報を送る場合は情報セキュリティ部門のガイドラインを先に確認する。エンタープライズ版は学習データに使われない設定がある。社内導入済みのツールが最も安全だ。

PDFが複数ページあって途中から要約がおかしくなるのはなぜですか?

AIが処理できるトークン(文字量)の上限を超えると精度が落ちる。章や節ごとに分割して順番に送り、最後に各要約を統合する方法が有効だ。NotebookLMはPDFを丸ごとアップロードして複数ファイルを参照できる。