ChatGPTでPDFを要約すると表が崩れる。原因と対処法

kidaken-ai

結論:表が崩れるのはPDFの「種類」と「構造」が原因

ChatGPTにPDFを送ったとき、表の内容がバラバラになったり、数値がずれたり、行列が無視されて文章として出力される——この問題の原因は主に2つです。

  1. そのPDFが「画像PDF(スキャンPDF)」だった——ChatGPTはテキストとして書かれた内容しか正確に読めない。スキャンしたPDFは文字が「画像」として埋め込まれており、表の構造を認識できない。
  2. PDFの表が複雑なレイアウトで作られていた——列の結合・縦書き・罫線のみで区切られた表など、構造が複雑なものはテキスト抽出の段階で順序が崩れる。

原因がわかれば対処法は絞られます。「どちらのケースか」を確認して、それぞれの手順を試してください。

るみな
るみな

PDFをそのままアップロードしたのに、表の数字がバラバラで使い物にならなかった……

きだけん
きだけん

それ、あるあるです。まずそのPDFが「テキストPDF」か「スキャンPDF」かで対処法が変わります。確認方法から説明しますね。

まず確認:あなたのPDFはどちらのタイプか

テキストPDFとスキャンPDFの見分け方

PDFを開いてマウスで文字を選択(ドラッグ)してみてください。

  • 文字が青くハイライトされる → テキストPDF:文字データが埋め込まれている。ChatGPTが読める状態。表崩れが起きる場合はレイアウトの複雑さが原因。
  • 選択できない・画像全体が選択される → スキャンPDF(画像PDF):文字が画像として埋め込まれている。ChatGPTのテキスト抽出機能では表を正確に読めない。

この2種類で対処法が異なります。以下でそれぞれ説明します。

ケース1:スキャンPDFの場合の対処法

方法A:表の部分だけスクリーンショットで送る(最も手軽)

スキャンPDFの表は「画像」なので、ChatGPTの画像認識(Vision)機能を使うのが正攻法です。手順:

  1. PDFを開き、問題の表が含まれるページをスクリーンショットで撮影(Mac:Cmd+Shift+4、Windows:Win+Shift+S
  2. 撮影した画像をChatGPTのチャットにドラッグ&ドロップ
  3. 「この表の内容をMarkdownのテーブル形式で書き起こしてください」と指示する

ChatGPTはOCR(文字認識)に近い処理で表を読み取ります。画像の解像度が高いほど精度が上がるため、スクリーンショットはできるだけ表の部分に絞って撮影しましょう。

方法B:OCRツールで先にテキスト化してからChatGPTへ

大量ページのスキャンPDFには、まずOCRツールでテキスト化する方が効率的です。

  • Adobe Acrobat(有料):OCR精度が最高水準。表構造もある程度維持してWord/Excelに変換できる
  • Google ドライブ(無料):PDFをドライブにアップロード→右クリック→「Googleドキュメントで開く」でOCR変換。精度はAdobeより落ちるが無料
  • Adobe Acrobat オンライン(無料枠あり)adobe.comでPDF→Word変換。月2回まで無料

テキスト化したあとのWordやテキストファイルをChatGPTに送ると、表の崩れが大幅に改善されます。

るみな
るみな

スクリーンショットで送るのは表が1〜2個なら良さそうだけど、50ページのPDFには使えないよね……

きだけん
きだけん

そうです。ページ数が多い場合はAdobeかGoogleドライブのOCRで先にテキスト化する方が現実的です。テキスト化してしまえばChatGPTへの渡し方は自由になりますよ。

ケース2:テキストPDFなのに表が崩れる場合の対処法

原因:PDFの内部テキスト順序がレイアウトと一致していない

テキストPDFでも表が崩れることがあります。これはPDF内部でテキストが「見た目の順番」ではなく「描画された順番」で埋め込まれているためです。たとえば横3列の表が、列ごとではなく行ごとに埋め込まれていない場合、ChatGPTが読み込むと順序がずれます。

特に崩れやすいケース:

  • セルが結合された複雑な表
  • 縦書きと横書きが混在する表
  • 罫線だけで区切られた表(テキスト間にタブや区切り文字がない)
  • PowerPointから変換されたPDF

方法A:プロンプトで出力形式を明示する

「要約して」だけでなく、出力形式を具体的に指定することで改善することがあります。

効果的なプロンプト例:

このPDFの表を読み取って、以下の形式で出力してください。

- Markdownのテーブル形式(| 列1 | 列2 | のような形式)
- 列名は1行目に記載
- 数値は元のPDFのものをそのまま使用
- 表が複数ある場合は、それぞれ「表1:〇〇」のように見出しをつける

「テーブル形式で表示して」という曖昧な指示より、Markdownテーブルの書式を明示した方が成功率が上がります。

方法B:表の部分だけコピペしてテキストとして貼り付ける

テキストPDFの場合、表の部分だけマウスで選択してコピー→ChatGPTのチャットに直接テキストとして貼り付ける方法が確実です。

  1. PDFで表の部分をドラッグして選択・コピー
  2. ChatGPTのチャット欄に貼り付け
  3. 「以下のテキストは表の内容をコピーしたものです。列構造を復元してMarkdownテーブルにしてください」と前置きを入れる

PDFからコピーすると列の区切りがスペースだらけになることが多いですが、ChatGPTはある程度推測して整形してくれます。

方法C:問題のページだけスクリーンショットで送る

テキストPDFでも表だけスクリーンショットで送る方法は有効です。テキスト抽出を経由しないため、レイアウト崩れが起きません。表が数枚なら最も手間が少ない方法です。

ChatGPTのPDFファイル制限——知っておくべき上限

「そもそも読み込めない」という場合は制限に引っかかっている可能性があります。2026年4月現在の制限:

項目 無料プラン 有料プラン(Plus/Pro)
1日のアップロード数 3ファイル 20ファイル/メッセージ
1ファイルの上限サイズ 512MB 512MB
テキスト上限 2Mトークン相当 2Mトークン相当
ストレージ上限 10GB

ページ数が多いPDF(100ページ超)やファイルサイズが大きい場合は、PDFを分割してから送るか、必要なページだけ抽出して送る方が確実です。PDFの分割はilovepdf.com(無料)で手軽にできます。

うまくいかない場合——代替ツール

表の精度を上げたいならClaudeが選択肢に

ChatGPTで何度試しても表が崩れる場合、Claudeを試すことをおすすめします。Claudeは長文・複雑なレイアウトの文書処理に強みがあり、表の構造認識精度がChatGPTより高い場面があります。

Claude ProではPDFを直接アップロードでき、100ページを超える長いPDFも扱えます。特に法律・医療・財務系の文書(表が多く・構造が複雑なことが多い)で効果を発揮します。

表データの抽出に特化したツール

「表だけ正確に抽出したい」というニーズには、PDF専用の変換ツールが確実です:

  • Adobe Acrobat(Excel変換):PDF内の表を自動認識してExcelに変換。精度が最高水準
  • Camelot(Python):テキストPDFの表抽出に特化したOSSライブラリ。エンジニア向け
  • Tabula:無料・GUIで使えるPDF表抽出ツール。テキストPDF限定

「表の正確な数値が必要」「後でExcelで集計したい」という用途には、ChatGPTより専用ツールの方が適しています。

まとめ:PDFの種類で対処法を選ぶ

ChatGPTでPDFの表が崩れる問題の対処法をタイプ別にまとめます。

PDFのタイプ おすすめの対処法
スキャンPDF(文字選択不可) 表のスクリーンショットをChatGPTに送る / Googleドライブ・AdobeでOCR変換してから送る
テキストPDF・表が単純 「Markdownテーブル形式で出力して」とプロンプトで明示する
テキストPDF・表が複雑 表部分だけコピペして貼り付ける / スクリーンショットで送る
大量ページで繰り返し作業 Adobe AcrobatでExcel変換 / ClaudeやTabulaを使う

手順としては:

  1. 文字が選択できるかでPDFのタイプを確認する
  2. スキャンPDF → スクリーンショット or OCRツール
  3. テキストPDF → プロンプト改善 or コピペ貼り付け
  4. それでも崩れる → Claudeや専用ツールに切り替える
るみな
るみな

PDF送ってもうまくいかないから諦めてたけど、スクリーンショットで送る発想はなかった!

きだけん
きだけん

表が少ない・急いでいるならスクリーンショットが一番速いです。AIのファイル読み込みが万能だと思われがちですが、「どう送るか」で精度が全然変わりますよ。

ABOUT ME
きだけん
きだけん
生成AI講師/副業コンサルタント
AI初心者が副業で月10万円を目指すための実践ノウハウを発信しています。生成AI講師として20名以上を指導し、自身もクラウドワークスで案件受注中。教育関連企業で10年勤務、娘の学費を稼ぐため日々研鑽中です。 全ての人が何かを「継続」し、「成果を出す」ことの手伝いをライフワークにしたいと考えています。
記事URLをコピーしました