ChatGPTでPDFを要約すると表が崩れる。原因と対処法

結論:表が崩れるのはPDFの「種類」と「構造」が原因
ChatGPTにPDFを送ったとき、表の内容がバラバラになったり、数値がずれたり、行列が無視されて文章として出力される——この問題の原因は主に2つです。
- そのPDFが「画像PDF(スキャンPDF)」だった——ChatGPTはテキストとして書かれた内容しか正確に読めない。スキャンしたPDFは文字が「画像」として埋め込まれており、表の構造を認識できない。
- PDFの表が複雑なレイアウトで作られていた——列の結合・縦書き・罫線のみで区切られた表など、構造が複雑なものはテキスト抽出の段階で順序が崩れる。
原因がわかれば対処法は絞られます。「どちらのケースか」を確認して、それぞれの手順を試してください。



まず確認:あなたのPDFはどちらのタイプか
テキストPDFとスキャンPDFの見分け方
PDFを開いてマウスで文字を選択(ドラッグ)してみてください。
- 文字が青くハイライトされる → テキストPDF:文字データが埋め込まれている。ChatGPTが読める状態。表崩れが起きる場合はレイアウトの複雑さが原因。
- 選択できない・画像全体が選択される → スキャンPDF(画像PDF):文字が画像として埋め込まれている。ChatGPTのテキスト抽出機能では表を正確に読めない。
この2種類で対処法が異なります。以下でそれぞれ説明します。

ケース1:スキャンPDFの場合の対処法
方法A:表の部分だけスクリーンショットで送る(最も手軽)
スキャンPDFの表は「画像」なので、ChatGPTの画像認識(Vision)機能を使うのが正攻法です。手順:
- PDFを開き、問題の表が含まれるページをスクリーンショットで撮影(Mac:
Cmd+Shift+4、Windows:Win+Shift+S) - 撮影した画像をChatGPTのチャットにドラッグ&ドロップ
- 「この表の内容をMarkdownのテーブル形式で書き起こしてください」と指示する
ChatGPTはOCR(文字認識)に近い処理で表を読み取ります。画像の解像度が高いほど精度が上がるため、スクリーンショットはできるだけ表の部分に絞って撮影しましょう。
方法B:OCRツールで先にテキスト化してからChatGPTへ
大量ページのスキャンPDFには、まずOCRツールでテキスト化する方が効率的です。
- Adobe Acrobat(有料):OCR精度が最高水準。表構造もある程度維持してWord/Excelに変換できる
- Google ドライブ(無料):PDFをドライブにアップロード→右クリック→「Googleドキュメントで開く」でOCR変換。精度はAdobeより落ちるが無料
- Adobe Acrobat オンライン(無料枠あり):adobe.comでPDF→Word変換。月2回まで無料
テキスト化したあとのWordやテキストファイルをChatGPTに送ると、表の崩れが大幅に改善されます。



ケース2:テキストPDFなのに表が崩れる場合の対処法
原因:PDFの内部テキスト順序がレイアウトと一致していない
テキストPDFでも表が崩れることがあります。これはPDF内部でテキストが「見た目の順番」ではなく「描画された順番」で埋め込まれているためです。たとえば横3列の表が、列ごとではなく行ごとに埋め込まれていない場合、ChatGPTが読み込むと順序がずれます。
特に崩れやすいケース:
- セルが結合された複雑な表
- 縦書きと横書きが混在する表
- 罫線だけで区切られた表(テキスト間にタブや区切り文字がない)
- PowerPointから変換されたPDF
方法A:プロンプトで出力形式を明示する
「要約して」だけでなく、出力形式を具体的に指定することで改善することがあります。
効果的なプロンプト例:
このPDFの表を読み取って、以下の形式で出力してください。
- Markdownのテーブル形式(| 列1 | 列2 | のような形式)
- 列名は1行目に記載
- 数値は元のPDFのものをそのまま使用
- 表が複数ある場合は、それぞれ「表1:〇〇」のように見出しをつける
「テーブル形式で表示して」という曖昧な指示より、Markdownテーブルの書式を明示した方が成功率が上がります。
方法B:表の部分だけコピペしてテキストとして貼り付ける
テキストPDFの場合、表の部分だけマウスで選択してコピー→ChatGPTのチャットに直接テキストとして貼り付ける方法が確実です。
- PDFで表の部分をドラッグして選択・コピー
- ChatGPTのチャット欄に貼り付け
- 「以下のテキストは表の内容をコピーしたものです。列構造を復元してMarkdownテーブルにしてください」と前置きを入れる
PDFからコピーすると列の区切りがスペースだらけになることが多いですが、ChatGPTはある程度推測して整形してくれます。
方法C:問題のページだけスクリーンショットで送る
テキストPDFでも表だけスクリーンショットで送る方法は有効です。テキスト抽出を経由しないため、レイアウト崩れが起きません。表が数枚なら最も手間が少ない方法です。

ChatGPTのPDFファイル制限——知っておくべき上限
「そもそも読み込めない」という場合は制限に引っかかっている可能性があります。2026年4月現在の制限:
| 項目 | 無料プラン | 有料プラン(Plus/Pro) |
|---|---|---|
| 1日のアップロード数 | 3ファイル | 20ファイル/メッセージ |
| 1ファイルの上限サイズ | 512MB | 512MB |
| テキスト上限 | 2Mトークン相当 | 2Mトークン相当 |
| ストレージ上限 | — | 10GB |
ページ数が多いPDF(100ページ超)やファイルサイズが大きい場合は、PDFを分割してから送るか、必要なページだけ抽出して送る方が確実です。PDFの分割はilovepdf.com(無料)で手軽にできます。

うまくいかない場合——代替ツール
表の精度を上げたいならClaudeが選択肢に
ChatGPTで何度試しても表が崩れる場合、Claudeを試すことをおすすめします。Claudeは長文・複雑なレイアウトの文書処理に強みがあり、表の構造認識精度がChatGPTより高い場面があります。
Claude ProではPDFを直接アップロードでき、100ページを超える長いPDFも扱えます。特に法律・医療・財務系の文書(表が多く・構造が複雑なことが多い)で効果を発揮します。
表データの抽出に特化したツール
「表だけ正確に抽出したい」というニーズには、PDF専用の変換ツールが確実です:
- Adobe Acrobat(Excel変換):PDF内の表を自動認識してExcelに変換。精度が最高水準
- Camelot(Python):テキストPDFの表抽出に特化したOSSライブラリ。エンジニア向け
- Tabula:無料・GUIで使えるPDF表抽出ツール。テキストPDF限定
「表の正確な数値が必要」「後でExcelで集計したい」という用途には、ChatGPTより専用ツールの方が適しています。

まとめ:PDFの種類で対処法を選ぶ
ChatGPTでPDFの表が崩れる問題の対処法をタイプ別にまとめます。
| PDFのタイプ | おすすめの対処法 |
|---|---|
| スキャンPDF(文字選択不可) | 表のスクリーンショットをChatGPTに送る / Googleドライブ・AdobeでOCR変換してから送る |
| テキストPDF・表が単純 | 「Markdownテーブル形式で出力して」とプロンプトで明示する |
| テキストPDF・表が複雑 | 表部分だけコピペして貼り付ける / スクリーンショットで送る |
| 大量ページで繰り返し作業 | Adobe AcrobatでExcel変換 / ClaudeやTabulaを使う |
手順としては:
- 文字が選択できるかでPDFのタイプを確認する
- スキャンPDF → スクリーンショット or OCRツール
- テキストPDF → プロンプト改善 or コピペ貼り付け
- それでも崩れる → Claudeや専用ツールに切り替える


