2026.04.27 2026.05.06

ChatGPTでPDFを要約すると表が崩れる。原因と対処法

kidaken-ai

Contents

結論：表が崩れるのはPDFの「種類」と「構造」が原因
まず確認：あなたのPDFはどちらのタイプか
- テキストPDFとスキャンPDFの見分け方
ケース1：スキャンPDFの場合の対処法
- 方法A：表の部分だけスクリーンショットで送る（最も手軽）
- 方法B：OCRツールで先にテキスト化してからChatGPTへ
ケース2：テキストPDFなのに表が崩れる場合の対処法
ChatGPTのPDFファイル制限——知っておくべき上限
うまくいかない場合——代替ツール
- 表の精度を上げたいならClaudeが選択肢に
- 表データの抽出に特化したツール
まとめ：PDFの種類で対処法を選ぶ

結論：表が崩れるのはPDFの「種類」と「構造」が原因

ChatGPTにPDFを送ったとき、表の内容がバラバラになったり、数値がずれたり、行列が無視されて文章として出力される——この問題の原因は主に2つです。

そのPDFが「画像PDF（スキャンPDF）」だった——ChatGPTはテキストとして書かれた内容しか正確に読めない。スキャンしたPDFは文字が「画像」として埋め込まれており、表の構造を認識できない。
PDFの表が複雑なレイアウトで作られていた——列の結合・縦書き・罫線のみで区切られた表など、構造が複雑なものはテキスト抽出の段階で順序が崩れる。

原因がわかれば対処法は絞られます。「どちらのケースか」を確認して、それぞれの手順を試してください。

るみな

PDFをそのままアップロードしたのに、表の数字がバラバラで使い物にならなかった……

きだけん

それ、あるあるです。まずそのPDFが「テキストPDF」か「スキャンPDF」かで対処法が変わります。確認方法から説明しますね。

まず確認：あなたのPDFはどちらのタイプか

テキストPDFとスキャンPDFの見分け方

PDFを開いてマウスで文字を選択（ドラッグ）してみてください。

文字が青くハイライトされる → テキストPDF：文字データが埋め込まれている。ChatGPTが読める状態。表崩れが起きる場合はレイアウトの複雑さが原因。
選択できない・画像全体が選択される → スキャンPDF（画像PDF）：文字が画像として埋め込まれている。ChatGPTのテキスト抽出機能では表を正確に読めない。

この2種類で対処法が異なります。以下でそれぞれ説明します。

ケース1：スキャンPDFの場合の対処法

方法A：表の部分だけスクリーンショットで送る（最も手軽）

スキャンPDFの表は「画像」なので、ChatGPTの画像認識（Vision）機能を使うのが正攻法です。手順：

PDFを開き、問題の表が含まれるページをスクリーンショットで撮影（Mac：Cmd+Shift+4、Windows：Win+Shift+S）
撮影した画像をChatGPTのチャットにドラッグ＆ドロップ
「この表の内容をMarkdownのテーブル形式で書き起こしてください」と指示する

ChatGPTはOCR（文字認識）に近い処理で表を読み取ります。画像の解像度が高いほど精度が上がるため、スクリーンショットはできるだけ表の部分に絞って撮影しましょう。

方法B：OCRツールで先にテキスト化してからChatGPTへ

大量ページのスキャンPDFには、まずOCRツールでテキスト化する方が効率的です。

Adobe Acrobat（有料）：OCR精度が最高水準。表構造もある程度維持してWord/Excelに変換できる
Google ドライブ（無料）：PDFをドライブにアップロード→右クリック→「Googleドキュメントで開く」でOCR変換。精度はAdobeより落ちるが無料
Adobe Acrobat オンライン（無料枠あり）：adobe.comでPDF→Word変換。月2回まで無料

テキスト化したあとのWordやテキストファイルをChatGPTに送ると、表の崩れが大幅に改善されます。

るみな

スクリーンショットで送るのは表が1〜2個なら良さそうだけど、50ページのPDFには使えないよね……

きだけん

そうです。ページ数が多い場合はAdobeかGoogleドライブのOCRで先にテキスト化する方が現実的です。テキスト化してしまえばChatGPTへの渡し方は自由になりますよ。

ケース2：テキストPDFなのに表が崩れる場合の対処法

原因：PDFの内部テキスト順序がレイアウトと一致していない

テキストPDFでも表が崩れることがあります。これはPDF内部でテキストが「見た目の順番」ではなく「描画された順番」で埋め込まれているためです。たとえば横3列の表が、列ごとではなく行ごとに埋め込まれていない場合、ChatGPTが読み込むと順序がずれます。

特に崩れやすいケース：

セルが結合された複雑な表
縦書きと横書きが混在する表
罫線だけで区切られた表（テキスト間にタブや区切り文字がない）
PowerPointから変換されたPDF

方法A：プロンプトで出力形式を明示する

「要約して」だけでなく、出力形式を具体的に指定することで改善することがあります。

効果的なプロンプト例：

このPDFの表を読み取って、以下の形式で出力してください。

- Markdownのテーブル形式（| 列1 | 列2 | のような形式）
- 列名は1行目に記載
- 数値は元のPDFのものをそのまま使用
- 表が複数ある場合は、それぞれ「表1：〇〇」のように見出しをつける

「テーブル形式で表示して」という曖昧な指示より、Markdownテーブルの書式を明示した方が成功率が上がります。

方法B：表の部分だけコピペしてテキストとして貼り付ける

テキストPDFの場合、表の部分だけマウスで選択してコピー→ChatGPTのチャットに直接テキストとして貼り付ける方法が確実です。

PDFで表の部分をドラッグして選択・コピー
ChatGPTのチャット欄に貼り付け
「以下のテキストは表の内容をコピーしたものです。列構造を復元してMarkdownテーブルにしてください」と前置きを入れる

PDFからコピーすると列の区切りがスペースだらけになることが多いですが、ChatGPTはある程度推測して整形してくれます。

方法C：問題のページだけスクリーンショットで送る

テキストPDFでも表だけスクリーンショットで送る方法は有効です。テキスト抽出を経由しないため、レイアウト崩れが起きません。表が数枚なら最も手間が少ない方法です。

ChatGPTのPDFファイル制限——知っておくべき上限

「そもそも読み込めない」という場合は制限に引っかかっている可能性があります。2026年4月現在の制限：

項目	無料プラン	有料プラン（Plus/Pro）
1日のアップロード数	3ファイル	20ファイル/メッセージ
1ファイルの上限サイズ	512MB	512MB
テキスト上限	2Mトークン相当	2Mトークン相当
ストレージ上限	—	10GB

ページ数が多いPDF（100ページ超）やファイルサイズが大きい場合は、PDFを分割してから送るか、必要なページだけ抽出して送る方が確実です。PDFの分割はilovepdf.com（無料）で手軽にできます。

うまくいかない場合——代替ツール

表の精度を上げたいならClaudeが選択肢に

ChatGPTで何度試しても表が崩れる場合、Claudeを試すことをおすすめします。Claudeは長文・複雑なレイアウトの文書処理に強みがあり、表の構造認識精度がChatGPTより高い場面があります。

Claude ProではPDFを直接アップロードでき、100ページを超える長いPDFも扱えます。特に法律・医療・財務系の文書（表が多く・構造が複雑なことが多い）で効果を発揮します。

表データの抽出に特化したツール

「表だけ正確に抽出したい」というニーズには、PDF専用の変換ツールが確実です：

Adobe Acrobat（Excel変換）：PDF内の表を自動認識してExcelに変換。精度が最高水準
Camelot（Python）：テキストPDFの表抽出に特化したOSSライブラリ。エンジニア向け
Tabula：無料・GUIで使えるPDF表抽出ツール。テキストPDF限定

「表の正確な数値が必要」「後でExcelで集計したい」という用途には、ChatGPTより専用ツールの方が適しています。

まとめ：PDFの種類で対処法を選ぶ

ChatGPTでPDFの表が崩れる問題の対処法をタイプ別にまとめます。

PDFのタイプ	おすすめの対処法
スキャンPDF（文字選択不可）	表のスクリーンショットをChatGPTに送る / Googleドライブ・AdobeでOCR変換してから送る
テキストPDF・表が単純	「Markdownテーブル形式で出力して」とプロンプトで明示する
テキストPDF・表が複雑	表部分だけコピペして貼り付ける / スクリーンショットで送る
大量ページで繰り返し作業	Adobe AcrobatでExcel変換 / ClaudeやTabulaを使う