AIツール使い方ガイド

Claudeに画像を読み込ませると何ができるか?対応形式と精度の限界を解説

kidaken-ai

結論:Claudeは画像を読んで分析・説明・抽出ができる

Claudeは画像をアップロードするとその内容を読み取り、テキストで分析・説明・情報抽出を行います。この機能はすべてのプランで利用可能です。ただし「生成AIが画像を読む」ことには得意な用途と苦手な用途があり、それを知らずに使うと期待と結果がズレます。

用途 精度 具体例
スクリーンショット・UIの説明 「このアプリの画面構成を説明して」
テキストを含む画像の文字起こし 「この名刺の情報をテキストで出して」
コードのスクリーンショットの解読 「このエラー画面のコードをデバッグして」
グラフ・チャートの読み取り 中〜高 「この棒グラフの数値を表にして」
手書き文字の読み取り 中(崩れた字は低下) 「このホワイトボードのメモをテキスト化して」
写真の詳細な識別 「この植物の種類を教えて」
人物の特定・識別 非対応(意図的に制限) 顔認識・個人特定は行わない
るみな

るみな

画像を送ったら何でも読んでくれるの?写真もOK?

きだけん

きだけん

写真も読めますが、精度は内容によります。テキストが写っている画像・図表・スクリーンショットは得意です。風景写真や物の写真は「これは何か」という説明はできますが、細かい個数の数え上げや微細な識別は精度が下がります。人物の顔認識と個人特定はClaudeが意図的に行わない仕様です。

対応ファイル形式とサイズ制限

対応フォーマット

Claudeが読み込める画像形式:

  • JPEG / JPG:写真・スクリーンショット向け
  • PNG:スクリーンショット・図表・透過画像向け
  • GIF:静止フレームのみ読み込み(アニメーションは非対応)
  • WebP:Web最適化画像

PDFのアップロードは別途対応(画像PDFは内部でページを画像として処理)。Word・PowerPoint内の画像は直接アップロードではなく、PDFに変換してからアップロードすると読みやすくなります。

ファイルサイズと枚数の制限

プラン 1枚あたりの上限 1会話あたりの枚数
無料プラン 10MB 複数枚可(合計サイズ以内)
Proプラン以上 25MB 複数枚可(合計サイズ以内)

1回の会話に複数枚アップロードできます。「この2つの画面デザインを比較して」のような複数画像の比較も可能です。

精度が上がる使い方のコツ

何を知りたいかを明示する

「この画像を見て」という指示だけでは、Claudeが何を分析すべきか判断できません。知りたい内容を具体的に伝えると精度が上がります。

曖昧な指示:

「この画像を見てください」

具体的な指示:

「このスクリーンショットに表示されているエラーメッセージを全て抽出して、
それぞれの原因と対処法を教えてください」

テキスト抽出は「書き起こし」と明示する

画像内のテキストを正確に取り出したい場合、「書き起こして」「テキストとして出力して」と明示します。

「この名刺の画像から、名前・会社名・メールアドレス・電話番号を
それぞれラベル付きで書き起こしてください」

「説明して」だと画像の内容を要約・解釈した文章が返ります。「書き起こして」だと記載テキストそのものが返ります。目的に応じて使い分けてください。

グラフ・表の読み取りを正確にする

グラフの数値読み取りは、軸の単位・凡例が鮮明に写っている画像ほど精度が上がります。ぼやけた画像・複雑すぎる配色の凡例は読み取りにくくなります。

「この棒グラフの各月の数値を読み取って、Markdownの表形式で出力してください。
凡例はA・B・Cの3種類です」

凡例の種類を事前に伝えると誤認識が減ります。

精度が落ちる・できない場面

精度が下がりやすい画像の特徴

  • 解像度が低い画像:文字がぼやけていると読み取り精度が大幅に低下
  • 手書き文字(崩し字・草書):印刷体は高精度だが、崩れた手書きは誤認識が多い
  • 縦書きの日本語テキスト:横書きより読み取りにくい傾向がある
  • 複雑な図表(多数の要素が重なる):要素が多いほど取りこぼしが増える
  • 非常に小さいフォントサイズのテキスト:6pt以下のテキストは読み取れないことがある

Claudeが意図的に行わないこと

  • 人物の個人特定・顔認識:プライバシー保護の観点から設計上制限されている
  • OCRの完全代替として使う:業務用の精密なOCRには専用ツールの方が適している
るみな

るみな

画像内の人の顔を読み込ませたら、誰か特定できる?

きだけん

きだけん

Claudeは意図的に人物の個人特定を行わない設計です。有名人かどうかの判断もしません。『この人は誰ですか?』と聞いても答えません。これはプライバシー保護の観点からAnthropicが設けている制限です。

実務での活用例

  • UI/UXレビュー:デザインのスクリーンショットをClaudeに見せて「ユーザビリティの問題点を指摘して」
  • コードエラーのデバッグ:エラー画面のスクリーンショットをそのまま貼って原因を聞く
  • 請求書・領収書のテキスト化:画像でもらった領収書をテキストデータに変換
  • 競合サイトの分析:競合のWebページをスクリーンショットして「このデザインの特徴を分析して」
  • 会議メモのデジタル化:ホワイトボードや付箋の写真を文字起こし・整理

Claudeの画像分析機能はArtifacts機能と組み合わせると、分析結果をMarkdownで整理して表示できます。Artifacts機能については「ClaudeのArtifacts機能で何ができるか?使える場面と使えない場面を解説」をご覧ください。

ABOUT ME
きだけん
きだけん
生成AI講師/副業コンサルタント
AI初心者が副業で月10万円を目指すための実践ノウハウを発信しています。生成AI講師として20名以上を指導し、自身もクラウドワークスで案件受注中。教育関連企業で10年勤務、娘の学費を稼ぐため日々研鑽中です。 全ての人が何かを「継続」し、「成果を出す」ことの手伝いをライフワークにしたいと考えています。
記事URLをコピーしました