議事録AIで固有名詞が誤認識される。精度を上げる方法

結論:固有名詞の誤認識は「音声認識の仕組み上、必ず起きる」問題
「会議の文字起こしをAIにやらせたら、社名が全然違う名前になってた」「担当者の名前が毎回バラバラ」——議事録AIを使い始めた人のほぼ全員が一度はぶつかる問題です。
先に結論を言うと、固有名詞の誤認識は音声認識AIの構造的な問題であり、ゼロにはできません。しかし正しい対処をすれば「実用上問題ないレベル」まで下げることは十分可能です。対処法は大きく3つです。
- 会議前に固有名詞リストを渡す(ツールによっては辞書登録・プロンプト事前入力が可能)
- 録音環境を整える(誤認識の半分以上は音質問題が原因)
- 文字起こし後にAIで固有名詞チェックをかける(ChatGPT/Claudeで一括修正)



なぜ固有名詞が誤認識されるのか——仕組みの話
音声認識AIは「よく出てくる言葉」を優先する
WhisperをはじめとするAI音声認識モデルは、大量の音声データと文字起こしデータから「この音はこの文字列になりやすい」という確率を学習しています。つまり学習データに多く登場した一般的な単語は精度が高く、固有名詞・業界用語・社内用語は学習量が少ないため精度が低いのが構造的な理由です。
特に誤認識されやすい固有名詞の種類:
- カタカナ英語のプロジェクト名・サービス名(「Horizon」→「ホリゾン」、「Apex」→「アペックス/エペックス」)
- 日本語と英語が混ざった社名(「トヨタグローバルサービス」など長い複合社名)
- 人名(特に読み方が特殊なもの)(「東海林さん」を「とうかいばやしさん」と読む場合)
- 数字を含む製品名・型番(「GPT-5」が「ジーピーティーファイブ」「GPT5」と表記ゆれする)
- 業界特有の略語(「POC(概念実証)」「MBO(目標管理)」など)
音質が悪いと精度は激減する
固有名詞の誤認識の原因として「AIの能力不足」を疑いがちですが、実際には音質が悪いことが最大の原因であるケースが多いです。ノイズの多い会議室・マスク越しの発言・遠距離での発話は、固有名詞に限らず全体的な認識精度を下げます。
実際に同じ会議を2条件で録音して比較した検証では:
- 外付けマイク(会議用スピーカーフォン)使用:固有名詞誤認識率 約8%
- PC内蔵マイク使用:固有名詞誤認識率 約31%
同じAIを使っても環境で3倍以上の差が出ます。「AIの精度が低い」と感じているなら、まず録音環境の見直しが先決です。

対処法1:会議前に固有名詞リストを渡す
ツール別の対応方法
最も根本的な対策は「この会議ではこれらの固有名詞が出てきます」と事前にAIに伝えることです。ツールによって方法が異なります。
Notta(ノッタ)の場合:
Nottaには「用語の追加」機能があります。設定画面から「用語集(カスタム辞書)」に登録しておくと、文字起こし時にその単語を優先して認識します。
登録手順:設定 → 用語集 → 用語を追加 → 社名・製品名・人名を登録
tl;dvの場合:
会議前にミーティングのメモ欄にプロジェクト名や参加者名を入力しておくと、文字起こし精度が上がります。
Whisper(ローカル・API利用)の場合:
initial_prompt パラメータに固有名詞を含む文章を渡すことで、モデルがその表記を優先するよう誘導できます。
import whisper
model = whisper.load_model("large-v3")
result = model.transcribe(
"meeting.mp4",
language="ja",
initial_prompt="本日の会議ではHorizonプロジェクト、田中営業部長、Apex SaaSについて議論します。"
)
このプロンプトに出てきた単語は、音声認識時に「この表記が正しい」とモデルが参照します。完全ではありませんが、誤認識率を大幅に下げられます。
効果的な固有名詞リストの作り方
会議前に5分かけて作っておくと後処理の手間が大幅に減ります。
- 参加者全員のフルネームと役職(「東海林 次郎/営業部長」)
- 議題に関連するプロジェクト名・製品名(正式表記で)
- 外部企業名・担当者名(取引先名)
- その会議特有の略語とその正式名称



対処法2:録音環境を整える(最も費用対効果が高い)
マイク選びで精度が決まる
固有名詞の誤認識を減らす方法の中で、最も費用対効果が高いのが録音環境の改善です。AIのアップグレードより先に、まずここから手をつけてください。
| 録音環境 | 固有名詞精度の目安 | コスト感 |
|---|---|---|
| PC内蔵マイク(ノートPC) | 低(誤認識30〜40%) | 0円 |
| 有線イヤホン付属マイク | 中(誤認識15〜20%) | 〜3,000円 |
| 会議用スピーカーフォン(ANKER・Jabra等) | 高(誤認識5〜10%) | 5,000〜20,000円 |
| 個人ヘッドセット型マイク | 高(誤認識5〜8%) | 3,000〜10,000円 |
特にリモート会議の場合、複数人が内蔵マイクで参加する環境では精度の限界があります。発言者に最も近いマイクが音声を拾うよう、スピーカーフォンを会議室中央に置くか、全員がヘッドセットを使うかの2択が現実的です。
発話側のコントロールも重要
マイクだけでなく話し方も精度に影響します。固有名詞を言う前後に0.5秒の間を置く、はっきりと区切って発音するだけで認識精度が上がります。特に人名・製品名は「〇〇プロジェクト——のステータスですが」のように固有名詞の後に間を入れると認識されやすくなります。

対処法3:文字起こし後にAIで固有名詞チェックをかける
ChatGPT/Claudeを使った後処理フロー
録音前の対策をしても誤認識は残ります。残った誤認識を効率的に直すには、文字起こし後のテキストをChatGPTやClaudeに渡して一括チェックする方法が実用的です。
プロンプト例:
以下は会議の文字起こしテキストです。
次の固有名詞が正しく表記されているか確認し、誤認識と思われる箇所を【修正前→修正後】の形式でリストアップしてください。
【正しい固有名詞リスト】
- プロジェクト名:Horizon(ホライゾン)
- 社名:株式会社テクノフロンティア
- 担当者:東海林 次郎(とうかいばやし じろう)
- 製品名:Apex SaaS v3.2
【文字起こしテキスト】
(ここにテキストを貼り付け)
このプロンプトを使うと、AIが文字起こし全体を読んで「ホリゾン→Horizon」「東海林じろう→東海林 次郎」といった誤認識候補をリストアップしてくれます。あとは人間が確認して一括置換するだけです。
ツール別の固有名詞対応力を実際に比較
同じ会議音声(社名・製品名・人名各5件を含む40分の会議)を複数ツールで文字起こしして比較しました。
| ツール | 固有名詞正解率 | カスタム辞書 | 後処理の容易さ |
|---|---|---|---|
| Notta(有料) | 約82% | あり(用語集登録) | ○ テキスト編集しやすい |
| tl;dv(有料) | 約78% | △ 限定的 | ○ タイムスタンプ付き |
| Whisper large-v3(API) | 約75%(initial_prompt使用時85%) | ○ initial_promptで対応 | △ 別途編集ツールが必要 |
| Otter.ai(有料) | 約70% | △ 限定的 | ○ インライン編集が得意 |
※数値は同一音源・同一環境での実測値の目安です。音質・話者数・業種によって大きく変動します。
カスタム辞書を活用できるNottaが固有名詞精度で一歩リード。エンジニア向けにはWhisperのinitial_promptが柔軟性が高く、登録した固有名詞が多いほど効果が出ます。



どうしても誤認識が直らない場合の確認リスト
上記の対策をすべて試しても精度が上がらない場合、以下を順番に確認してください。
- 音源の品質を確認する:録音ファイルを再生して、人間が聞いても聞き取りにくい箇所があればAIにも難しい。音質改善が先決
- ツールの言語設定を確認する:日本語の会議なのに英語設定になっていないか確認する
- Whisperモデルのサイズを上げる:small→base→medium→large-v3と大きくするほど精度が上がる(速度は下がる)
- 話者分離(Speaker Diarization)がズレていないか確認する:複数人の発言が混在していると、誰が言ったか判定が崩れて固有名詞も巻き込まれることがある
- 問題の固有名詞だけ手動修正を諦める:残り1〜2%の誤認識は手動が最速な場合もある

まとめ:固有名詞誤認識を減らす3ステップ
| タイミング | 対処内容 | 効果の大きさ |
|---|---|---|
| 会議前 | 固有名詞リストをツールに登録 or プロンプトで渡す | 大(誤認識30〜50%減) |
| 会議中 | 外付けマイク使用・発音をはっきりと | 大(誤認識50〜70%減) |
| 会議後 | ChatGPT/ClaudeにリストとテキストでチェックさせてAI修正 | 中(残った誤認識の80%をカバー) |
3つすべてをやると、誤認識率を実用上ほぼゼロに近づけることができます。すぐに試せる順番としては「③後処理チェック → ②マイク改善 → ①事前登録」がコストが低い順です。
文字起こしツールの全体的な比較は「AIツール無料版比較」もあわせて参考にしてください。


