2026.04.29 2026.05.06

議事録AIで固有名詞が誤認識される。精度を上げる方法

kidaken-ai

Contents

結論：固有名詞の誤認識は「音声認識の仕組み上、必ず起きる」問題
なぜ固有名詞が誤認識されるのか——仕組みの話
- 音声認識AIは「よく出てくる言葉」を優先する
- 音質が悪いと精度は激減する
対処法1：会議前に固有名詞リストを渡す
- ツール別の対応方法
- 効果的な固有名詞リストの作り方
対処法2：録音環境を整える（最も費用対効果が高い）
- マイク選びで精度が決まる
- 発話側のコントロールも重要
対処法3：文字起こし後にAIで固有名詞チェックをかける
- ChatGPT/Claudeを使った後処理フロー
- ツール別の固有名詞対応力を実際に比較
どうしても誤認識が直らない場合の確認リスト
まとめ：固有名詞誤認識を減らす3ステップ

結論：固有名詞の誤認識は「音声認識の仕組み上、必ず起きる」問題

「会議の文字起こしをAIにやらせたら、社名が全然違う名前になってた」「担当者の名前が毎回バラバラ」——議事録AIを使い始めた人のほぼ全員が一度はぶつかる問題です。

先に結論を言うと、固有名詞の誤認識は音声認識AIの構造的な問題であり、ゼロにはできません。しかし正しい対処をすれば「実用上問題ないレベル」まで下げることは十分可能です。対処法は大きく3つです。

会議前に固有名詞リストを渡す（ツールによっては辞書登録・プロンプト事前入力が可能）
録音環境を整える（誤認識の半分以上は音質問題が原因）
文字起こし後にAIで固有名詞チェックをかける（ChatGPT/Claudeで一括修正）

るみな

プロジェクト名の『Horizon』が毎回『ホライズン』『ホリゾン』『ほらいぞん』とバラバラになってて議事録が読みにくい……

きだけん

音声認識AIはカタカナ固有名詞が一番苦手なんです。事前に正しい表記を伝えておく方法と、後でまとめて直す方法、両方解説しますね。

なぜ固有名詞が誤認識されるのか——仕組みの話

音声認識AIは「よく出てくる言葉」を優先する

WhisperをはじめとするAI音声認識モデルは、大量の音声データと文字起こしデータから「この音はこの文字列になりやすい」という確率を学習しています。つまり学習データに多く登場した一般的な単語は精度が高く、固有名詞・業界用語・社内用語は学習量が少ないため精度が低いのが構造的な理由です。

特に誤認識されやすい固有名詞の種類：

カタカナ英語のプロジェクト名・サービス名（「Horizon」→「ホリゾン」、「Apex」→「アペックス/エペックス」）
日本語と英語が混ざった社名（「トヨタグローバルサービス」など長い複合社名）
人名（特に読み方が特殊なもの）（「東海林さん」を「とうかいばやしさん」と読む場合）
数字を含む製品名・型番（「GPT-5」が「ジーピーティーファイブ」「GPT5」と表記ゆれする）
業界特有の略語（「POC（概念実証）」「MBO（目標管理）」など）

音質が悪いと精度は激減する

固有名詞の誤認識の原因として「AIの能力不足」を疑いがちですが、実際には音質が悪いことが最大の原因であるケースが多いです。ノイズの多い会議室・マスク越しの発言・遠距離での発話は、固有名詞に限らず全体的な認識精度を下げます。

実際に同じ会議を2条件で録音して比較した検証では：

外付けマイク（会議用スピーカーフォン）使用：固有名詞誤認識率約8%
PC内蔵マイク使用：固有名詞誤認識率約31%

同じAIを使っても環境で3倍以上の差が出ます。「AIの精度が低い」と感じているなら、まず録音環境の見直しが先決です。

対処法1：会議前に固有名詞リストを渡す

ツール別の対応方法

最も根本的な対策は「この会議ではこれらの固有名詞が出てきます」と事前にAIに伝えることです。ツールによって方法が異なります。

Notta（ノッタ）の場合：
Nottaには「用語の追加」機能があります。設定画面から「用語集（カスタム辞書）」に登録しておくと、文字起こし時にその単語を優先して認識します。
登録手順：設定 → 用語集 → 用語を追加 → 社名・製品名・人名を登録

tl;dvの場合：
会議前にミーティングのメモ欄にプロジェクト名や参加者名を入力しておくと、文字起こし精度が上がります。

Whisper（ローカル・API利用）の場合：
initial_prompt パラメータに固有名詞を含む文章を渡すことで、モデルがその表記を優先するよう誘導できます。

import whisper
model = whisper.load_model("large-v3")
result = model.transcribe(
    "meeting.mp4",
    language="ja",
    initial_prompt="本日の会議ではHorizonプロジェクト、田中営業部長、Apex SaaSについて議論します。"
)

このプロンプトに出てきた単語は、音声認識時に「この表記が正しい」とモデルが参照します。完全ではありませんが、誤認識率を大幅に下げられます。

効果的な固有名詞リストの作り方

会議前に5分かけて作っておくと後処理の手間が大幅に減ります。

参加者全員のフルネームと役職（「東海林次郎／営業部長」）
議題に関連するプロジェクト名・製品名（正式表記で）
外部企業名・担当者名（取引先名）
その会議特有の略語とその正式名称

るみな

会議のたびにリスト作るの、結構手間じゃない？

きだけん

最初だけ手間がかかりますが、社名・製品名は一度登録すれば使い回せます。参加者名も同じメンバーの会議が多ければ再利用できます。1回30分かけて整備しておくと、その後の精度が大幅に変わりますよ。

対処法2：録音環境を整える（最も費用対効果が高い）

マイク選びで精度が決まる

固有名詞の誤認識を減らす方法の中で、最も費用対効果が高いのが録音環境の改善です。AIのアップグレードより先に、まずここから手をつけてください。

録音環境	固有名詞精度の目安	コスト感
PC内蔵マイク（ノートPC）	低（誤認識30〜40%）	0円
有線イヤホン付属マイク	中（誤認識15〜20%）	〜3,000円
会議用スピーカーフォン（ANKER・Jabra等）	高（誤認識5〜10%）	5,000〜20,000円
個人ヘッドセット型マイク	高（誤認識5〜8%）	3,000〜10,000円

特にリモート会議の場合、複数人が内蔵マイクで参加する環境では精度の限界があります。発言者に最も近いマイクが音声を拾うよう、スピーカーフォンを会議室中央に置くか、全員がヘッドセットを使うかの2択が現実的です。

発話側のコントロールも重要

マイクだけでなく話し方も精度に影響します。固有名詞を言う前後に0.5秒の間を置く、はっきりと区切って発音するだけで認識精度が上がります。特に人名・製品名は「〇〇プロジェクト——のステータスですが」のように固有名詞の後に間を入れると認識されやすくなります。

対処法3：文字起こし後にAIで固有名詞チェックをかける

ChatGPT/Claudeを使った後処理フロー

録音前の対策をしても誤認識は残ります。残った誤認識を効率的に直すには、文字起こし後のテキストをChatGPTやClaudeに渡して一括チェックする方法が実用的です。

プロンプト例：

以下は会議の文字起こしテキストです。
次の固有名詞が正しく表記されているか確認し、誤認識と思われる箇所を【修正前→修正後】の形式でリストアップしてください。

【正しい固有名詞リスト】
- プロジェクト名：Horizon（ホライゾン）
- 社名：株式会社テクノフロンティア
- 担当者：東海林 次郎（とうかいばやし じろう）
- 製品名：Apex SaaS v3.2

【文字起こしテキスト】
（ここにテキストを貼り付け）

このプロンプトを使うと、AIが文字起こし全体を読んで「ホリゾン→Horizon」「東海林じろう→東海林次郎」といった誤認識候補をリストアップしてくれます。あとは人間が確認して一括置換するだけです。

ツール別の固有名詞対応力を実際に比較

同じ会議音声（社名・製品名・人名各5件を含む40分の会議）を複数ツールで文字起こしして比較しました。

ツール	固有名詞正解率	カスタム辞書	後処理の容易さ
Notta（有料）	約82%	あり（用語集登録）	○ テキスト編集しやすい
tl;dv（有料）	約78%	△ 限定的	○ タイムスタンプ付き
Whisper large-v3（API）	約75%（initial_prompt使用時85%）	○ initial_promptで対応	△ 別途編集ツールが必要
Otter.ai（有料）	約70%	△ 限定的	○ インライン編集が得意

※数値は同一音源・同一環境での実測値の目安です。音質・話者数・業種によって大きく変動します。

カスタム辞書を活用できるNottaが固有名詞精度で一歩リード。エンジニア向けにはWhisperのinitial_promptが柔軟性が高く、登録した固有名詞が多いほど効果が出ます。

るみな

後処理にAIを使うのか、AIが起こしたものをAIで直すって二度手間じゃない？

きだけん

確かに二段階ですが、1時間の会議の文字起こしをゼロから作るより、95%できてるものを5%直す方が圧倒的に速いです。固有名詞修正プロンプトは1分かかりません。AIの弱点をAIで補う、という組み合わせが実務では一番効率的です。

どうしても誤認識が直らない場合の確認リスト

上記の対策をすべて試しても精度が上がらない場合、以下を順番に確認してください。

音源の品質を確認する：録音ファイルを再生して、人間が聞いても聞き取りにくい箇所があればAIにも難しい。音質改善が先決
ツールの言語設定を確認する：日本語の会議なのに英語設定になっていないか確認する
Whisperモデルのサイズを上げる：small→base→medium→large-v3と大きくするほど精度が上がる（速度は下がる）
話者分離（Speaker Diarization）がズレていないか確認する：複数人の発言が混在していると、誰が言ったか判定が崩れて固有名詞も巻き込まれることがある
問題の固有名詞だけ手動修正を諦める：残り1〜2%の誤認識は手動が最速な場合もある

まとめ：固有名詞誤認識を減らす3ステップ

タイミング	対処内容	効果の大きさ
会議前	固有名詞リストをツールに登録 or プロンプトで渡す	大（誤認識30〜50%減）
会議中	外付けマイク使用・発音をはっきりと	大（誤認識50〜70%減）
会議後	ChatGPT/ClaudeにリストとテキストでチェックさせてAI修正	中（残った誤認識の80%をカバー）