画像から文字認識 (OCR)

写真やスクリーンショットの文字をブラウザ内で認識します。領収書・名刺・本のページ・字幕キャプチャなどに使えます。

日本語の領収書は日本語+英語を有効にすると精度が向上します。初回利用時に言語モデル(5–15MB)を一度ダウンロードします。

使い方

1
言語を選択

認識したい言語を1つ以上選択してください。日本語の領収書なら日本語+英語を有効にすると精度が上がります。

2
画像をアップロード

ドラッグ・クリップボード貼り付け・ファイル選択のいずれでも可。初回利用時に認識モデル(約5–15MB)を一度ダウンロードします。

3
結果を編集・保存

認識されたテキストはその場で編集してコピー、または.txtでダウンロードできます。

よくある質問

認識精度はどのくらいですか?

きれいな印刷文字(領収書・本・スクリーンショット)では90%以上認識されます。手書き・傾いた写真・低解像度では精度が下がる場合があります。精度が低い場合は、画像を拡大したりコントラストを上げて再試行してください。

初回が遅いのはなぜ?

言語別の認識モデル(約5–15MB)を初回のみCDNからダウンロードするためです。同じ言語の2回目以降はブラウザキャッシュから即時読み込みされます。

複数言語を同時に認識できますか?

はい。2つ以上の言語を選択すると同時に認識します。ただし言語数が増えるほど処理時間とメモリ使用量が増えます。

中国語は繁体字も対応?

本ツールは簡体字(chi_sim)のみ対応です。繁体字は別モデルが必要なため現在は対応していません。

画像はサーバーにアップロードされますか?

いいえ。Tesseract.jsがブラウザ内で直接処理します。認識モデルはjsDelivr CDNから取得しますが、画像自体は外部に送信されません。