画像から文字認識 (OCR)

写真やスクリーンショットの文字をブラウザ内で認識します。領収書・名刺・本のページ・字幕キャプチャなどに使えます。

言語選択

日本語 English 한국어 简体中文

日本語の領収書は日本語+英語を有効にすると精度が向上します。初回利用時に言語モデル(5–15MB)を一度ダウンロードします。

画像をドラッグまたはクリックして選択

またはCtrl/⌘+Vで貼り付け · PNG · JPG · WebP

使い方

言語を選択

認識したい言語を1つ以上選択してください。日本語の領収書なら日本語+英語を有効にすると精度が上がります。

画像をアップロード

ドラッグ・クリップボード貼り付け・ファイル選択のいずれでも可。初回利用時に認識モデル(約5–15MB)を一度ダウンロードします。

結果を編集・保存

認識されたテキストはその場で編集してコピー、または.txtでダウンロードできます。

認識精度はどのくらいですか？

きれいな印刷文字(領収書・本・スクリーンショット)では90%以上認識されます。手書き・傾いた写真・低解像度では精度が下がる場合があります。精度が低い場合は、画像を拡大したりコントラストを上げて再試行してください。

初回が遅いのはなぜ？

言語別の認識モデル(約5–15MB)を初回のみCDNからダウンロードするためです。同じ言語の2回目以降はブラウザキャッシュから即時読み込みされます。

複数言語を同時に認識できますか？

はい。2つ以上の言語を選択すると同時に認識します。ただし言語数が増えるほど処理時間とメモリ使用量が増えます。

中国語は繁体字も対応？

本ツールは簡体字(chi_sim)のみ対応です。繁体字は別モデルが必要なため現在は対応していません。

画像はサーバーにアップロードされますか？

いいえ。Tesseract.jsがブラウザ内で直接処理します。認識モデルはjsDelivr CDNから取得しますが、画像自体は外部に送信されません。