画像から文字認識 (OCR)
写真やスクリーンショットの文字をブラウザ内で認識します。領収書・名刺・本のページ・字幕キャプチャなどに使えます。
言語選択
日本語の領収書は日本語+英語を有効にすると精度が向上します。初回利用時に言語モデル(5–15MB)を一度ダウンロードします。
待機中…
認識結果
使い方
1
言語を選択
認識したい言語を1つ以上選択してください。日本語の領収書なら日本語+英語を有効にすると精度が上がります。
2
画像をアップロード
ドラッグ・クリップボード貼り付け・ファイル選択のいずれでも可。初回利用時に認識モデル(約5–15MB)を一度ダウンロードします。
3
結果を編集・保存
認識されたテキストはその場で編集してコピー、または.txtでダウンロードできます。
よくある質問
認識精度はどのくらいですか?
きれいな印刷文字(領収書・本・スクリーンショット)では90%以上認識されます。手書き・傾いた写真・低解像度では精度が下がる場合があります。精度が低い場合は、画像を拡大したりコントラストを上げて再試行してください。
初回が遅いのはなぜ?
言語別の認識モデル(約5–15MB)を初回のみCDNからダウンロードするためです。同じ言語の2回目以降はブラウザキャッシュから即時読み込みされます。
複数言語を同時に認識できますか?
はい。2つ以上の言語を選択すると同時に認識します。ただし言語数が増えるほど処理時間とメモリ使用量が増えます。
中国語は繁体字も対応?
本ツールは簡体字(chi_sim)のみ対応です。繁体字は別モデルが必要なため現在は対応していません。
画像はサーバーにアップロードされますか?
いいえ。Tesseract.jsがブラウザ内で直接処理します。認識モデルはjsDelivr CDNから取得しますが、画像自体は外部に送信されません。