이미지 텍스트 추출 (OCR)
사진이나 스크린샷의 글자를 브라우저에서 바로 인식합니다. 영수증·명함·책 페이지·자막 캡처 등에 사용하세요.
언어 선택
한국어 영수증·문서는 한국어 + 영어 함께 인식하면 정확도가 높습니다. 첫 사용 시 언어별 모델(5–15MB)을 한 번 다운로드합니다.
대기 중…
인식 결과
사용 방법
1
언어 선택
인식할 언어를 한 개 또는 여러 개 선택하세요. 한국어 영수증이라면 한국어+영어를 함께 켜는 것이 정확도가 높습니다.
2
이미지 업로드
드래그/클립보드 붙여넣기/파일 선택 어느 방식이든 가능합니다. 첫 사용 시 인식 모델(약 5–15MB)을 한 번 다운로드합니다.
3
결과 편집·저장
인식된 텍스트는 직접 수정 후 복사하거나 .txt 파일로 다운로드할 수 있습니다.
자주 묻는 질문
인식 정확도는 어느 수준인가요?
깨끗한 인쇄 문자(영수증·책·스크린샷)는 90% 이상 인식됩니다. 손글씨·기울어진 사진·저해상도 이미지는 정확도가 떨어질 수 있어요. 정확도가 낮으면 이미지를 확대하거나 대비를 높여 다시 시도해 보세요.
왜 첫 인식이 느린가요?
언어별 인식 모델(약 5–15MB)을 처음 한 번 CDN에서 다운로드하기 때문입니다. 같은 언어를 두 번째부터는 브라우저 캐시에서 즉시 로드됩니다.
여러 언어를 동시에 인식할 수 있나요?
네. 두 개 이상의 언어를 선택하면 한 번에 인식합니다. 단, 언어 수가 많을수록 처리 시간과 메모리 사용이 늘어납니다.
한자(중국어)는 간체와 번체 모두 가능?
본 도구는 간체(chi_sim)를 사용합니다. 번체는 별도 모델이 필요해 현재는 간체만 지원합니다.
이미지가 서버에 업로드되나요?
아닙니다. Tesseract.js가 브라우저 안에서 이미지를 직접 처리합니다. 인식 모델은 jsDelivr CDN에서 다운로드하지만, 이미지 자체는 외부로 전송되지 않습니다.