이미지 텍스트 추출 (OCR)

사진이나 스크린샷의 글자를 브라우저에서 바로 인식합니다. 영수증·명함·책 페이지·자막 캡처 등에 사용하세요.

한국어 영수증·문서는 한국어 + 영어 함께 인식하면 정확도가 높습니다. 첫 사용 시 언어별 모델(5–15MB)을 한 번 다운로드합니다.

사용 방법

1
언어 선택

인식할 언어를 한 개 또는 여러 개 선택하세요. 한국어 영수증이라면 한국어+영어를 함께 켜는 것이 정확도가 높습니다.

2
이미지 업로드

드래그/클립보드 붙여넣기/파일 선택 어느 방식이든 가능합니다. 첫 사용 시 인식 모델(약 5–15MB)을 한 번 다운로드합니다.

3
결과 편집·저장

인식된 텍스트는 직접 수정 후 복사하거나 .txt 파일로 다운로드할 수 있습니다.

자주 묻는 질문

인식 정확도는 어느 수준인가요?

깨끗한 인쇄 문자(영수증·책·스크린샷)는 90% 이상 인식됩니다. 손글씨·기울어진 사진·저해상도 이미지는 정확도가 떨어질 수 있어요. 정확도가 낮으면 이미지를 확대하거나 대비를 높여 다시 시도해 보세요.

왜 첫 인식이 느린가요?

언어별 인식 모델(약 5–15MB)을 처음 한 번 CDN에서 다운로드하기 때문입니다. 같은 언어를 두 번째부터는 브라우저 캐시에서 즉시 로드됩니다.

여러 언어를 동시에 인식할 수 있나요?

네. 두 개 이상의 언어를 선택하면 한 번에 인식합니다. 단, 언어 수가 많을수록 처리 시간과 메모리 사용이 늘어납니다.

한자(중국어)는 간체와 번체 모두 가능?

본 도구는 간체(chi_sim)를 사용합니다. 번체는 별도 모델이 필요해 현재는 간체만 지원합니다.

이미지가 서버에 업로드되나요?

아닙니다. Tesseract.js가 브라우저 안에서 이미지를 직접 처리합니다. 인식 모델은 jsDelivr CDN에서 다운로드하지만, 이미지 자체는 외부로 전송되지 않습니다.