PDF → 텍스트 추출

PDF 파일에서 모든 텍스트를 한 번에 뽑아내 .txt 파일로 저장합니다. 한글·일본어·중국어 등 다국어 PDF도 정상 처리되며, 파일은 브라우저 안에서만 처리됩니다.

📃 PDF를 끌어다 놓거나 클릭해서 선택 한 번에 한 PDF 파일

사용 방법

PDF 업로드

드래그하거나 클릭으로 PDF를 가져오세요. 페이지가 많아도 모두 처리됩니다(큰 파일은 추출에 몇 초 걸릴 수 있음).

옵션 선택

"페이지 구분자" 표시 여부를 선택. 켜면 "--- Page N ---" 형태로 페이지 사이를 구분합니다. 끄면 모든 텍스트가 자연스럽게 이어집니다.

결과 확인·다운로드

추출된 텍스트가 화면에 표시되고, ".txt 다운로드" 또는 "복사"로 가져갈 수 있습니다.

이미지 PDF(스캔본)도 추출되나요?

아닙니다. 본 도구는 PDF 안에 "텍스트 레이어"가 있는 경우에만 추출합니다. 스캔된 종이 문서는 픽셀 이미지일 뿐이라 텍스트가 없으므로 결과가 비거나 비정상입니다. 스캔본은 "이미지 텍스트 추출(OCR)" 도구를 사용하세요.

한글이 깨져요

PDF에 한글이 임베딩된 폰트로 있으면 정상 추출됩니다. 일부 PDF는 한글을 "이미지화"하거나 "커스텀 인코딩"으로 저장해 추출이 어려울 수 있는데, 이 경우 OCR 도구를 권장합니다.

페이지 순서는 보장되나요?

네. PDF.js가 페이지 번호 순서대로 처리하므로 1, 2, 3... 순서로 추출됩니다. 페이지 안에서는 시각적 위치(좌상→우하)를 기준으로 순서가 결정됩니다.

암호화된 PDF는?

비밀번호로 보호된 PDF는 먼저 잠금을 해제한 뒤 사용해야 합니다. 본 도구는 비밀번호 PDF를 직접 열지 않습니다.

데이터가 서버에 전송되나요?

아닙니다. PDF.js로 브라우저에서 직접 파싱하며, 파일이 외부로 전송되지 않습니다.