PDF → テキスト抽出

PDFファイルからすべてのテキストを一括抽出して.txtファイルとして保存します。日本語·韓国語·中国語など多言語PDFも正常処理され、ファイルはブラウザ内のみで処理されます。

📃 PDFをドラッグまたはクリックで選択 1つのPDFファイル

使い方

1
PDFをアップロード

ドラッグまたはクリックでPDFを取り込み。ページが多くてもすべて処理(大きなファイルは数秒かかる場合あり)。

2
オプションを選択

「ページ区切り」表示の有無を選択。オン: 「--- Page N ---」形式でページ間を区切る。オフ: すべて連続したテキストに。

3
結果確認·ダウンロード

抽出されたテキストが画面に表示され、「.txtダウンロード」または「コピー」で取得可能。

よくある質問

スキャンPDFも抽出可能?

いいえ。本ツールはPDF内に「テキストレイヤー」がある場合のみ抽出します。スキャンされた紙文書はピクセル画像のみのためテキストがなく、結果は空または不正です。スキャン用は「画像から文字認識(OCR)」ツールをご利用ください。

日本語が文字化け

PDFに日本語が埋め込みフォントで保存されていれば正常抽出。一部PDFは日本語を「画像化」または「カスタムエンコーディング」で保存し抽出が困難な場合があり、その場合はOCRツールを推奨。

ページ順は保証される?

はい。PDF.jsがページ番号順に処理するため1, 2, 3...順で抽出。ページ内では視覚位置(左上→右下)を基準に順序が決定されます。

暗号化PDFは?

パスワード保護されたPDFは事前にロック解除してください。本ツールはパスワードPDFを直接開きません。

サーバーに送信されますか?

いいえ。PDF.jsでブラウザ内で直接パースされ、ファイルが外部に送信されることはありません。