PDF → テキスト抽出
PDFファイルからすべてのテキストを一括抽出して.txtファイルとして保存します。日本語·韓国語·中国語など多言語PDFも正常処理され、ファイルはブラウザ内のみで処理されます。
PDFをドラッグまたはクリックで選択 1つのPDFファイル
抽出中...
抽出されたテキスト
使い方
1
PDFをアップロード
ドラッグまたはクリックでPDFを取り込み。ページが多くてもすべて処理(大きなファイルは数秒かかる場合あり)。
2
オプションを選択
「ページ区切り」表示の有無を選択。オン: 「--- Page N ---」形式でページ間を区切る。オフ: すべて連続したテキストに。
3
結果確認·ダウンロード
抽出されたテキストが画面に表示され、「.txtダウンロード」または「コピー」で取得可能。
よくある質問
スキャンPDFも抽出可能?
いいえ。本ツールはPDF内に「テキストレイヤー」がある場合のみ抽出します。スキャンされた紙文書はピクセル画像のみのためテキストがなく、結果は空または不正です。スキャン用は「画像から文字認識(OCR)」ツールをご利用ください。
日本語が文字化け
PDFに日本語が埋め込みフォントで保存されていれば正常抽出。一部PDFは日本語を「画像化」または「カスタムエンコーディング」で保存し抽出が困難な場合があり、その場合はOCRツールを推奨。
ページ順は保証される?
はい。PDF.jsがページ番号順に処理するため1, 2, 3...順で抽出。ページ内では視覚位置(左上→右下)を基準に順序が決定されます。
暗号化PDFは?
パスワード保護されたPDFは事前にロック解除してください。本ツールはパスワードPDFを直接開きません。
サーバーに送信されますか?
いいえ。PDF.jsでブラウザ内で直接パースされ、ファイルが外部に送信されることはありません。