PDFファイルのテキスト化

DeepLやGoogle翻訳で海外サイトを読んでいると、しばしばPDFファイルに遭遇する。日本語で読みたいのだが、DeepLは有料プランでも回数制限があるため、難儀する。

いかのnoteで、PDFコンバータとDeepLPro(有料プラン)を組み合わせることで、制限なしの翻訳方法の紹介があった。

note.com

【DeepL裏技】英語だらけの米国株IR資料を難なく読み込みまくる方法|Tomoki Hirata|note

 

ほかにもPDFをテキストに変換するサービスがあるため、比較してみた。

 

 

・・・

 

ただ、結論から書くと僕の使い方では、上記noteで紹介されている「オンラインPDFコンバータ」がおすすめという結論。

www.idrsolutions.com

他のサイトと比べて、操作が単純で、HTML形式で元PDFと同じレイアウトでファイル出力されるため、そのあとの読み込みや作業がしやすい。

DeepLのChrome拡張を導入しておけば、そのまま読める。。。

 

オンラインPDFコンバーターオンラインで PDF から HTML5 に変換

オンラインPDFコンバータ-PDFからHTML5

 

①使い方は簡単で、HTMLに変換したいPDFをダウンロードしておく。

②サイトに移動して、「ファイルを選ぶ」をクリックして、ダウンロードしたPDF(変換したいPDF)を選択する。

③ファイルがアップロードされるので、「変換する」をクリック。

④以下の画面になるので、「ZIPをダウンロード」でファイルをダウンロードするか、「オンラインでプレビュー」をクリックして、ブラウザで作業する。

 そのまま作業すること多いので、「オンラインでプレビュー」を利用することが多い。

PDFコンバーター+46のオンラインPDFツール– PDF Candy

次に紹介するのは、PDFCoandy

pdfcandy.com

PDFコンバーター+46のオンラインPDFツール– PDF Candy

 

こちらも使い方は同じで、PDFファイルをダウンロードしておき、「ファイル追加」から対象PDFをアップロードする。

 

変換が終わると、以下のページが表示される。DOCファイルに変換されるため、Word等の別ソフトで開く必要あり、ひと手間かかる。

そんなわけで、初めのシンプルな「オンラインPDFコンバータ」の方が、僕の使い方にはあっている。

ただし、以下の通り、機能が沢山あるため、必要に応じて使い分けるのが良いと思う。

Convertio — ファイルコンバーター

こちらはPDFファイルから、テキストファイルに変換してくれるサイト。

DropboxやGoogleDriveからアップロード可能で、複数ファイルをまとめて変換できる。

 

使い方は、「ファイルを選ぶ」からテキスト化したいPDFファイルを選択する。

ファイルをアップロードすると、以下の画面になる。なお、以下の画像は2ファイルをアップロードしている。

変換する形式を以下のものから選択できるので、それぞれ選ぶか、「すべてのを変換」をクリックして、まとめて選ぶことも可能。

「変換」をクリックすると変換作業がはじまる。

変換が完了すると、以下の画面になり、「ダウンロード」からファイルを取得できる。

ただ、HTMLに変換しても、画像ファイルとして保存されてしまうので、編集作業が難しい。テキストファイルにも変換できるため、編集作業で使うには、テキスト形式が良いが、それであれば初めに紹介した「オンラインPDFコンバータ」の方が手間が少ないという結論。

 

以上