WebサイトをPDFにしてくれるソフトウェアは多いですが、その際にはどんなサイトをPDF化したいでしょうか。多くの場合、電子書籍風に読めるコンテンツを提供しているサイトで使いたいのではないでしょうか。 そんなニーズに使えそうなソフトウェアがPDFSaveです。WebサイトをPDF化しますが、テキスト部分だけを抽出します。

PDFSaveの使い方

例えばこんな感じです。これはかなり綺麗にPDF化される例です。

元のWebサイト。

日本語では残念ながらうまくいきませんでした…。

現状では日本語はうまくいきませんが、カスタマイズすると面白そうです。テキスト部分だけを抽出して、電子書籍風にコンテンツを整形すれば、より電子書籍が広まるきっかけになるのではないでしょうか。画像やバナーなどがないだけでも十分可読性が上がりそうです。

PDFSaveはnode/JavaScript製のオープンソース・ソフトウェア(MIT License)です。

vladocar/PDFSave: Convert websites into readable PDFs