pdf2htmlEXはレイアウトの再現性を極めたPDFからHTMLへの変換ソフトウェアです。

PDFはそのままでは容易に編集できないフォーマットです。そこが利点でもあり欠点でもあります。PDFを別フォーマットに変換するソフトウェアは幾つかありますが、今回は驚いてしまうくらい品質高いHTML変換を行うpdf2htmlEXを紹介します。


これがHTMLだと思えないくらいの再現度です。


計算式にも対応。


段組み、画像埋め込みも問題なし。


白黒に限らず扱えます。


中国語。マルチバイト対応です。

まるで素のPDFを表示しているかのような再現度の高さがpdf2htmlEXの売りです。PDFを一つのHTMLファイルとして出力し、色や文字の装飾も反映します。リンクもそのまま使えます。なお、Type3のフォントには対応しておらず、テキスト以外のオブジェクトは画像としてレンダリングされるようになっています。

pdf2htmlEXはGPLのオープンソース・ソフトウェアです。

MOONGIFTはこう見る

PDFはビジネス用途でよく使われるのですが、それ故に自動処理の対象になることが多々あります。メールで請求書を送られる場合、その中から金額や商品に関する情報をピックアップしたいと思うでしょう。そのような場合に便利なのはPDF2○○といったコマンド群です。

また、少し前にはオンラインのドキュメント共有サービスが流行り、PDFもFlashに変換して埋め込み表示されていました。固定のフォーマット故に再利用性が低いと思われがちなPDFですが、意外と変換には柔軟で探してみると色々なフォーマットに変換できるようになっています。

pdf2htmlEX by coolwanglu

coolwanglu/pdf2htmlEX