これがHTML?と言いたくなるようなPDF変換ソフトウェア「pdf2htmlEX」
pdf2htmlEXはレイアウトの再現性を極めたPDFからHTMLへの変換ソフトウェアです。
PDFはそのままでは容易に編集できないフォーマットです。そこが利点でもあり欠点でもあります。PDFを別フォーマットに変換するソフトウェアは幾つかありますが、今回は驚いてしまうくらい品質高いHTML変換を行うpdf2htmlEXを紹介します。
まるで素のPDFを表示しているかのような再現度の高さがpdf2htmlEXの売りです。PDFを一つのHTMLファイルとして出力し、色や文字の装飾も反映します。リンクもそのまま使えます。なお、Type3のフォントには対応しておらず、テキスト以外のオブジェクトは画像としてレンダリングされるようになっています。
pdf2htmlEXはGPLのオープンソース・ソフトウェアです。
MOONGIFTはこう見る
PDFはビジネス用途でよく使われるのですが、それ故に自動処理の対象になることが多々あります。メールで請求書を送られる場合、その中から金額や商品に関する情報をピックアップしたいと思うでしょう。そのような場合に便利なのはPDF2○○といったコマンド群です。
また、少し前にはオンラインのドキュメント共有サービスが流行り、PDFもFlashに変換して埋め込み表示されていました。固定のフォーマット故に再利用性が低いと思われがちなPDFですが、意外と変換には柔軟で探してみると色々なフォーマットに変換できるようになっています。