ITエンジニア/デザイナ向けにオープンソースを毎日紹介

PdfMasherはPDFファイルを解析してテキストを編集後、HTMLに変換するソフトウェア。

PdfMasherはWindows/Mac OSX/Linux用のオープンソース・ソフトウェア。iOSをはじめ、多数のデバイスでPDFの閲覧がサポートされている。そのため、PDFをそのまま電子書籍フォーマットにすることだって不可能ではない。だが何となく嫌だ。


メイン画面

自由がなさ過ぎるフォーマットであるし、文字や図を表示するのみで電子書籍ならではの面白さも感じられない。そこでPDFをコンバートするためのPdfMasherを紹介しよう。

PdfMasherはPDFファイルを開いて解析し、テキストに置き換えてくれる。認識されたテキストは自由に変更ができる。そしてテキストはMarkdown形式で出力ができる。Markdown形式からさらにHTMLへコンバートして保存することも可能だ。


生成したHTML

いわば編集機能を備えたPDF2HTMLと言える。全く同じ見た目を再現するという訳ではなく、あくまでもPDFをテキストベースに変換した上で電子書籍などにしやすい形に再度構成し直すというソフトウェアだ。既存のPDFを他のデバイス向けに変換したい時に便利なソフトウェアだ。


MOONGIFTはこう見る

PDFをそのまま使っても良いとは思うが、再利用性や他のシステムとの連携などにおいて自由度があまりに低い。結局の所、PDFは既存の紙書籍をデジタル化したものでしかないのだ。それでは電子書籍ならではの面白さは見えてこないだろう。

いったんテキストに落とし込んでしまえば、様々なフォーマットへの転用も考えられる。PdfMasherの魅力はその途中で編集が入れられることにあると思う。自動変換であればPDF2HTMLを使えば良い。PdfMasherならではの活かし方があるはずだ。

PdfMasher

hsoft / pdfmasher / overview – Bitbucket

 

MOONGIFTの関連記事

コメント

  • DevRel
  • Com2