業務システムでよく使うファイルフォーマットがPDFではないかと思います。よく使うだけにPDFをベースにして別な使い方を考えたいのですが、なにぶん再利用性がとても悪いフォーマットでもあります。 そこで使ってみたいのがOrigamiです。OrigamiはRubyで作られたPDFを操作するライブラリです。

Origamiの使い方

Origamiが提供するコマンドの一群です。

  • pdf2graph
  • pdf2pdfa
  • pdf2ruby
  • pdfcocoon
  • pdfcop
  • pdfdecompress
  • pdfdecrypt
  • pdfencrypt
  • pdfexplode
  • pdfextract
  • pdfmetadata
  • pdfsh
  • pdfwalker

解析する系のライブラリが多いのですが、その中にpdf2rubyというのがあります。実行するとPDFを生成するRubyコードができあがります。

他にも画像やフォント、テキストなどの解凍ライブラリもあります。

何かPDFファイルがあれば、それをOrigamiを使って解析すれば、プログラムから使いやすくなります。他にも暗号化や復号化、非圧縮などのライブラリがあります。PDFを操作する際には参考になる点が多いかと思います。

OrigamiはRuby製のオープンソース・ソフトウェア(LGPL)です。

cogent/origami-pdf: Origami is a Ruby framework designed to parse, analyze, and forge PDF documents.