Origami - RubyでPDFを便利に操作する
業務システムでよく使うファイルフォーマットがPDFではないかと思います。よく使うだけにPDFをベースにして別な使い方を考えたいのですが、なにぶん再利用性がとても悪いフォーマットでもあります。 そこで使ってみたいのがOrigamiです。OrigamiはRubyで作られたPDFを操作するライブラリです。
Origamiの使い方
Origamiが提供するコマンドの一群です。
- pdf2graph
- pdf2pdfa
- pdf2ruby
- pdfcocoon
- pdfcop
- pdfdecompress
- pdfdecrypt
- pdfencrypt
- pdfexplode
- pdfextract
- pdfmetadata
- pdfsh
- pdfwalker
解析する系のライブラリが多いのですが、その中にpdf2rubyというのがあります。実行するとPDFを生成するRubyコードができあがります。
他にも画像やフォント、テキストなどの解凍ライブラリもあります。
何かPDFファイルがあれば、それをOrigamiを使って解析すれば、プログラムから使いやすくなります。他にも暗号化や復号化、非圧縮などのライブラリがあります。PDFを操作する際には参考になる点が多いかと思います。
OrigamiはRuby製のオープンソース・ソフトウェア(LGPL)です。
cogent/origami-pdf: Origami is a Ruby framework designed to parse, analyze, and forge PDF documents.