PDF::ReaderはRuby製のオープンソース・ソフトウェア。PDFというドキュメントフォーマットはビジネスの場において数多く使われている。WebサービスもPDFによる帳票出力やエクスポートをサポートしているものが多い。 0

画像の抜き出し処理
0
閲覧や印刷する分には申し分ないフォーマットなのだが、システムに取り込んで加工しようと思うととたんに面倒なフォーマットになる。そのためのライブラリ(PDFtoHTMLなど)もあるが、もっとシステムから扱いやすくしてくれそうなのがPDF::Readerだ。 0
PDF::ReaderはRubygemsを使ってインストールするライブラリだ。機能は数多くあるが、例えばメタデータを抜き出したり、テキスト情報を取り出す、画像だけを取り出す、ページを数えるといったPDF操作を行えるライブラリになっている。 0

メタ情報
0
コマンドでPDFファイルを変換し、それを解析する方法でも良いが、PDF::Readerを使えばより細かく制御できるようになるはずだ。PDF内の数値を取り出したり、別フォーマットに変換すると言った時に使えるだろう。ビジネスの場において特に使えそうだ。 0
プレミアムユーザには“MOONGIFTはこう見る”、記事の一行概要、追加スクリーンショット、デモや追加URLが表示されます。登録(500円/月)はこちらから! プレミアムユーザのログインはこちらから 0












アンケート