scRUBYt!
スクリーンスクラッピング2.0
進化したスクリーンスクラッピング。手軽な操作でHTMLをXML化します。
スクリーンスクラッピング2.0
今でこそ色々なWeb APIが登場し、システム間のデータのやり取りが出来るようになっている。少し前ならスクリーンスクラッピングによるデータの抜き出しが当たり前であった事を考えるとずいぶん変わった感じがする。
だが、まだまだWeb APIを公開していない情報は数多い。そこでスクリーンスクラッピングが進化した。
今回紹介するオープンソース・ソフトウェアはscRUBYt!、Ruby製のスクリーンスクラッピングソフトウェアだ。
scRUBYt!はブラウザの動作を模倣したり、データを抜き出したりと言う操作が簡単にできるライブラリだ。データをXMLで出力するので、システム間をつなぐパイプとして利用できる。
インストールはgemから簡単にインストールできる。デモも色々なものが用意されているので触ってみてほしい。
日本ではこうしたライブラリとしてPlaggerが有名だ。scRUBYt!はさらにその下、HTMLからXMLへ変換する部分を担うソフトウェアだ。
scRUBYt! レビューはこちら