Webページを表形式に変換してエクスポートする「Scraper」
[s2If current_user_can(access_s2member_level1)]
Scraperは表形式のWebデータをGoogleスプレッドシートへ取り込む。
[/s2If]
ScraperはGoogle Chrome用のオープンソース・ソフトウェア。業務の中でよく使われる操作でテーブル出力したデータを表計算ソフトウェアに貼付けて加工するということがある。この操作を行う場合、IEとExcelが最も親和性が高いようだ。
だがそのためだけにIEを起動するのは嫌だし、HTMLのチェックボックスなどもついてきてしまうのが問題だった。そこで使ってみたいのがGoogle Chrome + Scraper + Googleスプレッドシートという組み合わせだ。
Scraperをインストールした後、表形式で出ているHTMLデータを一行程度を選択して右クリックする。そうするとScrape similarというメニューが表示されるのでそれを選ぶ。そうするとScraperがXPathを使ってHTMLを解析し、似たようなデータを含めてテーブルを一覧表に変換する。
取り込まれたデータ
Scraper上ではカラムを並べ替えたり、消したりすることもできる。ソートすることも可能で、行を選ぶと元のHTML上でどのデータなのかハイライトして表示する。さらにデータはクリック一つでGoogleスプレッドシートへ出力することが可能だ。
データはXPathの他、jQueryを使って解析することもできる。Scraperのみならず自分でXPathを定義して一覧に加えることもできる。業務でとても役立つことだろう。
MOONGIFTはこう見る
Scraperは業務で多いに役立つに違いない。現状ではただ並んでいるだけではなく、テーブルなどで表形式になっていないと解析が困難なようだ。楽天や価格コムなどのデータであれば問題なく解析ができる。並べ替えや不要なデータをあらかじめ落とせるのが便利だ。
さらに設定をプリセットとして保存しておくこともできる。業務システムや競合調査などで幅広く活躍することだろう。
via Scraper for Chrome lets you easily create spreadsheets from Web data [Download Squad]
Scraper - Google Chrome extension gallery
https://chrome.google.com/extensions/detail/mbigbapnjcgaffohmbkdlecaccepngjd?hl=en-US
mnmldave’s scraper at master - GitHub