[s2If current_user_can(access_s2member_level1)]

Scraperは表形式のWebデータをGoogleスプレッドシートへ取り込む。

[/s2If]

ScraperはGoogle Chrome用のオープンソース・ソフトウェア。業務の中でよく使われる操作でテーブル出力したデータを表計算ソフトウェアに貼付けて加工するということがある。この操作を行う場合、IEとExcelが最も親和性が高いようだ。

Screenshot-2010-11-2514.50.54.png

だがそのためだけにIEを起動するのは嫌だし、HTMLのチェックボックスなどもついてきてしまうのが問題だった。そこで使ってみたいのがGoogle Chrome + Scraper + Googleスプレッドシートという組み合わせだ。

Scraperをインストールした後、表形式で出ているHTMLデータを一行程度を選択して右クリックする。そうするとScrape similarというメニューが表示されるのでそれを選ぶ。そうするとScraperがXPathを使ってHTMLを解析し、似たようなデータを含めてテーブルを一覧表に変換する。

screenshot-2010-11-2518.26.41.png

取り込まれたデータ

 

Scraper上ではカラムを並べ替えたり、消したりすることもできる。ソートすることも可能で、行を選ぶと元のHTML上でどのデータなのかハイライトして表示する。さらにデータはクリック一つでGoogleスプレッドシートへ出力することが可能だ。

データはXPathの他、jQueryを使って解析することもできる。Scraperのみならず自分でXPathを定義して一覧に加えることもできる。業務でとても役立つことだろう。

 

MOONGIFTはこう見る

Scraperは業務で多いに役立つに違いない。現状ではただ並んでいるだけではなく、テーブルなどで表形式になっていないと解析が困難なようだ。楽天や価格コムなどのデータであれば問題なく解析ができる。並べ替えや不要なデータをあらかじめ落とせるのが便利だ。

さらに設定をプリセットとして保存しておくこともできる。業務システムや競合調査などで幅広く活躍することだろう。

 

via Scraper for Chrome lets you easily create spreadsheets from Web data [Download Squad]

Scraper - Google Chrome extension gallery

 https://chrome.google.com/extensions/detail/mbigbapnjcgaffohmbkdlecaccepngjd?hl=en-US

mnmldave’s scraper at master - GitHub

 https://github.com/mnmldave/scraper