cssgrep – コンソール上でDOMをCSSセレクタ/XPathで検索
HTMLの中から指定したDOMを探し出すにはXPathまたはCSSセレクタを使う方法が考えられます。jQueryなりを使って利用する人が多いと思いますが、今回はWebブラウザを使わずにターミナルで行うケースを考えます。
そのためのツールがcssgrepです。まるでファイルをgrepするようにXPathやCSSセレクタを使ったテキスト抽出ができます。
cssgrepの使い方
サンプルのコードは次のようになっています。
curl http://linuxfr.org/ | ./cssgrep.rb '#friends li:nth-child(even)'
- [Agenda du libre](http://www.agendadulibre.org/)
- [Lolix](http://fr.lolix.org/)
- [Eyrolles](http://www.editions-eyrolles.com/Recherche/?q=linux)
- [Veni, Vedi, Libri](http://www.venividilibri.org/)
- [LinuxGraphic](http://www.linuxgraphic.org/)
- [La Quadrature du Net](http://www.laquadrature.net/)
- [Lea-Linux](http://lea-linux.org)
cssgrep.rbはCSSセレクタを使ったgrepができます。evenなどを使って細かな指定が可能です。xpathgrep.rbはXPathを使ったgrepになります。どちらも好みに応じて使い分ければ良いでしょう。
cssgrepはRuby製、MIT Licenseのオープンソース・ソフトウェアです。