GetHTMLW
丸ごと保存
動的サイトの隆盛で、サイトの構成が掴みづらくなっている。一度手元に戻してみよう。
丸ごと保存
一昔前と異なり、サイトが動的生成されるサイトが増えてきた。それに伴って、実際のページ数がいまいち分かりづらくなっている。サイトの構成が掴みづらいと、どこかでリンク切れが発生していても、エラーログに出ないと分からないなんて事にも繋がる。
まず、サイト全体の構成を掴もう。そうすれば使われていないファイルも浮かびあがる。必要でないファイルを無くせば、すっきりし管理コストも低減できる。
今回紹介するフリーウェアはGetHTMLW、サイト全体をダウンロードしてオフラインで見られるようにしてくれるソフトウェアだ。
これを使うと消せるファイルが確定できるのが良い。
GetHTMLWはオフラインビューワーとしての利用法が基本だ。インターネットが高速化したとは言え、リファレンス系のサイトはダウンロードしておくと非常に便利だ。
プロキシとして利用する事で、普通にブラウジングしながらデータの収集もできる。JavaScriptなどは対応していないが、CGIはある程度対応しているようだ。
1つのサイトに対してのアクセスは1つに固定、robots.txtの解釈など、サーバ側への負担はできるだけ抑えられる。まとめ読み、サイトチェック等様々な利用法が考えられるソフトウェアだ。
GetHTMLW レビューはこちら