余計な属性やタグはカット!「WordOff」
※ 画面は公式サイトより
ExcelやWYSIWYGなエディタを使っていて、HTMLをコピー&ペーストすると、元々のHTMLが持っていた情報をそのまま引き継いで貼り付く。これは開発元にとっては優しさのつもりかも知れないが、場合によってはもの凄く不要な機能だったりする。
とは言え、テーブルの貼付けでは表組がそのまま保持されたいというニーズもある。言わば文字装飾のタグやスタイル情報さえ消えてくれれば良いのだ。それを実現するのがWordOffだ。
WordOffはGoogle App Engineを使ったフリーウェアで、ソースコードは公開されているがライセンスは明記されていなかったのでご注意いただきたい。
WordOffの使い方は簡単だ。HTMLのコードをテキストエリアに貼付けて、clean upボタンを押せば良い。すると一気にHTMLソースが奇麗になる。動作内容としては、aタグ以外の属性を全て削除、spanタグやdivタグの削除、空のタグを削除、空白行の削除となっている。
ただしHTML文書全体を行うと<meta>という形でタグが残ったりして却って都合が悪い状態になってしまう。一部の欲しいソース部分だけに限定して使うのが良いだろう。そして生成されたクリーンなソースを貼付ければ、余計な属性の消えたソースを利用できるようになる。
Excelなどであればテキストとして貼付ける機能がある(Mac OSXでも形式を指定せずに貼付けがある)。だがこれでは構造を残したい場合に不便になる。その中間を補完してくれる便利なWebアプリケーションだ。
**WordOff