ファイルをコピーして改変したり、一度ダウンロードしたファイルがどこかにいってしまい、再度ダウンロードしたりとHDDの中には重複したファイルが大量に存在する。HDDの容量が足らない、と思ったら実は重複ファイルの問題かもしれない。

ピクチャ 3.png

ファイルの重複チェック

 

様々な場所に散在している重複ファイルを見つけ出すのは容易ではない。そうした時に使いたいのがLitenだ。

今回紹介するオープンソース・ソフトウェアはLiten、重複ファイル検索ソフトウェアだ。

Litenはコマンドラインで使うツールだ。Pythonで作られている。使い方は簡単で、引数にディレクトリパスを渡すだけで良い。そうすれば指定したディレクトリ以下を検索し、重複したファイルが存在しないか精査してくれる。最後に重複ファイルのリストを記載したレポートやどれくらいのHDD容量を削減できるかも表示してくれる。

ピクチャ 5.png

オプション

 

チェックはMD5のハッシュ値によって行っている。オプションとして、ファイル名のパターンを指定することや、ファイルサイズの下限を指定できる。例えば1MB以上のファイルのみをチェックすると言った具合だ。

そして削除を許可するフラグもある。これを使えば重複したファイルを削除(もちろん片方のみ)してくれる。利用の際には注意が必要だが、ファイルの自動整理に役立つ機能だ。

コマンドラインからの利用の他に、Pythonからの利用もできる。内容が一致していないか、プログラムからチェックしたい場合にも使えるだろう。

 

liten - Google Code

 http://code.google.com/p/liten/