Googleでは検索した際に「もしかして」と出ることがあります。多少の打ち間違いであったり、文字が繋がっていても良い感じに分割して検索してくれます。しかしバイナリデータの場合はそう簡単ではありません。 今回紹介するgosimimgは画像同士が似ているかどうかを判別してくれるソフトウェアになります。

gosimimgの使い方

gosimimgの実行例です。以下は似ていないと判断された場合です。

$ gosimimg same1.jpg sim1_1.jpg
success to load images
not simmilar !!

似ている場合は以下のように出ます。

gosimimg sim1_1.jpg sim1_2.jpg
simmilar !!

リポジトリ内の testdata ディレクトリにテスト用の写真が入っているので試してみてください(人の顔の写真なのでここでは敢えて載せません)。多少のずれがあっても、似ていると判別してくれます。gosimimgのアルゴリズムによって同じような写真は除外するようなこともできそうです。

gosimimgはGo製のソフトウェア(ソースコードは公開されていますがライセンスは明記されていません)です。

po3rin/gosimimg: Determine if it is a similar image using average hash.