なぜ、知覚的Hashでハッシュを作成するのか?

http://www.hackerfactor.com/blog/index.php?/archives/432-Looks-Like-It.html&comment-submitted#feedback にある例を調べていて、処理後の画像のビットからハッシュを作ろうとして行き詰まりました。画像のピクセルから作成した2値文字列をハッシュ化し、ハミング距離を見て写真の違いを分析する場合、ハミング距離を行ってハッシュを作成するのと、生の2値文字列に対してハミング距離を行うのとでは、どんな良いことがあるのでしょうか?ハッシュは単にスピードアップのために作られるのでしょうか?

私はハッシュについてよく知りません。この場合、ほぼ同じ写真に対するフィルタリングメカニズムとして機能するのでしょうか?しかし、このフィルタリングは、写真を縮小してグレースケールに変換することによって達成されるのではないでしょうか?

ソリューション

このブログで紹介されているアイデアは、類似した画像を認識する方法です。そして目標は、正しい種類の情報を失い、残されたものが重要で比較しやすくなるようにすることです。つまり、どれだけ速く、どれだけ正確に比較できるかという2つの側面があります。もしあなたが写真を8x8の白黒画像(つまり64ビットの情報)に縮小したら、それを「生のバイト列」と呼ぼうが「長いハッシュ」と呼ぼうが関係ありません(まあ、@Blenderが指摘したように、それは従来の用語の使い方では本当のハッシュではありませんね)。重要なのは、それをどのように縮小し、どのような情報を残し、何を失うかです。

解説 (0)