PageRank for Product Image Search
PageRank for Product Image Searchを読んだ。
Googleのエンジニアが発表した、画像検索改善アルゴリズムについての短い論文。
以下まとめ。
- 現在の画像検索は、紐付けられたテキスト情報のみを見ており、画像そのものは見ていない。
- 画像自体を解析することで、関連のある画像だけを表示できるようにする。
- 画像の細部をそれぞれ解析して、画像間の類似性を探す
- 類似した部分があれば、"visual hyper link"とみなし、ネットワーク化する。
- この類似パーツのネットワーク構造からページランクを計算する。
- 一番類似情報が多い画像が、一番ふさわしい画像となる。
- 同じような画像だけ集めればよいわけではない。
- なぜなら、ユーザが満足する結果には、関連性と多様性の両方が必要だから。
- 各クラスターで高ランクのものを表示することで双方満たせる。
暗黙的に集合知も利用するとか書いてあるのだけど、アルゴリズムの中のどこが該当するのが不明だった。まだ読み落としがあるかもしれない。
コメント