« ロングテール | メイン | Amazon EC2 をつかってみた »

2008年5 月 3日 (土)

PageRank for Product Image Search

PageRank for Product Image Searchを読んだ。
Googleのエンジニアが発表した、画像検索改善アルゴリズムについての短い論文。
以下まとめ。

  • 現在の画像検索は、紐付けられたテキスト情報のみを見ており、画像そのものは見ていない。
  • 画像自体を解析することで、関連のある画像だけを表示できるようにする。
  • 画像の細部をそれぞれ解析して、画像間の類似性を探す
  • 類似した部分があれば、"visual hyper link"とみなし、ネットワーク化する。
  • この類似パーツのネットワーク構造からページランクを計算する。
  • 一番類似情報が多い画像が、一番ふさわしい画像となる。
  • 同じような画像だけ集めればよいわけではない。
  • なぜなら、ユーザが満足する結果には、関連性と多様性の両方が必要だから。
  • 各クラスターで高ランクのものを表示することで双方満たせる。

暗黙的に集合知も利用するとか書いてあるのだけど、アルゴリズムの中のどこが該当するのが不明だった。まだ読み落としがあるかもしれない。

参考: Google、次世代画像検索を実験中—画像にページランク導入へ

トラックバック

この記事のトラックバックURL:
http://www.typepad.com/services/trackback/6a01287585694c970c012875856969970c

PageRank for Product Image Searchを参照しているブログ:

コメント

この記事へのコメントは終了しました。