Google vs. goo

gooは,バックエンドにGoogleを使っているはずだが,どうも検索結果が怪しい.私はSafariの検索窓(=Google)を多用するのでgooは使っていない(←ということにしておこう(笑))ので,周囲に聞いてみると同様な評判だ.

たとえば,古田の公式ブログを探すために「古田 ブログ」というクエリでGoogleとgooを検索すると,Googleでは1位だが,gooでは8位なのだ.もしかして,gooにはランキングに悪影響を及ぼすようなバグがあるのだろうか?

追記:たぶんgooはGoogleを使ってはいるが,独自の処理をプリプロセスかポストプロセスで実装していると思われる.しかし,Google APIを見る限りでは検索結果のスコアを取得できないので,商用版でも同じだとすれば,ランキングの変化に関係しているのはプリプロセスしかありえない.

そこで,一つの仮定としては,gooの宣伝文句からして一種のクエリ拡張をおこなっていると推測されるが,これがランキングに悪影響を及ぼしているのではないか?ということ.

たとえば,Googleで,「古田 ブログ」で検索したら公式サイトが一位になるが,論理式で言えば「古田 AND (ブログ OR blog)」のように指定すると10位になる.この理由は,画一的にクエリ拡張をおこなうことで,Googleの"I'm Feeling Lucky"に代表されるような「クエリに対して,一番それらしい結果を推薦する」というメリットが希薄になってしまうからだ.つまり,「ブログ」と指定されたら「blog」よりも「ブログ」を優先して扱う方が適切そうだが,まったく同じに扱ったのでは,ユーザの意図が希薄になってしまうことがあるのだ.これは,同時にスパム耐性を低下させる危険性がある.

Googleのように,アンカーテキストも検索対象にする場合には,「ブログ」や「blog」というアンカーテキストでリンクしているサイトが存在するために,どちらでも検索できる.かつ,オフィシャルサイトの正式な表記の方が確率的に高くなるために,同等な意味を持つ語でも,処理の優先度に差が出てくるので,より適切に処理されるので,本来はクエリ拡張は不要なのだ.