増え続けるスパムブログの現状は ライブドアが検索に新技術、9割排除という記事より
新技術は、10種類ほどのフィルタリングシステムを組み合わせている。詳細は非公開だが、まずはクローラーで収集したブログ記事の中にブラックリストに登録されたブログの記事がないかをチェックし、その後フィルタにかける。スパムブログが見つかれば、検索対象から除外する。
ほほー。
早速テスト。
ツカエル!相性占いを使ってくれてる人のクチコミを見てみましょう。
ツカエル!相性占いのブログ検索結果
まず広告が死ぬほど並びます。
この検索結果がスパムか。(笑)
肝心の検索結果・・・6件。
更新通知という謎の結果も出てますが、大体カットされているようです。
Googleのゴミだらけの検索結果よりはいいですね。(広告が先頭に死ぬほどあること以外は)
NAMAANで検索してみたら・・・1件も見つかりませんでした。orz
Googleが意外とスパムブログ排除技術開発が遅れていると思うのは私だけでしょうか。