進化する検索 キーワードや属性ドリルダウンの次

検索!っていうとだいたいみなさん白い箱に単語を入れてボタンをクリックするのを想像するんじゃないでしょうか。もうちょっと詳しい人だとカテゴリで絞り込んだりするのも検索だと捉えているでしょう。

なんか最近、その検索が変わりつつあるんじゃないかと思っています。一言で言うのは難しいですが、単語とかカテゴリとかって、静的な情報ですよね。静的な情報、いうなれば名詞とか形容詞とかでアイテムを探すというのがこれまでの検索。でそれが動的な情報でアイテムを探す検索になりつつあるんじゃないかと。

何を言ってるのかって?
Crowsnestという面白いサービスがあります。オサレの街恵比寿の夜にもつ鍋を食えば奇麗なお姉さんが寄って集まるというスーパーエンジニアの@kaisehさんが作っているサービスです。

Crowsnest [ソーシャル・ニュースリーダー]

Twitterアカウントがあればすぐに始められるのでぜひ試してみて欲しいのですが、自分が面白いと思うニュースやWebページがどんどん出てくるサービスで、一部では「これがあればもう既存のポータルサイトRSSリーダがいらない」と言われているほどのデキです。基本的には自分がフォローしている人が言及したWebページを集めて来て並べてくれるわけです。これまでと何が違うのかというと、Webページを探すのはGoogleにキーワードを入れていたのが、自分がフォローしている人が言及したWebページで探すというように変わって来ているのです。このあいだアップされた@kaisehさんのスライドにもこの辺のことが詳しく書いてあります。

第3回Twitter研究会の発表資料 - kaisehのブログ

要するに、「○○のことが書いてあるWebページ」という探し方だったのが、「自分が興味を持ちそうなWebページ」という探し方ができるようになったということなのです。「自分が興味を持ちそうな」というのがキモで、これってふわふわとしていて「何で探す」の「何で」の部分が明確に指示できないですよね。Crowsnestはこれを「Twitterでフォローしている人が言及した」ことをキーにしているわけですが、そういうふわふわしたキーで検索するのが苦手なのがコンピュータというものです。ちょっと固い言い方をすると「多次元」ということかもしれません。

こんな話があります。


サンタクルスの警察では、減員する警察官と増加する呼び出し電話に対応するため、過去の犯罪データから犯罪が起きそうなエリアを予測し、そこに警察官を重点的に送るようにしている。数学者などを集めてこの予測モデルを構築した。

アメリカの某金融機関では、現金の運び屋に対応するため、トランザクションデータから、支店の地理情報や口座名義などを使ってこれを早期に発見するシステムを構築する予定。実際に昨年この金融機関は100億円近い金額を同様の手口で損失している。

警察は「犯罪が発生しそうなエリア」を探したいと思っているし、銀行は「不正な取引」を探したいと思っています。しかしどちらも単語やカテゴリで探せる代物ではありません。「こんなパターンをしたデータ」だったり、「この情報がおんなじで何となく似ている二つのデータ」だったり、何ともふわふわしています。

前職で検索システムをいじっていたときも、後年はただの検索よりそういった「似た者検索」のようなものの興隆を感じていました。別々のデータベースを一つにしたときには、本来同一なんだけどデータ上なき分かれてしまったデータというのが存在します。これを本来の、一つのデータにまとめる作業を「名寄せ」と呼んでいました。社保庁の例のアレですね。「名寄せ」というととても泥臭いイメージがありますが、よく考えるとこれも同じ問題で、英語では「クラスタリング」というかっこいい名前になることに最近気がつきました。

もう何が言いたいかお分かりですね。情報を探すというミッションはGoogleがやっつけてしまったように思われました。しかしそれは単語によってのみでした。これからはもっとふわふわした動的な情報による検索が始まるのだと思います。それをうまくビジネスにしたら、Googleどころの騒ぎではなくなるような気がしています。

というわけで次世代の検索について考えてみました。「それデータマイニングっていうんじゃないの」という暖かいコメントはぜひTwitterにて@umitanukiへどうぞ。