Archive for January, 2007

サーチ・ウイキア

Friday, January 5th, 2007


グーグルへの風当たりが次第に強まりつつある。検索サービス市場で、ヤフーが低迷し、マイクロソフトが伸び悩むなか、グーグル一社が独走している。インターネット上で、検索という必須機能がグーグルにコントロールされ、世界中の情報がグーグルにより整理されつつある。1990年代にマイクロソフトがウインドウズでOS市場を席巻したように、2000年代はグーグルがインターネット検索市場を独占しつつある。

g074a_wikia.jpg


「マイクロソフト化」しつつあるグーグル

(写真:Adrian Libotean)

 

ウイキ方式の検索エンジン

グーグルが躍進を遂げるなか、先週、「サーチ・ウイキア (Search Wikia)」が登場した。サーチ・ウイキアとは、オープンソースの検索エンジンを使い、コミュニティーが運営する検索サービスである。サーチ・ウイキアの創設者は、インターネット百科事典であるウイキペディア (Wikipedia) を創設したジミー・ウェールズ (Jimmy Wales) である。ウイキペディアは、コミュニティーにより編纂された百科事典で、ウイキ方式の最初の成功事例である。ティム・オライリー (Tim O’Reilly) はこれを「参加型アーキテクチャー (Architecture of Participation)」と呼んでいる。

 

ウイキペディアの母体は非営利団体で、組織の運営をボランティアーと企業からの献金に頼っている。ウェールズは、ウイキア (Wikia) という企業を創設して、ウイキ方式での事業を目指している。その第一弾が、「オープンサービング (Open Serving)」という、ウイキ・ホスティング事業であり、その第二弾としてサーチ・ウイキアを立ち上げた。オープンソースが非営利団体から、ソフトウェア事業に成長しているように、ウイキ方式も集合知を事業に活用する方法を試行している。

 

サーチ・ウイキアとは

ウイキアは会社発足当時から、ウイキ方式の検索サービスを模索していた。その当時、この検索サービスは「ウイキアザリ (Wikiasari)」という名前で呼ばれていたが、このプロジェクトは進展しなかった。先月、このプロジェクトが蘇り、サーチ・ウイキアという名前で再スタートを切った。検索エンジンにはオープンソースである「ルシーン (Lucene)」と「ナッチ (Nutch)」を採用している。両者ともアパッチ・ソフトウェア財団 (Apache Software Foundation) 配下のプロジェクトで、業界で一番人気の検索エンジンである。

 

ルシーンはジャバ・ベースの検索エンジンで、データのインデックシングや検索アルゴリズムを提供する。一方、インターネット上でデータを収集するクローラー (Crawler) などの機能は持っていない。ナッチはルシーンに、クローラーやリンク解析機能などを付加したもので、ウェブベースの統合検索システムである。ルシーンは多くのオープンソースで採用されており、グループウェアである「ジンブラ (Zimbra)」やコンテント管理システムである「アルフレスコ (Alfresco)」などに組み込まれている。

 

コミュニティーによる運営

オープンソースの検索エンジンは、既に多くの製品やサイトで使われており、実績を挙げている。サーチ・ウイキアは、これらオープンソースを活用し、検索サービスをウイキ方式で行う試みである。検索基本機能である、クローリングやインデックシング、更に、基本的な検索結果のランキングについてはオープンソースで行うが、検索結果の表示順序などをコミュニティーにより最適化しようとするものである。更に、これら順位決定プロセスを公開し、利用者が納得する方式で検索サービスを行うことを目指している。

 

サーチ・ウイキアの目標は、検索エンジン本来の機能を取り戻すことにある。グーグルの検索に代表されるように、「検索スパム」が大きな社会問題となっている。サーチエンジン・マーケティングなどで、多くの企業がグーグル検索結果で上位に掲載されるべくサイトに仕掛けを施している。さらに、グーグル自身が検索結果を恣意的に操作し、検索結果表示の順位を決め、また、意図的に検索結果を削除する。しかも、この検索結果表示順序をきめるメカニズムが非公開で、利用者はグーグルという「憲法」を順守するしかなかった。

 

オープンデータへ

ティム・オライリーは、「データインサイド」という造語でこの現象を定義している。「インテルインサイド」と同じように、インターネットでは、利用者に提供するデータが鍵を握るとしている。インターネット事業ではデータが商品であり、グーグルも例外ではなく、検索結果や検索クエリーなどのデータが利益を生み出している。このため、グーグルはこれらデータを私有資産として保護している。例えば、利用者が自身の検索クエリーをグーグルからダウンロードして、ヤフーの検索エンジンで使う方式を許していない。つまりグーグルの事業は「クローズドデータ」方式である。これに対して、サーチ・ウイキアでは、全てのデータを公開し、利用者がそれらをダウンロードし、再利用し、変更することを許している。「オープンデータ」方式である。グーグル一社に「ロックイン」される代わりに、サーチ・ウイキアは利用者が自由にデータを利用できるオープンな事業を目指している。

 

トレンド

2000年代は、かつてのマイクロソフトのように、グーグルが検索サービス市場を独占している。グーグルが、自ら定めたルールで世界中の情報を整理統合していくことに対して、多くの人や国が懸念を抱いている。マイクロソフトの寡占に対して、リナックスやファイアーフォックスが登場し、オープンソースが選択肢となり、健全な競争が生まれてきた。いま、グーグルの独占市場でサーチ・ウイキアというオープンデータ方式の検索サービスが登場した。サーチ・ウイキアは、インターネット検索という必須機能がグーグルに支配されていることへの、市民の挑戦である。企業による市場の独占は弊害を生み、これに対して必ず挑戦者が現れるのが、アメリカ市場の健全さと逞しさである。サーチ・ウイキアがオープンソースのような大きなうねりとなるのかは知る由もないが、インターネットの次の波が見えてきた。