Archive for July, 2008

グーグル対抗検索エンジンだが

Tuesday, July 29th, 2008


昨日、Cuil (クール) という新しい検索エンジンが幕を開けた。会議中、知人から、Cuilの発表をブラックベリーで見せてもらいこのニュースを知った。家に帰ると、ちょうど夕方のテレビ・ニュースで、Cuil創設者の一人であるAnna Patterson (アナ・パターソン) のインタービューを放送していた。今日のニューヨーク・タイムズは、「Former Employees of Google Prepare Rival Search Engine[1] (元グーグル社員が対抗検索エンジンを開発という見出しで記事を掲載している。Cuilはマスメディアに大きく取上げられ、昨日その姿が明らかになった。

 

Cuilというベンチャー企業

Cuilは、サイトを公開する直前までは、Cuillと綴っていた。Cuilによると、これはゲール語 (Gaelic) で「知識」を意味する言葉であるが、最後のLを取り除いて、利用者に分かりやすい名前にしたとのこと。Cuil創設メンバー[2]は、Anna PattersonRussell Power (ラッセル・パワー) はグーグル出身で、TeraGoogle (テラ・グーグル、大規模な検索インデックス) の開発に携わっていた。Tom Costello (トム・カステロ) IBM出身で、IBMの検索エンジンであるWebFountain (ウェブ・ファウンテン) の開発に従事していた。また、プロダクト担当副社長であるLouis Monier (ルイス・モニアー) は、一世を風靡した検索エンジンであるAltaVista (アルタビスタ) の創設者である。Cuilは検索エンジンの頭脳が集結してできたベンチャー企業で、各方面から注目されていた。

 

Cuilを使ってみて

昨日、Cuil[3]は、ベータ版を飛び越して、一気にプロダクション版として公開された。

g064a_cuil.jpg

初期画面は、黒を背景に、シルバーと青色でお洒落なデザインである。キーワードを「indiana jones」と入力すると、上のスクリーンショット (出展は全てCuil) の通り、Cuilが検索キーワードをサゼッションしてくれる。

 g064b_cuil.jpg

キーワードを入力すると、Cuilは、上のスクリーンショットの通り、検索結果を返す。グーグルの検索結果表示形式とは異なり、Cuilは画面をパラグラフで区切り、そこに文字と写真を埋め込んで、検索結果を表示する。このデザインは魅力的で、雑誌で記事を読んでいる感覚で、とても親しみやすい。

 

検索結果の表示順序であるが、左上が一番重要な記事であると思われるが、二番目はその下なのか、その右なのかが判明できない。記事を読んでみると、ページ・ランキングは、左上から下に進み、それから一つ右のカラムに進む方向で下がっていくと思われる。ただし、次のページを見ると同じ内容の記事がダブって掲載されており、検索結果表示では、まだバグがある。

 

g064c_cuil.jpg

このスクリーンショットは検索結果画面の右上のボックスを拡大したものである。ここに「indiana jones」というキーワードの分類が示される。因みに「Indiana Jones Characters」という項目にカーソルを当てると、上の通り、映画の登場人物のサジェッションが登場する。Cuilのサジェッションから目的の言葉に辿り着くこともできる。

 

Cuilの問題点と特徴

Cuilの第一印象はとても良かったのだが、実際に色々なキーワードを入れて使っていくと、検索結果の精度がバラバラであることが分かってきた。「who is the father of indiana jones」と入力すると、次のスクリーンショットの通り、「Batman Universe」というような意味不明の回答が返ってきた。「cheap flight from san jose to los angeles」では、「We didn’t find any results」と検索不能との回答で、まだまだ日常の検索で使うまでにはこなれていないとの印象である。

g064d_cuil.jpg

 

Cuilのプレス・リリース[4]によると、Cuilの特徴は検索インデックスが1200億ページと、グーグルの三倍の規模であるとしている。一見よさそうに見えるが、「indiana jones」で探しているページがグーグルには含まれてなくて、Cuilだけが拾っているケースがどれだけあるのか。また、Cuilは検索結果がカテゴリーにより異なるとしている。つまり、Cuilは、映画とかゲームなどのカテゴリーごとに検索結果の重み付けを変えていることを示している。これはとても興味深いランキング技法であるが、グーグルでも既に採用しているという噂あり。

 

トレンド

ついに姿を現したCuilであるが、その検索結果は素晴らしいとはいいがたい。一方、巨人グーグルに立ち向かうCuilを心情的に応援している人は少なくない。Cuilが機能を改良して、どこまでグーグルに近づき、追い越すことができるのか。Cuilのこれからの成長に期待が寄せられている。




[1] http://www.nytimes.com/2008/07/28/technology/28cool.html?ref=business

[2] Cuil Management, http://www.cuil.com/info/management/

[3] cuil, http://www.cuil.com/

[4] http://www.cuil.com/info/news_press/

オープンソース・コンベンション (OSCON 2008より)

Friday, July 25th, 2008


今週はオレゴン州ポートランドで開催されたオープンソースのカンファレンスである「Open Source Convention」に出席した。このカンファレンスはOSCON (オスコン) という略称で親しまれ、今年がちょうど10周年の節目の年となる。

 

g033_oscon_a.jpg

OSCONの会場は空に向かって伸びるツインタワーが特徴であるOregon Convention Centerで開催された (出展:Oregon Convention Center)

 

Tim O’Reillyの基調講演

OSCONで一番印象的だったのが、カンファレンス主催者であるTime O’Reilly (ティム・オライリー) による「Open Source on the O’Reilly Radar (オライリー・レーダーで捉えたオープンソース) という講演であった。オライリーは、OSCON10周年を迎えるにあたり、オープンソースが社会に貢献した事例を紹介した。同時に、Kim Stanley Robinson (キム・スタンリー・ロビンソン、米国のサイエンス・フィクション作家) から、「History is a  wave that move through time more quickly than we do (歴史は時代の波を我々より速く駆け抜ける) と引用して、過去の功績に囚われないで、オープンソースは次の世代に向かって動くときだとして、「Three Big Challenges and Opportunities(三つの挑戦とチャンス) を提唱した。それらは、Cloud Computing (クラウド・コンピューティング)Open Programmable Web (オープン・プログラマブル・ウェブ)Open Mobile (オープン・モバイル) である。オープンソースはこれら三つのテーマに向かって進むべきだと論旨を展開した。

 

クラウド・コンピューティング

クラウド・コンピューティングとは、Amazon Web ServicesGoogle App Engineに代表される、新しい形態の処理方式である。クラウド・コンピューティングがこれからのサービス基盤となるだけでなく、そのリスクについても言及した。我々はGoogle Docs (グーグルのオンライン・ドキュメント) Twitter (マイクロ・ブログ) に依存しないで生活することができなくなってきた。世界は、再び、集中型システム構成に向かい始めている。オライリーは、Web 2.0の特徴の一つとして、ピア・トゥ・ピアの分散型システムを挙げている。しかし、オライリーは、再び集中型システムに振れ始めたことを率直に認め、この領域がオープンソースにとっての挑戦の場であり、チャンスでもあると述べた。

 

更に、クラウド・コンピューティングを含むウェブ・サービスが固有仕様となりつつあることに警告を発した。オープンソースと同様に、ウェブの世界でもオープン・ウェブ・プラットフォームが必要で、革新的なサービスが生まれるためには、オープンなウェブが必須であると述べた。一方、その兆しが見え始めており、Hadoop (ハドゥープ、グーグルが開発した並列処理ソフトウェア) など、クラウド・コンピューティングを構築するオープンソースが登場していることを紹介した。

g033_oscon_b.jpg

基調講演をするTim O’Reilly。写真では写りがいいが、アイロンのあたっていないジャケットと、しわくちゃのズボンがトレードマーク。 (出展:OSCON)

 

オープン・プログラマブル・ウェブ

次にオライリーは、オープン・プログラマブル・ウェブについて説明した。クラウド・コンピューティングもプログラマブル・ウェブも、どちらもインターネット上でサービスを提供する仕組みであるが、プログラマブル・ウェブはデータを扱うところに特徴があるとしている。オライリーは、Web 2.0の特徴の一つとして、「Data is the Intel Inside」という表現をしてるが、プログラマブル・ウェブがこれにあたる。データがサービスの中核を構成し、誰かがこれらのデータを占有すると大きな問題が生じる。

 

その事例としてオライリーはApple iTunesという閉じた基盤を挙げた。一方で、オープン・プログラマブル・ウェブが登場している事例も紹介した。ヤフーはBOSS (Build your Own Search Service) というオープン・サービス・プラットフォームを提供している。BOSSを利用してヤフーの検索インデックスにアクセスし、独自のアプリケーションを構築することが可能となる。オープンソースがソフトウェアの進化をもたらしたように、ウェブが進化するためには、ウェブがオープンである必要があると唱えている。

 

オープン・モバイル

オープンソースの主戦場はコンピューターから携帯端末に移りつつある。この場においてもAppleiPhoneという閉じた世界でアプリケーションを提供している。オライリーはこの事象を「The browser war is back (再びブラウザー戦争) と表現している。Apple iPhone というクローズド・モバイルに対して、Openmoko (オープンモコ) やグーグルのAndroid (アンドロイド) がオープン・モバイルとして対抗馬になっている。グーグルはAndroidを開発する際に、コミュニティの英知を活用するために、敢えてオープンソースの手法を採用している。

 

トレンド

オープンソースはソフトウェアだけでなく、ウェブや携帯端末を含む幅広い分野をカバーする言葉となってきた。また会場で若いエンジニアから話を聞くと、OSCONはオープンソースという共通項はあるものの、次世代テクノロジーを生み出すためのインキュベーターとしての役割を担っていることを感じた。また、グーグルやフェイスブックがブースを出展しオープンソースを紹介し、インテルが次世代携帯端末の説明を行なった。オープンソースが再び大きく動こうとしている予兆を感じた。

遺伝子とソーシャル・ネットワーク

Wednesday, July 2nd, 2008


NBCの朝の番組である「Today (トゥデイ) で個人の遺伝子を解析するサービスが紹介された。この個人向け遺伝子解析サービスを始めた企業は「23andMe(トゥエンティ・スリー・アンド・ミー)という名前で、レポーターのPeter Alexander (ピーター・アレキサンダー)が、自らの遺伝子の解析結果を番組の中で公表した。自分はどこから来たのか。自分はどんな病気に罹りやすいのか。23andMeは、誰もが関心を持っている情報を提供してくれるとともに、病気の予測を行なうという、すこし怖い情報も提供してくれる。この番組はMSNBCのサイトで見ることができる。

 

23andMeとは

番組の中でAlexanderは、遺伝子解析の手順を説明した。まず、遺伝子解析ツールキットを、23andMeから999ドルで購入する。ツールキットの中のプラスチック容器に、被験者の唾液を入れ、密封して23andMeに返送する。そして23andMeが遺伝子解析結果を送付するという手順となる。

 

Alexanderの遺伝子解析結果では、身体の特徴として、目の色が青色で、舌が苦味を感じ、耳垢が非乾燥質であることが示された。遺伝子解析をするまでもなく、自分で分かることであるが、このような特性が遺伝子で示されている。次に一番興味を持つ事項である、自分の祖先はどこから来たのかについての解析結果が示された。それぞれ母系と父系について示された。アメリカ人であるAlexanderの母親はヨーロッパを中心とした地域であることが分かった。

g032_23andme_a.jpg

一方、父親の系統は、上のグラフィックス(出展:MSNBC) の通り、サウジアラビアかアルジェリアのベドウィンであることが判明した。23andMeは、祖先の出身地を地図上で色分けして表示する。

 

最後に最大の関心事である病気予測について紹介された。Alexander自身のケースでは、タイプ2の糖尿病 (Type-2 Diabetes) になる可能性が高いことが示された。これは糖尿病になる遺伝子マーカー9個のうち、7個のマーカーが検出されたという解析結果である。将来高い確率で糖尿病を発症するというショッキングな結果である。個人がこの情報を基にどうアクションを取るべきかなど、多くの課題を抱えているが、23andMeは非常に興味深いサービスを提供している。

 

遺伝子解析の手法

この番組のインパクトが余りにも大きかったので、番組の後でウェブサイトを見てみた。個人の遺伝子解析サービスを行なっている企業は他にもあるが、23andMeのサイトは非常に分かりやすく、かつ、カラフルなデザインで遺伝子解析について説明している。この中の「Genotyping Technology(遺伝子タイプ解析技術) というページにその手法が書いてある。それによると、遺伝子解析の手がかりになるのが、SNP (Single Nucleotide Polymorphism、スニップと発音) と呼ばれる、遺伝子の配列の乱れである。SNPは、遺伝子構成要素の塩基 (Base) であるATGCの一文字が、通常の遺伝子から置き換わっている状態を指す。ヒトの遺伝子のなかでSNP1000万ヶ所あり、23andMeはその中の60万ヶ所を解析するとしている。SNPで個人の先祖を辿り、人体の特徴を指摘し、病気予測を行なうことができる。23andMeはマウンテンビューに拠点を構えており、グーグルが出資しているベンチャー企業であるということも分かった。

 

ソーシャル・ネットワーク

23andMeは、遺伝子解析とウェブ技術を融合させた、新世代の企業でもある。23andMeは、今年5月に「23andWe」というプロジェクトを発表している。このプロジェクトは、ウェブ技術を駆使して、23andMeによる遺伝子解析結果と、被験者の情報を結びつけ、医療技術研究を促進させようとするものである。

g032_23andme_b.jpg

このプロジェクトのベースとなるのが、23andMeのソーシャル・ネットワークである。このサイトでは、利用者が遺伝子情報を公開し、会員間のコミュニケーションを通して、情報を有効に活用しようとするものである。このサイトでは、遺伝子解析の結果、病気予測、遺伝子の影響の度合い、マーカーについての説明を「my gene journal」として公開する。また、左下のグラフィックス(出展:23andMe)のように、自分の遺伝子と家族や友人の遺伝子との比較を「compare genes」として提供している。更に利用者の先祖がどこから来たかを「my ancestors」として提供している。これらの情報は、通常のソーシャル・ネットワークと同様に、公開と非公開のオプションがあり、希望者だけが情報を公開して、ネットワークを広げる仕組みとなる。

 

トレンド

23andMeの狙いは、ネットワーク効果を利用して、遺伝子解析利用者層の拡大を目指すことだけでなく、これが医療研究に寄与して、パーキンソン病などの難病の解明を目指している。23andMeの利用者は、遺伝子情報と健康情報をソーシャル・ネットワークに登録しており、貴重な臨床試験データとなり、これを医療研究に役立てようとするものである。利用者としては、類似の遺伝子を持っている人との交流を通じて、病気の予防や病気に罹ったときの対処を学ぶことができる。一方で、解決すべき問題は山積している。個人が高度な医療情報を正しく活用できるか、個人が病気予測にどう対処するのか、医療機関は個人情報を有償で買い取るのか、保険会社が遺伝子情報を基に保険料を設定するのかがなどである。

 

オープンソースはソースコードという知的財産を公開することで、ソフトウェア技術が進化した。フェースブックは個人の実名や嗜好を公開することで、ネットワークが急成長し、宣伝広告媒体としての価値が急騰した。これからは、遺伝子情報を公開して、コミュニティーの集合知で、医療技術が進化するのか。23andMeは、違う次元にワープしそうな、大きな変化が起こることを予感させるサービスである。




[1] TODAY, msnabc.com, http://www.msnbc.msn.com/id/21134540/vp/23627696#23627696

[2] 23andMe, https://www.23andme.com/