Archive for June, 2008

セマンティック・インターフェイス

Friday, June 27th, 2008


2008 Semantic Technology Conference」からのレポート最終回は、カンファレンスでの注目企業を紹介し、セマンティック技術がどこに向かって進んでいるかを考察する。

 

UpTake

UpTake (アップテイク) は旅行案内検索サイトで、キーワードを入力するとシステムがホテルや観光スポットを推薦してくれる。

g031_semtech_a.jpg

このスクリーンショット(出展:UpTake)は、サンフランシスコでの観光スポットを検索しているところである。目的地に「San Francisco, California」と入力し、検索対象に「Sightseeing」と入力すると、システムは「Golden Gate Bridge」とか「Grace Cathedral」などと観光スポットを紹介してくれる。ここでは観光スポットの概要だけでなく、訪問者のコメントや評価を読むことができる。また検索結果を、「休暇テーマ」 (家族旅行やカップルでの旅行など)や「観光目的」(名所巡りや美術館見学など)で絞り込むことができる。UpTakeは、ウェブサイトでホテルや旅行情報を収集し、利用者のコメントをもとにそれらの情報を分類する。旅行情報のオントロジーに沿ってこれら収集した情報を振り分けていく。利用者は「目的地」、「休暇テーマ」、「観光目的」などを入力すると、UpTakeは最適な観光スポットを推薦する。通常の旅行検索サイト(Expediaなど)では、利用者が旅行計画に沿ってホテルを探すが、UpTakeは利用者の嗜好に沿ったホテルや観光スポットを推薦してくれる。今年の夏休みは、どこに旅行に行こうかと、迷っているときにお勧めのサイトである。

 

Forecast

Forecast (フォーキャスト) はフライトの検索と航空運賃の予測を行なうサイトである。Forecastは今年の4月にマイクロソフトに買収され、現在ではLive Search (ライブ・サーチ) の一機能として運用されている。

g031_semtech_b.jpg

このスクリーンショット(出展:Live Search)は、サンフランシスコからラスベガスまでのフライトを検索しているところである。通常の検索と同様に、搭乗日、出発地、到着地を入力すると、航空運賃の安い順にフライトが示される。Forecastがユニークなのは、チケットをいつ買うと一番安いかを示してくれる機能である。上記の例では、これから運賃が上がるので、今購入すべきだとという「Buy」のサインがでている。反対に、これから運賃が下がっていく場合には、「Wait」のサインが示される。このシステムはUniversity of Washington (ワシントン大学)のコンピュータ・サイエンス教授であるOren Etzioni (オリン・エツィオーニ)により開発され、同教授によりForecastが創設された。Forecastは日々の航空運賃情報を収集し、過去の運賃変動を参考に、将来の運賃予測を行なうというものである。膨大な量の運賃データからパターンを読み出し、運賃予測を行なうというインテリジェントなウェブサービスである。航空会社は圧倒的なコンピュータ・パワーで運賃の最適化を行い、最大限の利益を目指している。一方、Forecastはこれに対抗して、コモディティ・サーバーで最安値のチケットを見つけ出す。Forecastはデータマイニングと機械学習を行なう広義のセマンティック技術で、ウェブサービスが人工知能を持ち始めることを予感させるサイトである。

 

Calo

Calo (Cognitive Assistant that Learns and Organizes) は米国国防省配下DARPA (Defense Advanced Research Projects Agency) の人工知能に関する大規模な研究開発プロジェクトである。Caloでは、SRI Internationalがコーディネーターとなり、コンピューターを使い易くする研究が行なわれている。現在、我々が使っているコンピュータは、何か処理をする際には、利用者が細かく条件を設定する必要があり、使い勝手が極めて悪いという認識からプロジェクトが始まった。

 

Caloは、コンピューターが利用者の意図を読み取り、複雑な設定を行なうことなく、コンピューターが利用者の求める情報を提示することを目指している。Caloでの研究開発に基づいて、それをかたちにした新しいアプリケーションが登場している。先に紹介したRadar NetworksTwine (トゥワイン) もその一つで、 会社創設者のNova SpivackCaloで研究に従事していた。

g031_semtech_c.jpg

このスクリーンショット(出展:Calo)は「Calo Express」という、学習能力を有している「個人秘書」の事例である。画像は「Calo Meeting Assistant」というモジュールで、会議の席で、ビデオカメラの画像から出席者を認識し、議事録を作成しているところである。このシステムは会議の要旨を把握し、決定事項やアクションアイテムを認識し、会議終了後には、議事録を関係者に配布する。また、このシステムは、会議ごとにそのスタイルを把握し、出席者や議題に応じた最適な処理を学習していく。「Calo Express」は外販はされてなく、米国国防省内でだけで使われている。

 

セマンティック技術の方向

カンファレンスでセマンティック技術を応用した様々なアプリケーションを見てきたが、そこで共通している要素は、利用者の意図を見抜いて、先回りして情報を提供するという機能である。今までは利用者がハイパーリンクをクリックしたり、検索キーワードを入力して、必要な情報を得るために模索してきた。セマンティック・アプリケーションは、利用者が何を探しているのか、どこに旅行したいのか、どんな音楽があるのかを、先回りして教えてくれる。カンファレンスを通して、ユーザー・インターフェイスがインテリジェンスを持ち、尋ねる前に教えてくれる機能が、セマンティック技術の方向であると確信することができた。

セマンティック検索の現状と展望

Friday, June 20th, 2008


2008 Semantic Technology Conference」のカンファレンス・セッションで、「Taking Semantic Technology to the Masses」と題して、セマンティック技術をどのように市場に説明すべきかとの議論が展開された。パネル・ディスカッションで、Powerset (パワーセット) Mark Johnson (マーク・ジョンソン) Reuters (ロイター) Thomas Tague (トマス・テイグ) らから、興味深い意見を聞くことができた。

 

Powersetとは

議論の中心テーマは、セマンティック技術への期待と、その現実との乖離であった。この議論でしばしば引用された事例がPowersetである。Powersetとは、普通の言葉で質問することができる「自然言語検索エンジン」 (Natural Language Search Engine) である。 この自然言語処理技術は、PRAC (Palo Alto Research Center: パロアルト研究所) からライセンスを受けている。Powersetはウィキペディアの記事を読んでのその意味を理解する、インテリジェントな検索エンジンでもある。質問の意味を解し、質問の趣旨に沿った回答を返す、次世代の検索エンジンとして、大きな期待を背負ってスタートした。

 

セマンティック検索の実情

Powersetがベンチャー企業として活動を始めたのは2005年で、この自然言語処理と、文章の内容を理解するインテリジェンスで、グーグルを凌ぐ検索エンジンになると期待されていた。新聞や雑誌もPowersetを未来の検索エンジンとして報道し、市場から熱い関心を寄せられていた。Powersetは先月からサービスを開始しその姿が明らかになってきた。Powersetは使いやすいインターフェイスで、知的な検索ができるが、その対象はウィキペディアと前回紹介したFreebase (フリーベース) に限られている。Powersetの対象はインターネット全体ではなく、ウィキペディアだけで、グーグル対抗馬というには余りにも規模が違いすぎる。

 

パネル・セッションでは、この期待と現実の乖離について意見が述べられた。議論を要約すると、「セマンティック技術で革新的な検索エンジンが登場する訳ではなく、「緩やかに進化」した機能が加わる」ということになる。Powersetはセマンティック技術でグーグルを凌駕する検索機能を提供するに至ってないが、現行検索技術を「緩やかに進化」させた機能を提供しているということになる。

 

Powersetの実態

実際にPowersetを使って、セマンティック検索技術の現状と将来への展望を探ってみた。

g030_powerset_a.jpg

これはPowersetで「Harrison Ford(ハリソン・フォード)というキーワードで検索した結果である。上段にHarrison Fordの概要とウィキペディアへのリンクが示される。中段にはRDF (Resource Description Framework)形式で、Harrison Fordに関する事実が、下段には、通常のキーワード検索結果が示される。Powersetが「緩やかに進化」したのは、検索結果の精度ではなく、利用者が記事を読みやすいように、記事の要旨を表示する機能である。(次のスクリーンショット、出展は全てPowerset)

 

g030_powerset_b.jpg

これは「Factz(ファクツ)と呼ばれ、記事の内容を要約して、箇条書きにして示すものである。これは「Indiana Jones(インディアナ・ジョーンズ)記事の要約を示しているもので、これを読んでいくと記事の概要を把握できる。またマウスで箇条書きをクリックすると、それが書かれている記事を黄色でハイライトして、そこにジャンプする。これはグーグルにはない機能で、実際に使ってみて一番便利だと感じる機能である。

 

Powersetの自然言語処理

Powersetの自然言語処理技術を試すため、文章で質問を入力してみた。映画「インディー・ジョーンズ」から、「who is the father of indiana jones(誰がインディアナ・ジョーンズの父親か)という質問を入力した。これに対しては次のスクリーンショットの通り、「Henry Jones, Sr.(ヘンリー・ジョーンズ・シニア) とズバリ答えを示し、その下に関連するウィキペディアの記事を掲示した。シリーズ第三作「Indiana Jones and the Last Crusade」で、ショーン・コネリー (Sean Connery) が父親役のHenry Jonesを演じており、正解である。一方グーグルで同じ質問をすると、映画「Indiana Jones and the Last Crusade」関連記事へのリンクとその概要の中で正解を表示した。文章だけで読みにくいところもあるが、一応正解である。Powersetはズバリ回答するが、グーグルでは丹念に説明を読む必要があり、この部分が「緩やかに進化」した技術であるといえる。

g030_powerset_c.jpg

 

トレンド

Powersetは当初の期待が大きかったため、現行機能との乖離が際立ってしまった。Powersetの検索精度は、グーグルを覆す技術とは言えないが、検索結果を表示する技術において、グーグルから「緩やかに進化」している。セマンティック技術で革新的な技術進化が起こったわけではなく、一定の機能強化が図られている。つまりPowersetはこの領域において、まだまだ改善の余地があることを示している。ウィキペディアだけでなくインターネット全体のインデクシングや、複雑な質問への回答など、大きな課題を抱えている。ここが次世代の検索技術での主戦場になり、セマンティック技術の活躍が期待されているところである。

セマンティック・ウィキペディア

Friday, June 13th, 2008

2008 Semantic Technology Conference」のカンファレンス・セッションで、Metaweb (メタウェブ) 社のJamie Taylor (ジェイミー・テーラー) から「Freebase (フリーベース) の概要とその応用事例について紹介があり、実際にFreebaseを使ってみた。

Freebaseとは

Freebaseとは一言で表現すれば、セマンティック技術を適用したウィキペディアである。Freebaseのコンセプトはウィキペディアと同様に、コミュニティーが編纂する「百科事典」であり、利用者が自由に記事を編集したり追加することができる。

g029_freebase_a.jpg

これはFreebaseで、「インディ・ジョーンズ」シリーズの最新映画である「The Kingdom of the Crystal Skull」の記事を検索したところである。この説明文はウィキペディア記事をそのまま利用している。(出展は断りが無い限りFreebase)

Freebaseがウィキペディアと異なる点は、その背後にあるセマンティック技術である。記事の下に、この映画の概要をテーブル形式に纏めたものが表示される。(次のスクリーンショット) テーブルは「Film(映画)というカテゴリーの配下に様々な属性を表示している。「The Kingdom of the Crystal Skull」という「映画」の属性は、その「Directed by(監督)は「Steven Spielberg(スティーブン・スピルバーグ)で、「Performances(登場人物)は「Harrison Ford(ハリソン・フォード)と続く。

g029_freebase_b.jpg

セマンティック技術

ウィキペディアでは記事のタイトルと説明文から構成されているが、Freebaseではこれに上記の通り、記事の属性が付加される。この記事は「映画」について記述したものであり、映画の内容は「監督」、「封切日」、「俳優」、「製作者」などから構成されていることを示している。これら記事の属性の構成を「オントロジー」 (Ontology) と呼んでおり、これが記事に「意味」を付加する要素となる。

この属性が威力を発揮するのは、キーワード検索を行うときである。ウィキペディアで「The Kingdom of the Crystal Skull」のキーワードで記事を検索すると、「映画」についての記事が表示される。一方で、Freebaseで同じキーワードで検索すると、検索ボックスに選択肢が示される。(次のスクリーンショット) Freebaseはこの選択肢で、利用者に、求めているものは「映画」についての記事なのか、それとも「コンピュータゲーム」なのか、または「テレビ番組」なのかを問いかける。つまりFreebaseは質問の「意味」を理解することができる。

g029_freebase_c.jpg

Freebaseの編集方法

前述の通り、Freebaseはウィキペディアと同じように、ユーザ登録すればだれでも自由に記事を追加したり、編集することができる。

g029_freebase_d.jpg

このスクリーンショットは、Freebaseの「The Kingdom of the Crystal Skull」記事で、俳優の「役割」を記入しているところである。Freebaseでは、「映画」という概念が決定され、記事の構造が決まっているので、テーブルに従って情報を入力していく。スクリーンショットでは、「俳優」の「Cate Blanchett(ケート・ブランシェット)が映画の中でKGBエージェントの「Irina Spalko(イリーナ・スパルコ)を演じている情報を追加しているところである。記入が終わればセーブボタンを押して作業が完了する。

Freebaseで何ができるのか

Freebaseで記事の検索や閲覧を行うことができるだけでなく、コンピュータが記事を読んで内容を理解できるところに大きな意味がある。セマンティック技術は、ソフトウェアが、Freebaseにアクセスして記事を読み込んで、処理をすることを目的にしている。

g029_freebase_e.jpg

これは「James Home」というサイトの「FMDb[1] 」とい映画検索のアプリーションの事例である。FMDbというアプリケーションがFreebaseにアクセスして、情報を読み込んで表示するというシンプルな構造をしている。アプリケーションがデータベースにSQL (Structured Query Language) を発行する様に、FreebaseMQL (Metaweb Query Language) というクエリーを発行して記事のデータを読み込む。因みに、「The Kingdom of the Crystal Skull」で検索すると、先に入力した「俳優」の情報がリアルタイムで反映されている。

トレンド

セマンティック・ウェブでは誰がオントロジーを構築して、それに従って誰がデータを入力するのかが常に問題となる。Freebaseでは集合知を活用して、コミュニテーがこの役割を担っているところに特徴がある。




[1] FMDb, http://jameshome.com/freebase/fmdb/index.html

セマンティック・ウェブ最新動向

Friday, June 6th, 2008

先々週、サンノゼで、セマンティック (Semantic) 技術のカンファレンスである「2008 Semantic Technology Conference (略してSemTech:セムテック) が開催された。サンノゼ美術館に隣接するフェアモント・ホテルで、最新のセマンティック技術が紹介された。会場では、スーツにネクタイのビジネスマンから、Tシャツに半ズボンの研究者まで、幅広い分野からの参加者があった。

セマンティック技術とは

セマンティック・ウェブについては、以前、このレポート[1] で報告しており、セマンティック・ウェブの定義をここから引用すると、「セマンティック・ウェブにより、ウェブ上の情報が標準化され、コンピューターが理解できる形式になる」。そして、「コンピューターが、個人秘書のように、予定にあわせて飛行機を予約し、会議会場に近いホテルを予約するようになる」となる。HTMLで書かれているウェブは、人間が理解できる構造であるが、これにセマンティック技術を導入することで、コンピューターが理解できるウェブとなる。

Nova Spivacの基調講演

カンファレンスの基調講演で、レイダー・ネットワークス (Radar Networks) 創設者であるノバ・スピバック (Nova Spivack) が「Experience from the Cutting Edge of the Semantic Market」と題して、興味深い講演を行なった。前述レポートで紹介しているとおり、0611月に、スピバックはセマンティック・ウェブ製品計画について説明をしてくれた。今回の講演ではそれが形となり、実際に稼動しているウェブを見ることができた。因みに、スピバックは社会学者であるピーター・ドラッカー (Peter Drucker) の孫にあたる。

スピバックは基調講演で、同社が開発しているTwine (トゥワイン) というウェブを紹介した。セマンティック・ウェブという名前は何回も耳にするが、実際に利用できるウェブサイトはまだ数が限られている。その中で、Twineのベータ版が公開され、その姿を見ることができた。Twineを一言で表現すると、インテリジェントなソーシャル・ネットワークである。講演の中で、スピバックは、「Facebookは人間関係を、LinkedInは就職情報を対象とするが、Twineは個人の関心事を対象とする」と説明した。Twineは利用者の知識を整理 (Organize) し、他の利用者とそれを共有 (Share) し、そして新しい情報を発見 (Discover) するサイトである。

Twineの概要

講演の後Twineを使ってみたが、その「頭の良さ」に驚いた。Twineは利用者がウェブサイトを開設し、そこに情報を集めて利用する、知識整理のための「キャビネット」である。

g028_twine_a.jpg

これは私が作製したTwineの事例である。「Tokyo Twine」と題して、東京出張中に発見した東京の街角の様子を集めたものである。自分で撮影した写真をアップロードしたり、記事を書いたり、他のサイトを「ブックマーク」することができる。ただし、TwineDiggのような従来型のブックマークとは異なり、Twineが自動でタギングを行なってくれる。Twineがウェブサイトの内容を理解し、最適なタグを推奨してくれる。利用者が独断と偏見でいい加減なタギングを行なうよりは、便利で普遍的である。

Twineの推奨機能

このサイトに取り込んだ情報は、個人が情報整理を行なうための「作業場所」で、他人がこれを閲覧することはできない。利用者は、ここから公開する情報を選んで、Twineに開示する。公開された情報は、他人が閲覧できるだけでなく、ウィキの要領で他人がコメントしたり、情報を追加できる。ウィキペディアのように、興味あるトピックスに人が集まり、情報が成長していく。

利用者は、自分が興味を持つサイトにアクセスして、情報を入手したり、検索することができる。検索では、キーワード検索だけでなく、スマート検索として、「タグ」、「人」、「場所」などの項目で絞込みをすることができる。Twineがインテリジェントだと感じるのは、Twineが利用者が興味を持つであろうトピックスを推奨することである。また、利用者と共通点がある他の利用者を推奨することである。アマゾンが利用者に本の推奨をしたり、パンドラ (Pandora) が視聴者に音楽の推奨を行なうように、利用者はTwineを使って新情報を「発見」することができる。

Twineの仕組み

インテリジェントなウェブサイトの背後では、前述のセマンティック技術が使われている。ウェブサイトをコンピューターが理解できる言語であるRDF (Resource Description Framework) でデータの内容やデータ間の関係を規定する。TwineOWL (Web Ontology Language) という「辞書」で、RDFで使用するデータに厳密な定義を与える [2]

g028_twine_b.jpg

先の「Tokyo Twine」をRDF形式のドキュメントで見ると上のようになる。ここにドキュメント名や作者などの情報が、RDF形式で記載される。この作業を利用者が行なうのではなく、背後でシステムが自動的に行なう。更に、TwineRDF形式で記載されたトピックスを比較することで、トピックス間の関係が鮮明となり、利用者に関連の深いトピックスや、共通の関心事を持つ利用者を紹介する。これが推奨の仕組みであり、使ってみて、ここがインテリジェントだと感じるところである。

トレンド

セマンティック技術は研究開発段階から、なかなか商用ベースに乗らないという問題を抱えていた。ベンチャー・キャピタルもセマンティック技術への投資には躊躇していた。しかし、Twineのように利用者に分かりやすいアプリケーションが登場することで、セマンテッィク技術が、研究段階から事業化の段階に入ってきたように思えた。TwineWeb 2.0の次の波が見え始めた。




[1] Venture Weekly Brief, VWB: #149, 「セマンティック・ウェブ」, 11/26/2006

[2] 詳細はTwineの「Take the Tour」を参照 (http://www.twine.com/tour/semantic)