Archive for May, 2013

Google I/Oレポート(2) Google+の写真機能が大幅に向上

Monday, May 27th, 2013

Google I/Oでは、Engineering担当上級社長Vic Gundotraが、Google+の最新技術について説明した。Google+は、リリースされて丸二年間となり、利用者数は1億人に達し、早いピッチで成長している。Google+は、Stream (ニュース・フィード)、Hangouts (通信)、Photos (写真アルバム) で機能強化が行われた。Streamは、レイアウトが一新され、記事が雑誌スタイルで表示される。Hangoutsは、複数の通信手段を、統合したもの。Photosは、写真エンハンス機能が追加され、掲載した写真が自動で鮮やかになる。Google I/O会場には、Google+ブース (下の写真) が設置され、写真エンハンス機能などをアピールしていた。

g321_google_io_plus_01

Google+のレイアウトが一新

Google+のStream (Facebookのフィードに相当) 形式が大きく変わった。Google+のレイアウトは、従来のシングル・カラムから、マルチ・カラムに改良された(下のスクリーンショット)。記事はカード形式で表示され、裏返して見ることができる。カードには、Google+が自動生成したハッシュタグが付加される。下の事例は、#landscapephotographyというタグが自動で生成され、カードに付加されている様子である(左側画面)。ハッシュタグをクリックするとカードが反転し、同じタグのカードが表示される。このタグは風景写真を意味し、他の会員が撮影した風景写真が表示される。Google+は、カードに説明文がなくても、画像解析技術で写真を解析し、イメージが意味していること (下の事例では風景写真) を把握し、自動でハッシュタグを生成する。Googleらしい機能である。

g321_google_io_plus_02

コミュニケーション機能をHangoutsに統合

Googleは、Hangoutsというコミュニケーション・ツールを投入した。下のスクリーンショットは、スマートフォンでHangoutsアプリを使っている様子である。Hangoutsは、チャットとビデオ会議を統合した機能を持っている。下の事例は、チャット機能を使って、写真やテキストを交換している様子である。

g321_google_io_plus_03

パソコンでは、Google+ウェブサイトから、Hangoutsを利用する。GmailやChromeブラウザーからもHangoutsを利用できる。Googleは分散していた通信機能 (Talk、Google+ Messenger及び当初の Hangouts) を統合して、Hangoutsという統合サービスとした。バラバラであった通信機能が一つに纏まり、分かり易くなった。

写真自動エンハンス機能を追加

Googleは、カンファレンスに先立ち、Google Drive、Gmail、Google+ Photosで無料で利用できるデータ容量を15GBにすると発表した。従来は、Gmailで10GB、Google DriveとGoogle+ Photosで5GBであったが、合計で15GBまで無料で利用できるようになった。写真サイズについては、8MBまでサポートしており、高画質の写真をアップロードできる。

g321_google_io_plus_04

Google+ Photosは、Picasa Web Albumsを取り込んだ形の写真アルバムである。アルバムで、Highlightsというタグを選択すると、数多くの写真の中らから、Googleが代表的な写真を抽出する。上のスクリーンショットがその様子で、大量の写真から、ピンボケ、重複、逆光の写真を除き、有名な場所が写っている写真や、笑顔の写真を抽出する。更に、構図が優れているものや、利用者の身近の人物が写っている写真を抽出する。色々なセットで試してみたが、重複写真を除いてくれるのは便利な機能である。Googleが選択した写真は、絵になる構図が多いように感じる。Google+ Photosは、写真を自動でエンハンスする、Auto Enhance機能を搭載した。写真をエンハンスする技法は、露出補正 (Tonal Distribution)、肌を滑らかに補正 (Skin Softening)、ノイズ除去 (Noise Reduction)、奥行き付加 (Structure)、白色補正 (White Balancing) 等が使われる。

g321_google_io_plus_05

上は露出補正の事例である。左側はオリジナルの写真で、露出不足 (Underexposure) で全体が暗くなっている。右側はそれを補正したもので、暗い部分が明るくなり、適正な露出となっている。露出過度(Overexposure) の写真についても適正な露出に調整する。スマートフォンの暗いレンズで撮影した夜の風景が綺麗に再現され、これは便利な機能である。

g321_google_io_plus_06

上は奥行き付加の事例である。奥行き付加とは、フラットな写真に奥行きを付ける技法である。左側は夕方のSan Francisco Bayであるが、全体がフラットに写っている。右側は奥行き付加を施したもので、空の色にメリハリをつけ、夕焼けをドラマチックに再現している。のっぺりとした空が、厚みを持ち、ビビッドに表現されている。

Gundotraは、「写真は撮影するものではなく、創るものである」と説明した。Google+ Photos背後のクラウドが、この機能を担う。利用者がマニュアルで写真を改良でき、また、Auto Enhance機能で、システムがこれを自動で実行する。コンテンツがビジュアルに向う中、写真エンハンス機能の重要度が増してきた。Google+は、写真エンハンス機能を中心に、サービスを再構成してきた。

Google I/Oレポート(1) パーソナライズされたGoogle Maps

Tuesday, May 21st, 2013

Googleの開発者向けカンファレンスであるGoogle I/Oが、先週、San FranciscoのMoscone Center (下の写真) で開催された。今年のGoogle I/Oは、既存製品の機能強化を中心に、最新技術が紹介された。モバイル・デバイスについての新製品発表はなく、Google本来のIT技術に立ち戻り、カンファレンスが進行した。今週からシリーズで、Google最新技術をレポートする。

g320_google_io_maps_01

Google I/Oカンファレンス総括

Google I/O初日は、基調講演が行われ、今年のGoogle新技術が紹介された。Google Play Musicから、All Accessという定額制音楽配信サービスが登場した。YouTube Paid Channelsとともに、有償化路線が鮮明になってきた。Google+では、Photosという写真アルバムが強化され、撮影した写真が自動で鮮やかになる機能Auto Enhanceが登場した。会場にはGoogle+ Photosブースが設置され、この機能をアピールしていた(下の写真)。検索ではVoice Search機能が強化され、Google Nowがよりインテリジェントになった。この二つの機能が連携し、Apple Siriに対抗する製品を構成している。Google Mapsでは、インターフェイスが一新され、表示される地図が利用者ごとに最適化された。Street Viewが海の中に入り、海底の散歩を楽しめるようになった。

g320_google_io_maps_02

新しいGoogle Mapsを使ってみる

このレポートでは、インターフェイスが一新された、Google Mapsを考察する。Google Mapsの新機能を一言で括ると、Personalization (個人化) である。Google Maps担当副社長Brian McClendonらが機能強化された製品を説明した。新しくなったGoogle Mapsは、利用者個人に最適な情報を地図上に表示するのが特徴である。更に、位置情報の精度が向上し、Google Mapsにレストランなど店舗情報をプロットできるようになった。

g320_google_io_maps_03

早速、Google Mapsをアップグレードし、新機能を使ってみた。上のスクリーンショットがGoogle Mapsの新しいインターフェイスである。左上隅に検索ボックスが表示され、ここにキーワードを入力して検索する。上は「Moscone Center」で検索した様子で、検索結果がマップ上にピンで表示され、左上に施設の概要がInfo Cardの形式で表示される。ここまでは、従来のGoogle Mapsと大きな違いは無い。

g320_google_io_maps_04

Google Mapsは、カテゴリーで検索する機能が追加された。上のスクリーンショットは、「restaurants」というカテゴリーで検索した結果で、地図上にレストランがプロットされる。大きなアイコンは、過去に検索したレストランを示し、星印はSaveしたレストランを示す。Your Circleというリンクをクリックすると、友人が推奨するレストランが示される。Google+のサークルがMapsに統合されている。上はサークル・メンバーのMarissa Mayerが、Evviaというレストランについてコメントをしている事例である。随所にPersonalize機能が実装されている。

g320_google_io_maps_05

Google MapsでGoogle Earthボタンを押すと、マップが三次元で表示される。上のスクリーンショットがその様子で、San Francisco市内を三次元で表示したもので、ビルの周りを飛行できる。これは撮影した写真を三次元ベクトルで処理したもので、移動や回転操作をスムーズに行える。Appleが先行しているFly Over機能であるが、Googleも正式にサービスを開始した。最下段には利用者が撮影した写真などが表示され、サムネールをクリックすると、街並みを連続写真で楽しめる。これはクラウド・ソーシングによる地図作成で、利用者がGoogle Maps作成に貢献できる仕組みとなっている。

g320_google_io_maps_06

Street Viewでダイビング

Google MapsのStreet Viewは、海中に入り、綺麗な海にダイビングできる。上のスクリーンショットは、Heron Island (オーストラリア) の海中で、ゆっくり泳ぐカメが捉えられている。海中のGoogle Mapsは、下の装置で撮影される。これは潜水機にカメラ (Seaview SVII) を搭載した形状となっている。カメラは、Catlin Seaview Surveyという、サンゴ礁の調査プロジェクトが開発したもので、海中を360度撮影できる。

g320_google_io_maps_07

Googleは、昨年から、Art Projectで世界の有名美術館内部をStreet Viewで公開している。下のスクリーンショットは、Museum of Modern Art (ニューヨーク州) の事例で、ブラウザーで美術館を散策できる。画面左枠がフロアー・レイアウトで、現在地と見ている方向を示している。画面右枠が美術館内部で、展示されている作品を見ることができる。これはHenri Rousseauのコナーで、一番手前に「The Sleeping Gypsy」を見ることができる。Art Projectは世界51の美術館をカバーしている。

g320_google_io_maps_08

Google Mapsのねらい

Google Mapsは、個人に特化した情報を表示するよう、大きく進化した。検索結果は直接地図上にプロットされ、それをサークルで絞り込むことができる。気に入った店舗をSaveしておくこともできる。Top reviewersというリンクをクリックすると、専門家が推奨するレストランが表示される。更に、Google Mapsは、利用者の嗜好に沿ったレストランや小売店舗を推奨する。地図の個人化による推奨機能で、利用者が店舗に足を運ぶ可能性が高まることが期待される。新しいGoogle Mapsは、便利になっただけでなく、Googleの広告事業に貢献する構造となっている。Street Viewは、プライバシー問題だけがクローズアップされているが、着実にカバー範囲が増えている。Google Street View Galaryには、上述のOceanに加え、世界の名所旧跡、秘境、世界遺産などが掲載され、世界旅行を楽しめる。今年のGoogle I/OはGoogleの原点に戻った技術展示となった。

ベンチャー企業からApple Siri対抗アプリが登場

Thursday, May 16th, 2013

【進化するエンタープライズ・モバイル (4)】 企業向けモバイルの最新動向を、DEMO Mobileからレポートする。最終回の今回は、Androidスマートフォン向けにアシスタント機能を提供しているSherpa (シャーパ) というアプリを考察する。

g319_sherpa_01

Apple Siri機能をAndroidスマホで提供

SherpaはErandio (スペイン) に拠点を置くベンチャー企業で、同名のSherpaというアシスタント機能を提供するアプリを開発している。Sherpaは、Apple Siriと同等の機能を、Androidアプリとして提供している。スペインで開発されたアプリで、スペイン国内で人気のアプリである。Sherpaは、DEMO Mobileで、英語版アプリをリリースし、アメリカでの展開を開始した。Sherpaは、利用者の音声による質問に対して、音声と画面で回答を示すアプリである。上のスクリーンショットがその事例で、利用者が「オバマさんとは誰?」と尋ねると、Sherpaは、「Barak Obamaについて知っていることを示します」と述べ、オバマ大統領に関する情報をカード形式で表示する(左側)。カードには、オバマ大統領の写真と説明が、雑誌記事のように表示される。中央のwwwアイコンにタッチすると、オバマ大統領のウェブサイトが表示される (右側)。ビデオアイコンではYouTubeビデオが、カメラアイコンではBingでの写真検索結果が表示される。

g319_sherpa_02

インテリジェントな応対

Sherpaに問いかける時は、右下のマイク・アイコンにタッチする。上のスクリーンショット左側はマイク・アイコンにタッチして質問したところで、Googleの音声検索画面が登場する。Sherpaは、フロントエンドの音声認識機能は、Googleの音声検索 (Voice Search) を利用している。利用者が「お腹が空いた」と語りかけると、SherpaはGoogle Maps上に、近所のレストランを表示する(同右側)。Sherpaは利用者の発言の意図を解釈して、最適な情報を表示する。利用者が「明日は雨が降る?」と質問すると、Sherpaは、現在地 (Mountain View) の明日 (5月10日) の天気を回答する (下のスクリーンショット左側)。Sherpaは、利用者の位置や現在の時間を認識している。それでは、Apple Siriで話題になった「明日は傘がいる?」と質問すると、Sherpaは、「傘を持参するかどうかはあなたが判断することですが、5月10日の天気予報を示します」として、現在地の天気予報が表示される(同右側)。「明日はジャケットがいる?」と質問しても同様な答えで、Sherpaは質問の意図をくみ取って回答する。

g319_sherpa_03

タスクを実行する機能

Sherpaは、情報検索だけでなく、利用者の指示に従って、アプリを操作することもできる。利用者が、「テキスト・メッセージを送信して」と指示すると、Sherpaは「メッセージは?」、「誰に?」と質問し、これに対して、内容と送信先を回答すると、メッセージが生成される(下のスクリーンショット左側)。この確認画面で「イエス」と回答すると、テキスト・メッセージが送信される。右側が受信したメッセージで、処理が上手く完了したことを示している。SherpaはAndroid OSのメッセージ機能と連携し、公開されているAPIを使い処理を実行している。

g319_sherpa_04

Sherpaは、この他に、「Facebookに記事を掲載して」と指示すると、利用者のNews Feedに記事を投稿する。「レストランを予約して」と指示すると、Sherpaは、OpenTableの予約サイトを表示する。また、フライトの予約を指示すると、Sherpaは、出発地、目的地、日時、人数を尋ねる。これらに回答すると、Sherpaはお勧めのフライトを表示する。フライトの予約は、Lastminute.comというサイトで行う手順となる。

g319_sherpa_05

Sherpaを構成する技術

Sherpa CEOのXabier Uribe-Etxebarria (上の写真右側) が、システム概要について説明してくれた。Sherpaは、前述の通り、音声認識技術は、GoogleのVoice Search利用している。Sherpaの技術は、自然言語解析 (Natural Language Processing) とセマンティック技術にある。Sherpaは、利用者の発言を、文章の構造や意味を分析し、意図を読み取る。質問に対する回答を、複数サイトから収集し、カード形式 (Interactive Information Card) で提示する。情報提供だけでなく、メッセージ送信などのトランザクションの実行も行う。打ち合わせ時間が迫るとアラートを表示する機能も開発されている。AppleはSiriというベンチャー企業を買収して、音声解析機能を入手した。いま再び、ベンチャー企業から、人工知能技術を応用した、クールなアプリの登場が始まった。

スマートフォンで利用者と対話するビデオ

Wednesday, May 8th, 2013

【進化するエンタープライズ・モバイル (3)】 企業向けモバイル技術の最新動向を、DEMO Mobileからレポートする。モバイル・プラットフォームでは、音声による入力が殊のほか重要となる。Volio (ボリオ) というベンチャー企業は、利用者の問いかけに、ビデオで答える技術を開発している。Volioの創設者であるRon Croenが、ステージでデモを交えて、この技術を紹介した (下の写真)。

g318_volio_01

好みを聞きながらカクテルを作る

Volioは、San Francisco (カリフォルニア州) に拠点を置き、同名のVolioというデジタル・メディア技術を開発している。Volioは音声認識機能を持ち、利用者の質問を理解し、質問に対する回答をビデオ映像で行う。Volioは、男性向け雑誌Esquireのアプリ (Talk to Esquireという名称、下のスクリーンショット) として提供されている。アプリを起動すると、三人の編集者が登場し (同左側)、ファッション、カクテル、ヘアースタイルについて、アドバイスをする。利用者はカラムにタッチして、この中から希望のテーマを選択する。右側のスクリーンショットは、カクテルを選択した様子で、ドリンク担当のコラムニストであるDavid Wondrichが、カクテルの作り方を解説する。アプリでは録画されたビデオが再生され、Wondrichが利用者の好みを聞きながら、カクテルを作っていく。

g318_volio_02

下のスクリーンショットは、カクテルの作り方を講義している様子である。左側は、Wondrichが、「カクテルのベースは、ウォッカ、ウイスキー、ラムの中で何が好きか」と聞いているところである。利用者を撮影したビデオが、小さなウィンドウに表示され、質問に対して、「ウォッカが好き」と答えている様子である。

g318_volio_03

次にWondrichは、「新しいカクテルとクラッシックなカクテルのどちらが好きか」と質問し、それに対して、「新しいカクテル」と回答。Wondrichは、それでは、「Piscoというカクテルを紹介する」として、実際に、ビデオでカクテルの作り方を紹介する (右側のスクリーンショット)。WondrichはChilean Piscoというカクテルを作り、会話しながら、カクテルの作り方を楽しく学べるアプリである。カクテルを作りながら、お酒の歴史的背景などの説明も入り、雑学を学べるアプリでもある。Wondrichとの会話で、こちらの発言のあとに一瞬ポーズがあるが、ビデオ間のつなぎ目は無く、スムーズに会話が展開する。Volioは、Esquireのような雑誌社が、読者に記事をインタラクティブに配信する方式として利用されている。

g318_volio_04

利用者と会話しながら商品をPR

Volioはこの技術を商品PRに応用している。上のスクリーンショットがその事例で、ヘアースタイルについての講義の後に、利用者に最適な商品を推奨する構成となっている。この講義では、Esquireのグルーミング・コラムニストのRodney Cutlerが、男性向けに髪の手入れについて解説する。Cutlerは利用者に、髪が長いか・短いか、ストレートか・カールか、いまどんなヘアケア製品を使っているかを質問する (上のスクリーンショット左側)。講義の最後で、Cutlerは、髪が短い人向けに、Bumble & BumbleブランドのGrooming Crèmeというヘアクリームを推奨する。利用者は講師とインタラクティブに会話を進めながら、自分に最適ヘアケア商品を知ることになる。

いま、消費者との対話を通して、商品をPRする方式が、注目を集めている。Volioに先立ちNuanceは、2013年4月、Nuance Voice Adsという新方式の広告配信技術を発表した。この方式では、スマートフォンに広告バナーが表示され、ここにタッチすると、ボールが表示される。ボールは、「何か質問ある?」と問いかけ、これに利用者が、「○○○を買うべきか?」と尋ねると、ボールは、「じゃあコイントスで決めよう」と会話が進行する。最後にボールは、「スマートフォンはお金の匂いがする」として、デオドラント商品を表示する (下のスクリーンショット)。スマートフォンの小さな画面に、広告クリエイティブを表示するには限界がある。この代わりに、NuanceやVolioの技術で、利用者と会話しながら広告を配信する方式が注目されている。

g318_volio_05

Volioのビジネス開発副社長Rebecca Leeが、Volioの技術について説明してくれた。LeeはVolioの構成について、「アプリで登場するシーンを事前に撮影しておき、利用者の質問に応じて、ビデオを組み合わせていく」と解説した。Volioのコア技術は自然言語解析で、「Volioは利用者の幅広い質問を理解する」と説明した。Apple Siriとの対話は、音声だけで進むが、これにビデオを付加したのがVolioと解釈できる。Volio創設者であるCroenは、Nuanceの創設者でもある。Croenは1994年にNuanceを創業し、CEOなどを歴任し、2005年にNuanceを退き2011年にVolioを設立した。スマートフォンで利用者と会話するアプリは、応用分野が広く、夢が広がる技術である。