Archive for the ‘google’ Category

Google自動運転技術が格段に進化、高機能Lidarを開発し自動車部品メーカーを脅かす

Tuesday, March 7th, 2017

Alphabetの自動運転車開発会社Waymoは独自でLidar (レーザーセンサー) 技術の開発を進め、機能が大幅に向上したと発表した。また、WaymoはUberの子会社OttoがLidar技術を盗用したとして提訴した。自動運転車開発競争の中心はLidarで、Waymoの特許を参考に最新技術をレビューする。

出典: Waymo

Automobili-Dカンファレンス

Waymo最高経営責任者John Krafcikは2017年1月、デトロイトで開催されたNAIAS Automobili-D カンファレンスで最新の自動運転技術を発表した。この模様はビデオで公開された。WaymoはChrysler Pacifica Hybridベースの自動運転車 (上の写真) を開発しているが、KrafcikはLidarなどのセンサーを中心に最新技術を説明した。

クライスラーと共同開発

WaymoとFiat Chrysler Automobilesは2016年5月、自動運転車を共同開発することで合意し、100台の自動運転ミニバン「Waymo Self-Driving Pacifica」を製造している。ミニバンはWaymoが開発したハードウェア (Hardware Suit) を搭載し、最高レベルの自動運転車として位置づけられる。

Lidarを自社開発する

初期のGoogle自動運転車は他社製センサーやプロセッサを利用していた。LidarはVelodyne社製のハイエンドモデル「HDL-64E」を採用した (下の写真、屋根の上の円筒状装置)。しかし、この製品は機能的な制約があり、価格は75,000ドルと高価で車両価格を上回った。このため、WymoはLidarを含むセンサー群を自社で開発することとした。

GoogleのAIとWaymoのセンサーを統合

センサーは自動運転車の頭脳であるAIと密接に統合された。センサーを構成する各コンポーネントがAIにより制御され、単一のモジュールのように機能する。Googleがスマートフォン「Pixel」でAndroid OSだけでなくデバイスも自社開発しているように、Waymoもソフトウェアだけでなくハードウェアも開発する方針とした。Googleが得意とするAIとWaymoの高精度センサーが結びつき自動運転技術が一気に進化した。

出典: VentureClef

センサーの種類と搭載位置

WaymoのセンサーはLidar、Vision System、Radarから構成される (下の写真)。ミニバンの屋根には小型ドームが搭載され、ここにLidar、Vision System、Radarが格納される。クルマの四隅にはRadarが設置される。別のタイプのLidarは前後と前方左右四か所に搭載される。

出典: Waymo

Lidarがクルマの眼となる

センサー群の中で中心となるのがLidarだ。Lidarはレーザースキャナーでクルマ周囲のオブジェクトを3Dで把握する。つまり、Lidarは歩行者と人の写真を区別できる。更に、Lidarは静止しているオブジェクトを把握し、距離を精密に測定する。クルマは複雑な市街地を走行し、様々なオブジェクトを検知する必要がある。WaymoのLidarはブラインドスポットが無く、クルマ周囲の歩行者全員を検知できる。また、解像度が高く、歩行者がどちらを向いているかも判定できる。これにより歩行者の行動予測精度が大幅に向上した。

出典: Waymo

Short Range Lidar

Waymoは三種類のLidarを搭載している。一つは「Short Range Lidar」でクルマの前後左右四か所に設置され、周囲のオブジェクトを認識する (上の写真、後部バンパーと右側前方の円筒状の装置)。クルマのすぐ近くにいる小さな子供などを把握する。解像度は高く、自転車に乗っている人のハンドシグナルを読み取ることができる。

Long Range Lidar

もう一つは「Long Range Lidar」 (上の写真、屋根の上のドームの内部に搭載) で遠方にあるオブジェクトにズームインすることができる。フットボール二面先のヘルメットを識別できる精度となる。これ以上の説明はないがWaymoが申請した特許 (下の写真、資料の一部) を読むとLong Range Lidarはユニークな構造となっている。

特許資料によるLong Range Lidarの構造

Long Range Lidarは通常のLidarと可変式のLidarの二つのモジュールから構成される。通常のLidarは固定式で設定された範囲をスキャンする。可変式のLidarはFOV (視野、レーザービームがスキャンする角度) を変えることができる。ズームレンズで特定部分をクローズアップするように、可変式Lidarは発光するレーザービームを狭い範囲に絞り込み、遠方の小さなオブジェクトも判定できるようにする。ただ、この特許が実際の製品にどのように実装されているかは、Waymoの説明を待つ必要がある。

出典: Waymo

Vision Systemはカメラの集合体

Waymoは独自のVision Systemを開発した (一つ前の写真、屋根の上のドームに搭載される)。Vision Systemとはダイナミックレンジの広いカメラの集合体で、8つのVision Moduleから構成され、クルマの周囲360度をカバーする。信号機や道路標識を読むために使われる。Vision Moduleは複数の高精度センサーから成り、ロードコーンのような小さなオブジェクトを遠方から検知できる。

暗いところから明るいところまで見える

Vision Systemはダイナミックレンジが広く、暗いところから明るいところまでイメージを認識できる。暗がりの駐車場から直射日光を受けるまぶしい場面まで幅広く使える。通常のカメラは人間と同じように光の状態により見えにくい状態が発生する。Vision Systemはこの問題を解決するために開発され、太陽光が直接カメラに入る状態でもオブジェクトを把握できる。

Radarを大幅に改良

Waymoは20年にわたり技術進化がないRadarを大幅に改良した。通常のRadarは前方の狭い範囲をカバーするが、WaymoのRadarはクルマの周囲360度を連続してカバーする (一つ前の写真、前方側面と屋根後部のウイング状のデバイス)。雨や霧や雪の時に、Radarは他のセンサーを補完する。また、通常のRadarは車両の動きを把握するために使われるが、WaymoのRadarは車両以外に歩行者や自転車も検知する。移動速度が遅いオブジェクトについても高精度で検知できる。

走行距離とVirtual Miles

Waymoの自動運転車は累積で250万マイル走行した。市街地を中心に走行試験を重ねており、今年5月には300万マイルに達する。路上試験に加えWaymoはシミュレータで走行試験を重ね、2016年だけで10億マイルを走行した。シミュレータでは様々な走行状態を再現できる。ここでクルマにとって難しい状態や稀にしか発生しない事態をシミュレータで生成する。シミュレータでの走行がソフトウェアの改良に寄与している。

安全性が格段に向上

自動運転車の性能はどれだけの距離をドライバーの関与なしに自動走行できたかで決まる。試験走行中にドライバーが自動モードを解除することをDisengageと呼ぶ。Disengageの回数が少ないほど安全性が高いという関係になり、1000マイル走行して何回Disengageが発生したかという指標で評価される。2015年は0.80回で2016年は0.20回と大幅に改善しており、安全性が順調に改善されているのが分かる。ただ、2016年の数字は5000マイルごとに問題が発生しているとも解釈でき、製品として出荷するには更なる改良が求められる。

Lidarの価格が劇的に下がる

WaymoはLidarのコストを大幅に下げることに成功したと発表した。前述Velodyne社製のLidarより90%安い価格で提供する。Velodyne製Lidarの価格が75,000ドルであるが、Waymo製Lidarの価格は7,500ドルと大幅に安くなる。これにより自動運転車開発でセンサーの選択肢が大きく変わる。Lidar価格が高いためカメラを代用している企業も少なくない。Lidarの価格破壊で自動運転技術方式が大きく変わる可能性もある。

WaymoがUberを提訴

Waymoは2017年2月、Ottoとその親会社であるUberに対して訴訟を起こした。Waymoは同社が開発したLidar技術をOttoが不正に入手したとしている。Uberは昨年、誕生して間もないOttoを6億8千万ドルで買収し、創設者であるAnthony Levandowskiを自動運転開発部門責任者に任命した。UberがOttoを買収した理由はLidar技術にあるといわれていた。LevandowskiはGoogle自動運転車開発のコアメンバーであった。Uberはこれに対しWaymoの訴訟は開発を遅らせるための手段であると述べ、全面的に対決する姿勢を見せている。自動運転車でカギを握る技術はLidarであり、訴訟の進展が市場形勢に大きな影響を及ぼす。

Googleは自動運転技術会社「Waymo」を設立、開発から事業化に向け大きく舵を切る

Wednesday, December 14th, 2016

Googleは自動運転車部門をAlphabet配下の独立会社とすることを発表した。新会社の名前は「Waymo」で「a new way forward in mobility (モビリティへの新ルート) 」を意味する。発表と同時に新会社のロゴ「W」に衣替えをした試験車両が登場し、シリコンバレーで試験走行を始めた (下の写真) 。

出典: VentureClef

研究開発から事業推進へ

自動運転車部門の最高責任者John Krafcikが2016年12月に発表した。自動運転車開発はGoogle研究所「X」で行われてきたが、これからはAlphabet配下の独立企業として継続される。今までは研究開発という色彩が濃かったが、これからは事業として評価されることになる。Waymoが開発する技術は、個人向けの車両だけでなく幅広い分野で使われる。ライドシェア、貨物運輸、公共交通のラストマイルなどが候補に挙がっている。

Fiat Chryslerとの提携

Googleは2016年5月、Fiat Chryslerと共同で自動運転車を開発すると発表した。同社のプラグインハイブリッド・ミニバンChrysler Pacifica (下の写真) に自動運転技術を搭載し試験走行を展開する。Krafcikは、次世代センサーをこれら車両に搭載しており、開発が順調に進んでいることを明らかにした。一方、Bloombergは、2017年末までにChrysler Pacificaをベースとする自動運転車でライドシェアサービスを始めるとしている。Waymoはこれに関しコメントしていないが、来年には自動運転タクシーが登場する可能性もある。

出典: Waymo

自動運転車開発を振り返る

Googleは2009年から自動運転車を開発してきた。当初はToyota Priusをベースとする車両で (下の写真)、完全自動運転車の開発を目指した。目標はドライバーが操作することなく100マイルを自動走行することであった。カリフォルニア州でこのコースを10本設定したが、数か月後には目標を達成した。

出典: Waymo

技術開発を本格的に展開

2012年にはLexus RX450hを投入し、フリーウェイで自動運転技術を開発した。開発は順調に進み、このクルマをGoogle社員に貸し出し試験を続けた。この頃、Googleは自動運転車を商用化するめどが立ち、研究開発を本格化させた。自動運転車を市街地で走らせ、歩行者や自転車や道路工事作業員などに交じって走行試験を始めた (下の写真) 。

出典: Waymo

Googleが自動運転車をデザイン

2014年にはGoogleが自動運転車の車両を設計した。これは「Prototype」 (下の写真) と呼ばれ、自動運転車のあるべき姿を具現した。PrototypeはGoogleが開発したセンサーやプロセッサーを搭載し、社内にはステアリングやブレーキ・アクセルペダルはない。完全自動運転を意識したデザインとなっている。

出典: Waymo

Paint the Town

2015年には市街地でPrototypeの走行試験を始めた。Lexusベースの自動運転車と共に、Mountain View (カリフォルニア州) とAustin (テキサス州) で試験走行を展開。Prototypeの側面には市民がデザインした街の風景がペイントされた (上の写真)。これは「Paint the Town」というプロジェクトでPrototypeが街や市民になじむことを目指した。

公道での初めてのソロ走行

2015年にはAustin市街で完全自動運転技術の実証実験が行われた。視覚障害者がPrototypeに一人で搭乗し、目的地まで走行した。Prototypeが市街地で走行試験を行う際には、Googleスタッフが搭乗し自動運転をモニターし、緊急の際は運転を取って代わる。この実証実験ではGoogleスタッフは搭乗しないで、公道での初めてのソロ走行となった。このデモは完全自動運転車が非健常者や高齢者の足代わりになることを示した。

200万マイルを完走

2016年には自動運転車の走行距離が200万マイル (320万キロ) を超えた (下の写真)。試験走行場所はKirkland(ワシントン州)とPhoenix(アリゾナ州)が加わり四か所となった。Kirklandは年間を通じ雨が多く、Phoenixは砂漠の気候である。自動運転車を様々な環境で試験する試みが進んでいる。そして2016年12月、開発部門はGoogleからAlphabetに移り、Waymoとして独立した。

出典: Waymo

自動運転車の残された課題

Waymo自動運転車は200万マイルを走行し多くの課題を解決してきた。これからは複雑な市街地を安全に走行できる技術の習得が目標となる。これは「Final 10%」と呼ばれ、残された10%の分部の開発が一番難しく、時間を要する部分となる。自動運転車は既に高度な運転技術を習得している。状況の認識能力が上がり、緊急自動車や道路工事現場などを把握できる。これにより、レーンが閉鎖されていても、道路が通行止めになっても、自動運転車は対応できる技術を習得した。

自然な運転スタイル

これからの自動運転車の課題は自然な運転スタイルの学習にある。自動運転車が加速するとき、また、ブレーキを踏むとき、どれだけスムーズに操作できるかが重要なテクニックとなる。また、他車や歩行者との距離感や、カーブを曲がる速度や角度を学んでいる。これらは微妙な運転テクニックで、乗客が安心して乗れる技術を学習している。

出典: VentureClef

ソーシャルインタラクション

自動運転車は他のドライバーや歩行者とのInteraction (意思疎通) を学習している。例えば渋滞しているレーンに入るとき、隣のクルマが前に入れてくれるかどうかの判断を迫られる。もし、入れないと判断するとスピードを落とすなどの処置が必要となる。自動運転車は他車の進路や速度や意図を高精度で予測し、追い越しや割り込みのテクニックを学んでいる。同時に、自動運転車は自分がどうしたいのか、その意図を他車に伝える技術も学んでいる。(上の写真は隣のレーンを走るWaymo自動運転車。)

自動運転車の事業化が一気に進むか

Alphabet最高経営責任者Larry Pageは自動運転車を早く事業化することを求めている。一方、開発サイドは完全自動運転車の開発には一定の時間がかかるとしている。Pageは完全自動車の完成を待てばビジネスチャンスを逃してしまうとの危機感を持っている。半自動運転車として製品化することを強く求めているとも伝えられる。Waymoとして収益が求められる中、自動運転技術が最終製品として早期に登場する可能性が高まった。

Googleは人工知能スピーカー「Home」を出荷、スマホの会話型AIが家庭に入ってきた

Friday, November 4th, 2016

Googleは人工知能スピーカー「Google Home」の出荷を開始した。会話型AI「Google Assistant」を実装し、言葉で質問すると音声で答える。AssistantはGoogle独自のスマートフォン「Google Pixel」で使われている。Googleは同じアシスタント機能をスマホと家電で展開する。Homeを使うと家の中が一気にインテリジェントになり、AI家電に大きな将来性を感じる。

出典: VentureClef

音声で操作するスピーカー

Googleは2016年11月、AIを搭載したスピーカー「Google Home」 (上の写真) の出荷を開始した。Homeは会話型AI「Google Assistant」を搭載し、音声がインターフェイスとなる。Homeは丸みを帯びた円柱形のデバイスで家庭内に置いて利用する。HomeはAmazonのヒット商品「Amazon Echo」のアイディアを踏襲している。先行しているEchoをHomeが追う展開となっている。

HomeにOk Googleと語り掛ける

Homeの上部はタッチスクリーンで、ここにLEDライトが埋め込まれている。LEDライトは利用者の声に反応して点滅する。LEDライトの様々な動きでHomeの状態を示す。タッチパネルに指で円を描くように動かすと音量を調整できる。背後にはマイクをオンオフするボタンがある。Homeは常に周囲の声を聞いており、ボタンを押すとこれがオフとなる。Homeに話しかけるときは「Ok Google」と言えば、これに続く言葉を認識する。

複雑な質問に答える

Homeは情報検索で威力を発揮する。ここが他社に比べ大きな優位点となる。例えば「what time will the sun rise」と聞くと、「the sun will rise 6:39 AM」と答える。これは簡単な質問だが、複雑なクエリーにも的確に答える。「What was the US population when NASA was established」と尋ねるとHomeは「174.9 million」とズバリ回答する。(下の写真左側はHomeに問いかけた内容で、右側はAssistantが答えた内容。)

出典: VentureClef

幅広い知識を持つ

Homeは幅広い知識を持ち、スポーツの試合結果を回答する。「who won the world series」と聞くと「the world series was won by Chicago Cubs」と答える。翻訳機能もあり、「what’s good morning in Spanish」と聞くと「Buenos días」と答える。健康管理では食事の時に食物のカロリー量を知ることができる。「how many calories in an apple」と聞くと、「there is 95 calories in one medium apple」と答える。

会社の秘書のように働く

HomeはGoogle Calendarとリンクし筆者の予定を把握している。このためHomeに「what’s my next event」と質問すると、次の打ち合わせ予定などを回答する。出張などで飛行機を予約している時は、フライトスケジュールを教えてくれる。「is my flight on time」と質問すると、飛行機が予定通りに出発するかどうかを回答する。Homeは会社の秘書のように働いてくれる。

中心機能はエンターテイメント

Homeの中心機能はエンターテイメントで、音楽やニュースをスピーカーで聞くことができる。Homeに「play music by Lady Gaga」と指示するとレディー・ガガの音楽を再生する。聞きたい音楽の題名を指定する時は「play Poker Face by Lady Gaga」と語り掛けるとポーカーフェイスを流す。ラジオ放送を聞きたいときは「Play KCSM」と放送局を指定する。この他に、CNNなどのニュース放送やNFLなどスポーツ番組もそろっている。

テレビを音声で操作する

Homeを使って圧倒的に便利だと感じるのがテレビを音声で操作する機能だ。HomeはGoogleのストリーミングデバイス「Chromecast」経由でビデオや音楽コンテンツをテレビに配信する。音楽を聴きたいときは「play music by Beyoncé on my TV」と指示すると、Google Play Musicからビヨンセの音楽がテレビで再生される (下の写真)。当然だがテレビのスピーカーで聞く音楽はHomeで聞くより迫力がある。

出典: VentureClef

テレビでビデオをみる

見たい番組を指示すると、HomeはそのコンテンツをYouTubeから探し出し、テレビにストリーミングする。Homeに「play CNN News on my TV」と指示すると、この番組がYouTubeからChromecastを経由してテレビにストリーミングされる (下の写真)。今まではスマホを操作して番組をテレビにストリーミングしていたが、音声操作で格段に便利になった。

まだ複雑な指定はできないが

YouTubeには幅広いコンテンツが揃っていて、人気チャンネル「History Channel」や「National Geographic」などをテレビにストリーミングできる。「trending videos…」と言えばいま人気上昇中のビデオが配信される。但し、見たい番組を細かく指示するのは難しい。例えば、CNBC放送でElon Muskの会見の模様を見るために「play Elon Musk on CNBC on my TV」とHomeに指示するが上手くいかない。まだ、複雑な指定はできないが、これからの機能拡張を期待する。

出典: VentureClef

検索結果をテレビで見る

Homeを使うと検索結果をテレビに表示することができる。例えば「can you show me Hubble Telescope on my TV」と指示すると、ハッブル望遠鏡についてのビデオをテレビに配信する。知りたい情報をテレビで見ることができ、Homeはエンターテイメントだけでなく教育ツールとしても使えそうだ。

Chromecastをテレビにセット

この機能を使うためには、テレビ側にChromecast挿入しておく (下の写真、円形のデバイス)。ChromecastはAndroidやブラウザーからコンテンツをテレビにストリームングするために開発された。Homeはこの仕組みを利用して、音声でChromecastを操作する。

その際、Chromecastに名前を付けておけば (筆者のケースでは「TV」)、Homeに対して「play CNN on TV」と指示するとストリーミングが始まる。Homeの機能は多彩だが、音声でのストリーミング機能は予想外に便利だ。テレビを含む家電のインターフェイスが会話型AIに進化するのは間違いない。

出典: VentureClef

スマートホームのハブ

Homeはスマートホームのハブとなり、電灯や空調などを操作する。Homeをスマートライト「Philips Hue」とリンクすると音声でLEDライトをオンオフできる。例えば「turn on living light」と指示すると、リビングルームの電灯が点灯する。HomeがサポートしているスマートデバイスはPhilips Hueの他に、NestやSmartThingsなどがある。

Homeのエコシステムは拡大中

登場したばかりのHomeで使える第三者サービスの数は限られている。音楽ではSpotifyとPandoraを、ラジオではTuneInを利用できる。配車サービスではHomeでUberを呼ぶことができる。Googleの自社サービスではGoogle Play Music とYouTube Musicを使える。ビデオではYouTubeを使うことができるが、前述の通りChromecastをテレビに接続しておく必要がある。

Amazon Echoの優位点はスキル

Google Home (下の写真左側) とAmazon Echo (同右側) はAIスピーカーとして開発され両者の機能はよく似ている。一方、先行しているEchoは幅広い第三者サービス (Skillと呼ばれる) を備えている。今では2000本近いSkillがあり、病気の診断やスマートホームのハブとして使われている。Echoに指示すれば焼き立てのピザが届く。幅広いタスクを実行できる点でEchoがHomeに差をつけている。

出典: VentureClef

Google Homeの優位点は情報検索

Google Homeは複雑な質問を理解し情報検索できる点が大きな優位点となる。更に、Homeは利用者の個人情報を幅広く把握している。HomeはGoogle CalendarやGoogle Keepと連携し、予定や備忘録を管理する。気の利く秘書のように一日の予定や出張を手助けしてくれる。また、Chromecastとリンクすることで結果をテレビに出力できる。Google Pixelのコア技術であるAssistantを家庭に展開した構造で、Google Homeに大きな将来性を感じる。

Google PixelはApple iPhoneを超えた!スマホがAIで構成される

Friday, October 28th, 2016

Googleは独自に開発したスマホ「Pixel」を投入した。ハードウェア機能が格段に向上しただけでなく、AIが利用者とのインターフェイスとなる。PixelはGoogleが運営するMVNO (仮想モバイルネットワーク) で利用できる。Googleモバイル事業はAndroidとハードウェアとネットワークを垂直に統合したモデルに進化した。Pixelを使ってみると先進的な機能に感銘を受け、これが近未来のスマホの姿を示していると実感した。

出典: Google

独自ブランドのスマートフォン

Googleは2016年10月、Googleブランドのスマートフォン「Pixel」 (上の写真) の販売を開始した。手に取ってみるとPixelはiPhoneと見間違うほど似ている。よく見るとPixelの表面にはホームボタンはなく、背後に円形の指紋センサー (Pixel Imprint) が搭載されている。ここに指をあててデバイスをアンロックする。PixelはGoogleがゼロから開発したスマホで、台湾HTCが製造する。AppleのようにGoogleがスマホ全体を開発して製品を販売する。

PixelはAIスマートフォン

Pixelは最新基本ソフト「Android 7.1」を搭載し、そこには会話型AI「Assistant」が組み込まれている。AssistantはApple Siriに相当する機能で、言葉で指示するとコンシェルジュのように応えてくれる。AIがスマホ機能の中心となり、Pixelはソフトウェアと人工知能の交点として位置づけられる。

ハードウェアの完成度が格段に向上

Pixelはハードウェアとしての完成度が格段に向上した。iPhoneのような形状となり、薄くて軽くて快適に使える。Nexusシリーズと比較すると数世代分を一気に成長した感がある。ディスプレはAMOLEDでカメラは12.3MPの解像度とf/2.0の口径を持つ。Pixelカメラは「Software-Defined Camera」と呼ばれ、ソフトウェアが驚くほどきれいな画像を創りだす。Pixelカメラの性能はiPhone 7を超えたと評価されている。

Assistantが会話を通して生活をサポート

PixelはAIスマホとして位置づけられ、Assistantはコンシェルジュのように会話を通して生活をサポートする。Pixelに対し「Ok Google」と語り掛けるとAssistantが立ち上がり、これに続く言葉を認識する。「When does the San Francisco Moma close」と質問すると、「Moma is open now, it closes at 5 pm」と答える。美術館は5時に閉館するのでまだ開いていることが分かる (下の写真左側)。Assistantは声を聞き分ける生体認証機能があり、筆者のPixelに対して他人が「Ok Google」と呼びかけれも反応しない。

出典: VentureClef

Assistantで撮影した写真を探す

Assistantは写真検索で威力を発揮する。「Show me my photos in the rain」と指示すれば、雨の日に撮影した写真を表示する (上の写真右側上段)。「Show me my pictures taken at Google campus」と指示すると、Googoleキャンパスで撮影した写真を表示する (上の写真右側下段)。音声で操作できるのでスマホでサクサク検索できる。Pixelで撮影した写真はオリジナルサイズで写真アルバム「Google Photos」に格納される。ストレージ容量の制限は無く何枚でも格納できる。

Assistantでレストランを予約する

Assistantは情報検索だけでなく指示されたタスクを実行する。レストランを予約する時はAssistantと対話しながら場所や時間などを決めていく。最後に確認画面が表示され、Yesと答えるとレストランアプリ「OpenTable」で予約が完了する。電話で話すように驚くほど簡単にレストランの予約ができる。また、Assistantは一日のスケジュールを管理する。「What’s next on my calendar」と質問するとAssistantは次の予定を回答する。ここでは予約したレストランの概要が示された (下の写真左側)。

出典: VentureClef

Assistantでアプリを操作する

AssistantはPixelアプリを操作できる。つまり、搭載しているアプリを音声で利用できる。Assistantに「Katy Perry on Instagram」と指示すると、インスタグラムのPerryのページを開く (上の写真右側)。また、「Open Snapchat」と指示すると、スナップチャットが起動してメッセージを読むことができる (下の写真左側)。Assistantに「Play music by Beyoncé」と指示すると、音楽アプリ「Google Music」が起動しビヨンセの音楽を再生する (下の写真右側)。Assistantの音声認識精度は高く、言葉でスマホを操作できるのはとても便利だ。

出典: VentureClef

カメラの性能が業界トップ

Pixelの最大の特長はカメラの性能が業界トップであることだ。カメラの性能は「DxOMark」のベンチマーク指標が使われる。これによるとPixelカメラは89ポイントをマークし、Apple iPhone 7の86ポイントを上回った。今までのトップはSamsung Galaxy S7 Edgeなどで88ポイントをマークしているがPixelがこれを追い越した。DxOMarkはカメラ、レンズ、スマホカメラの性能を評価するサイトでDxO Labs.が運営している。同社は光学関連のソフトウェアやデバイスを開発するフランス企業。

イメージング処理ソフトウェアの威力

Pixelカメラの性能がトップとなった理由はイメージング処理ソフトウェアのアルゴリズムにある。カメラはGoogle独自のハイダイナミックレンジイメージング機能「HDR+」を搭載する。この機能によりダイナミックレンジが広がり、明るい箇所から暗い箇所までバランスよく撮影できる。下の写真はその事例で、厳しい逆光のもとGoogle本社ビルを撮影したもの。肉眼では真っ黒に見えたガラス張りのビルが内部まで写っている。同時に、背後の青空とまぶしい雲がちゃんと写っている。HDR+の威力を感じる一枚となった。

出典: VentureClef

HDRとは

HDR (High Dynamic Range) イメージングとは、異なる露出の複数枚の写真を組み合わせて一枚の写真を生成する技術を指す。一般にHDRは被写体に対して三枚の写真を使う。Underexposure (露出アンダー)、Overexposure (露出オーバー)、及びBalanced (適正露出) の三枚の写真を撮影し、ここから最適な部分を抽出し、これをつなぎ合わせて一枚の写真を生成する。

HDR+とは

これに対してPixelのHDR+は同じ露出の写真を多数枚組み合わせて一枚の写真を生成する。Pixelはカメラアプリを開いた時から撮影を始め、シャッターが押されたポイントを撮りたいシーンと理解する。露出を上げないので暗い部分はノイズが乗ることになる。しかし、暗い部分の写真を数多く重ね合わせることで数学的にノイズを減らす。この手法により、重ね合わせがシンプルになり、ゴーストが発生しないという特徴がある。下の写真はまぶしい雲を背景に星条旗が風にたなびいているが、ゴーストは発生していなく細部まで写っている。

出典: VentureClef

Software-Defined Camera

Pixelカメラは特殊なハードウェア機構は備えていない。Googleはコモディティカメラを使いソフトウェアでイメージング技術を向上させるアプローチを取る。これは「Software-Defined Camera」と呼ばれソフトウェアがカメラの性能や特性を決定する。一眼レフカメラは高価なハードウェアで1枚だけ撮影する。これに対しGoogleは安価なカメラで大量の写真を撮影してソフトウェアで最適化する。イメージング技術はAIを含むアルゴリズムが勝敗を決める。

音声で写真撮影

Pixelカメラは音声で写真を撮影できる。これはAssistantの一部で、フロントカメラで自撮りする時は、「Ok Google, take a selfie」と語るとシャッターが下りる。腕を伸ばして難しい姿勢でシャッターを押す必要はない。メインカメラで写真撮影をするときも、「Ok Google, take a picture」と言えばシャッターが下りる。タイマーを使う代わりに音声で集合写真を撮影できる。メインカメラからフロントカメラに切り替えるときは、Pixelを縦に持ち二回ひねる。

指紋センサー

Pixelをアンロックする時には指紋認証を使う。上述の通りPixelにはホームボタンはなく、背後の指紋センサーに指をかざす。片手で操作でき、かつ、スリープ状態から直接アンロックできるのでとても便利。Pixelは指紋認証の認識率が非常に高く、殆どのケースで1~2回程度でアンロックできる。指紋で認証できないときはPINなど従来方式の認証を行う。

Googleが独自のネットワークを運営

Pixelは米国最大のキャリアVerizonが販売している。また、Google独自のネットワーク「Fi Network」を使うこともできる。Fi NetworkはMVNO (仮想モバイルネットワーク) 方式のネットワークで、背後でSprintとT-Mobile USの4G LTEが使われている。Fi Networkを利用する時は専用のSIM Cardを挿入する。PixelはGoogleオリジナルのスマホをGoogleネットワークで運用する構造となっている。

Fi Networkの特徴

Fi Networkは単に通信網を提供するだけでなく、両者のうち電波強度の強いネットワークに自動で接続する。また、LTEやWiFiなど異なるネットワーク間で最適な通信網を選択し、サービスを途切れなく利用できる。屋内では通話やテキストメッセージはWiFi経由で交信する。屋外に出るとGoogleの移動体ネットワークFi Networkに接続される。

出典: VentureClef

ネットワーク間での自動切換え

このためネットワーク間で途切れなくサービスを利用できる。自宅でWiFi経由で電話している時、屋外に出るとネットワークがLTEに切り替わる (上の写真左側)。通話は途切れることなくシームレスにハンドオーバーされる。通話だけでなくデータ通信でも自動でネットワークが切り替わる。自宅のWiFiでGoogleの音楽ストリーミングを聞きながらクルマで屋外に出るとFi Networkに切り替わる (上の写真右側)。

出典: VentureClef

クルマの中でAssistantが大活躍

クルマの中では言葉でAssistantに指示して好みの音楽を聴ける。電話やメッセージもAssistantに言葉で指示して発信する。ナビゲーションもAssistantに言葉で語り掛けて使う。少し大きめの声で語り掛ける必要はあるが、Assistantは運転中に絶大な威力を発揮する。今ではPixelはドライブに必須のインフォテイメントデバイスとなった。

シンプルで良心的な料金体系

Fi Networkの料金体系はシンプルで基本料金とデータ料金の組み合わせで構成される。基本料金は月額20ドルで、ここに通話、テキストなどが含まれる。データ通信は月額10ドル/GBで、例えば2GBで契約すると月額20ドルとなる。制限量まで使っていない場合は、翌月分の料金から差し引かれる、良心的な料金体系となっている (上の写真左側)。またデータ通信料はグラフで示され (上の写真右側) 使用量を明確に把握できる。(ロックスクリーン左上にFi Networkと表示される、下の写真左側。アイコンは小さめの円形になりホームスクリーンのデザインがすっきりした、下の写真右側。)

出典: VentureClef

Samsungとの関係は微妙

Googleのモバイル事業はAndroidを開発しこれをパートナー企業に提供することで成り立っている。SamsungなどがAndroidを利用してスマホを販売している。このためスマホ事業はSamsungなどに依存しているだけでなく、Googleの収益構造が問われてきた。事業が拡大するのはSamsungでGoogleは大きな収益を上げることが難しい状態が続いている。GoogleがPixelでスマホ事業に乗り出すことで、Appleのような垂直統合型となり、収益構造も改善すると期待される。一方、Android陣営内でGalaxy顧客がPixelに乗り換えることも予想され、Samsungなどパートナー企業との関係が難しくなる。

ソフトウェア+デバイス+ネットワーク

Googleは基本ソフト (Android) とデバイス (Pixel) だけでなく、ネットワーク (Fi Network) を含めた垂直統合システムでモバイル事業を始めた。Appleのようにスマホを販売するだけでなく、それを運用するネットワークも提供する。キャリアが提供するネットワーク単体では技術進化が停滞している。Googleはデバイスとそれをつなぐネットワークを統合することでイノベーションを起こせるとしている。AIスマホを独自のネットワークで結び、Googleはスマホ事業の近未来の姿を示している。

GoogleはAIメッセージング「Allo」をリリース、仮想アシスタントとの対話は近未来のライフスタイルを感じる

Saturday, September 24th, 2016

Googleは2016年9月、AIを搭載したメッセージングアプリ「Allo」をリリースした。AlloはLineのようにテキストやマルチメディアを使って会話するメッセンジャーとして位置づけられる。これに加え、Alloは仮想アシスタント「Google Assistant」を搭載しているのが最大の特徴 (下の写真左側)。仮想アシスタントとは会話型AIで、コンシェルジュのように対話しながら応対してくれる。使ってみると、まだまだ開発途上であるが、会話型AIが巨大ビジネスに成長する兆しを感じる。

Googleはメッセージング市場で苦戦

メッセージング市場ではFacebook MessengerとSnapchatが先行し、AppleがMessageでこれを追っている。日本ではLineがトップを走り世界市場を目指している。Googleはメッセージングプラットフォーム「Hangouts」を運用しているが苦戦を強いられている。Googleは新たに、Alloを投入しAIを基軸に製品ラインアップを大幅に見直している。

メッセージングの表現力が豊かになる

この市場で勝つためには若者層を引き付ける必要がある。Alloは表現力が豊かで、メッセージをグラフィカルに示する。これは「Whisper or Shout」と呼ばれ、メッセージ欄のスライドを上下してテキストの大きさを変更できる。上にあげると文字やシンボルが大きくなる (下の写真右側上段)。またAlloオリジナルのStickerが数多く揃っており、メッセージで表現できる幅が広がった。 (上の写真右側下段)。

返信文を自動で生成

Alloは受信メッセージを読み、これを理解して、自動で返信文を生成する。これは「Smart Reply」と呼ばれる。「Do you like to drive」とのメッセージを受信すると、それに対してAlloはリアルタイムで「Sure」、「Yes」、「No」の返信文を生成する (下の写真左側)。自分でタイプする必要はなく、ボタンにタッチするだけで返信でき大変便利。Smart Replyは既にメール「Inbox」で導入され人気の機能となっている。

写真に対しても返信文を生成

AlloのSmart Replyはテキストだけでなく写真に対しても使える。空港で撮影した飛行機の写真を受信すると、Alloは「Nice plane」、「Have a nice flight」、「Bon voyage!」と返信文を生成する (上の写真右側)。Alloは高度なイメージ認識能力を持っている。ひまわりの写真を受信すると、Alloは「Beautiful」、「Nice sunflower」、「Pretty」と返信文を生成する (下の写真左側)。Alloは花だけでなく、この花がひまわりであることを把握する。花の種別を判定するには高度な技術を要し、この背後にはニューラルネットワークが使われている。

利用者のスタイルを反映した返信文

しかしAlloは食べ物の写真についてはうまく判定できない。サラダの写真に対し、「Yummy!」、「Wish I could try」と返信文を生成する (上の写真右側)。Alloはこれは食べ物であると理解するが料理の種類までは特定できない。Googleはイメージ認識技術で世界のトップを走っており、料理の種類を認識することは容易い。近々にこの機能がAlloに実装されると思われる。Alloは機械学習を重ねることで利用者の表現方法を学んでいく。利用者のスタイルを反映した返信文を作成できるようになる。

Assistantが手助けする

Alloの最大の特徴は仮想アシスタントGoogle Assistantをメッセージングに導入したこと。Assistantがコンシェルジュのように、会話しながら生活の手助けをする。Assistantは利用者同士のチャットを聞いており、手助けが必要と判断すると会話に割り込みアドバイスする。背後で会話を聞かれているのは奇異な気がするが、使ってみると便利な機能であることに気付く。

Assistantがレストランを教えてくれる

今日はイタリア料理を食べようと話していると、Assistantが気を利かせて近所のイタリア料理店を紹介する。友人に「Let’s go for Italian food」とメッセージを送ると、Assistantはコンテキスト理解してして「Italian food places nearby」と語り、近所のイタリア料理店を紹介する (下の写真左側)。ここではGoogle Knowledge Graph機能が使われている。

レストランのカードにタッチするとその詳細情報が表示され、店舗内の写真などをみることができる。気に入ればこのレストランをそのまま予約できる。ただ、レストランを予約するには専用アプリ「OpenTable」を起動し、ここから予約する仕組みとなる (下の写真右側)。まだ、Alloから直接予約することはできなくて、別アプリで実行することになる。Assistantと会話しながらタスクを実行できれば生活が格段に便利になる。

Assistantとの直接対話

友人との会話を離れ、直接Assistantと対話することができる。Assistantに指示すれば有能な秘書のようにこれに答えてくれる。「Cute dog pictures」と指示すると、Assistantは「Check out these pictures」と述べ、可愛い犬の写真を探してくる。更に「Cute puppy images」と指示すると、子犬の写真を表示する。ここではGoogle Image Searchの検索結果が使われている。

Assistantがこなせるタスク

Assistantは対応できるタスクをカードとして示する。それらは「Subscription (ニュース購読)」、「Action (タイマーセットなど)」、「Fun (ゲームなど)」、「Translation (翻訳)」、「Weather (天気予報)」、「Travel (旅行案内)」、「Sports (スポーツニュース)」、「Answer (Q&A)」、「My Assistant (Assistantの自己紹介)」となる。

旅行案内で格安フライトを探す

Travelカードにタッチすると旅行関連の情報が表示される。フライトを探すときには「Flights to New York」と指示すると、現在地 (San Francisco) からNew Yorkまでの航空運賃が表示される。条件で絞り込んで希望のフライトを探す。また、到着地のホテルの検索もできる。ここでもフライトやホテルの予約はリンク先のウェブサイトで行う。まだ、Assistantから直接予約することはできない。

一日のスケジュールを管理

Assistantは利用者のスケジュールを把握しており、秘書のように会議予定などを管理をする。例えば、「Show my flights」と指示すると、予約しているフライト情報を表示する (下の写真左側)。また、「What’s my next meeting」と言えば、今日の予定を表示する (下の写真右側)。Assistantは忙しい生活の中でなくてはならない存在になりつつある。AssistantはGoogle Calendarとリンクしスケジュールを把握している。

AlloとGoogle音声検索

Alloはメッセージング機能では目新しさを感じないが、Assistantの会話型AIは便利であると感じる。Assistantがインターフェイスとなり対話を通してGoogleを利用する。ただ、Assistant機能の多くはGoogle音声検索からも使える。Googleに「What’s my schedule today?」語り掛けると、今日のスケジュールを教えてくれる。音声検索とAlloでできることに大きな違いはないが、Alloは会話を通して利用者とインタラクションする点が大きく異なる。検索結果が表示されそこで会話が止まるのではなく、連続して対話が進む点が大きな特徴となる。

メッセージを暗号化して送る

Alloはセキュリティにも配慮している。匿名モード「Incognito Mode」を選択すると、Alloのメッセージは暗号化される (下の写真左側)。また、メッセージは指定時間だけ表示され、制限時間を過ぎると消去される。例えば、相手に送るメッセージは10秒間だけ表示されるよう設定することもできる (下の写真右側)。この方式はSnapchatなどで人気を呼び、ティーンエイジャーから圧倒的な支持を得ている。きわどい内容のメッセージでも記録に残らないので、安心して伝えることができるためである。

通常モードのメッセージの安全性

つまり、Alloの通常モードのメッセージは暗号化されているわけではない。ハッシュ処理 (HTTPSのプロトコール) で最低限のセキュリティは確保されるが、Alloはハッカーによる盗聴に対して弱点がある。ただ、Alloだけでなく、Facebook Messengerも同様に、暗号化オプション (Secret Conversation) を指定しない限りメッセージは暗号化されない。前述の通り、Alloは利用者のメッセージを背後で聞いており、メッセージが暗号化されるとこの機能が使えない。

データ保存とAI開発

Googleは当初、Alloで交わされるメッセージを一時的に利用するが、長期的にサーバに保管することはないと述べていた。しかし、Googleはこの指針を変え、Alloで交わされたメッセージを長期間保管する。目的はアルゴリズムの開発で、保管されたデータを使ってAIを教育する。AIがインテリジェントになるためにはデータがカギを握る。メッセージングデータがAI開発の宝の山で、Googleは長期間保管に踏み切った。

プライバシー保護とクールな機能

これに対して市場からは懸念の声も聞かれる。米国国防総省諜報機関の元職員Edward SnowdenはAlloを使わないように呼び掛けている。Googleが保管するメッセージングデータが犯罪捜査などで利用されることを懸念しているためだ。個人のプライバシー保護に配慮するのは当然であるが、厳しすぎるとAIが提供する便利な機能の恩恵を受けられない。プライバシー保護とクールな機能のバランスが難しい。

インターフェイスに温かみを感じる

Alloは「Preview Edition」と表示されているように、使ってみると開発途上のベータ版との印象を受ける。まだまだ生活するうえでの必須ツールとは言い難い。一方、Alloは人間とマシンの関係で大きな将来性を感じる。Assistantと対話できることでインターフェイスに温かみを感じる。音声検索で機械的に結果を表示されるのとは異なり、言葉を交わしながら目的を達成できるのはフューチャリスティックでもある。対話型AIが巨大ビジネスに成長する兆しを感じる。