Archive for the ‘モバイル’ Category

Google PixelはApple iPhoneを超えた!スマホがAIで構成される

Friday, October 28th, 2016

Googleは独自に開発したスマホ「Pixel」を投入した。ハードウェア機能が格段に向上しただけでなく、AIが利用者とのインターフェイスとなる。PixelはGoogleが運営するMVNO (仮想モバイルネットワーク) で利用できる。Googleモバイル事業はAndroidとハードウェアとネットワークを垂直に統合したモデルに進化した。Pixelを使ってみると先進的な機能に感銘を受け、これが近未来のスマホの姿を示していると実感した。

出典: Google

独自ブランドのスマートフォン

Googleは2016年10月、Googleブランドのスマートフォン「Pixel」 (上の写真) の販売を開始した。手に取ってみるとPixelはiPhoneと見間違うほど似ている。よく見るとPixelの表面にはホームボタンはなく、背後に円形の指紋センサー (Pixel Imprint) が搭載されている。ここに指をあててデバイスをアンロックする。PixelはGoogleがゼロから開発したスマホで、台湾HTCが製造する。AppleのようにGoogleがスマホ全体を開発して製品を販売する。

PixelはAIスマートフォン

Pixelは最新基本ソフト「Android 7.1」を搭載し、そこには会話型AI「Assistant」が組み込まれている。AssistantはApple Siriに相当する機能で、言葉で指示するとコンシェルジュのように応えてくれる。AIがスマホ機能の中心となり、Pixelはソフトウェアと人工知能の交点として位置づけられる。

ハードウェアの完成度が格段に向上

Pixelはハードウェアとしての完成度が格段に向上した。iPhoneのような形状となり、薄くて軽くて快適に使える。Nexusシリーズと比較すると数世代分を一気に成長した感がある。ディスプレはAMOLEDでカメラは12.3MPの解像度とf/2.0の口径を持つ。Pixelカメラは「Software-Defined Camera」と呼ばれ、ソフトウェアが驚くほどきれいな画像を創りだす。Pixelカメラの性能はiPhone 7を超えたと評価されている。

Assistantが会話を通して生活をサポート

PixelはAIスマホとして位置づけられ、Assistantはコンシェルジュのように会話を通して生活をサポートする。Pixelに対し「Ok Google」と語り掛けるとAssistantが立ち上がり、これに続く言葉を認識する。「When does the San Francisco Moma close」と質問すると、「Moma is open now, it closes at 5 pm」と答える。美術館は5時に閉館するのでまだ開いていることが分かる (下の写真左側)。Assistantは声を聞き分ける生体認証機能があり、筆者のPixelに対して他人が「Ok Google」と呼びかけれも反応しない。

出典: VentureClef

Assistantで撮影した写真を探す

Assistantは写真検索で威力を発揮する。「Show me my photos in the rain」と指示すれば、雨の日に撮影した写真を表示する (上の写真右側上段)。「Show me my pictures taken at Google campus」と指示すると、Googoleキャンパスで撮影した写真を表示する (上の写真右側下段)。音声で操作できるのでスマホでサクサク検索できる。Pixelで撮影した写真はオリジナルサイズで写真アルバム「Google Photos」に格納される。ストレージ容量の制限は無く何枚でも格納できる。

Assistantでレストランを予約する

Assistantは情報検索だけでなく指示されたタスクを実行する。レストランを予約する時はAssistantと対話しながら場所や時間などを決めていく。最後に確認画面が表示され、Yesと答えるとレストランアプリ「OpenTable」で予約が完了する。電話で話すように驚くほど簡単にレストランの予約ができる。また、Assistantは一日のスケジュールを管理する。「What’s next on my calendar」と質問するとAssistantは次の予定を回答する。ここでは予約したレストランの概要が示された (下の写真左側)。

出典: VentureClef

Assistantでアプリを操作する

AssistantはPixelアプリを操作できる。つまり、搭載しているアプリを音声で利用できる。Assistantに「Katy Perry on Instagram」と指示すると、インスタグラムのPerryのページを開く (上の写真右側)。また、「Open Snapchat」と指示すると、スナップチャットが起動してメッセージを読むことができる (下の写真左側)。Assistantに「Play music by Beyoncé」と指示すると、音楽アプリ「Google Music」が起動しビヨンセの音楽を再生する (下の写真右側)。Assistantの音声認識精度は高く、言葉でスマホを操作できるのはとても便利だ。

出典: VentureClef

カメラの性能が業界トップ

Pixelの最大の特長はカメラの性能が業界トップであることだ。カメラの性能は「DxOMark」のベンチマーク指標が使われる。これによるとPixelカメラは89ポイントをマークし、Apple iPhone 7の86ポイントを上回った。今までのトップはSamsung Galaxy S7 Edgeなどで88ポイントをマークしているがPixelがこれを追い越した。DxOMarkはカメラ、レンズ、スマホカメラの性能を評価するサイトでDxO Labs.が運営している。同社は光学関連のソフトウェアやデバイスを開発するフランス企業。

イメージング処理ソフトウェアの威力

Pixelカメラの性能がトップとなった理由はイメージング処理ソフトウェアのアルゴリズムにある。カメラはGoogle独自のハイダイナミックレンジイメージング機能「HDR+」を搭載する。この機能によりダイナミックレンジが広がり、明るい箇所から暗い箇所までバランスよく撮影できる。下の写真はその事例で、厳しい逆光のもとGoogle本社ビルを撮影したもの。肉眼では真っ黒に見えたガラス張りのビルが内部まで写っている。同時に、背後の青空とまぶしい雲がちゃんと写っている。HDR+の威力を感じる一枚となった。

出典: VentureClef

HDRとは

HDR (High Dynamic Range) イメージングとは、異なる露出の複数枚の写真を組み合わせて一枚の写真を生成する技術を指す。一般にHDRは被写体に対して三枚の写真を使う。Underexposure (露出アンダー)、Overexposure (露出オーバー)、及びBalanced (適正露出) の三枚の写真を撮影し、ここから最適な部分を抽出し、これをつなぎ合わせて一枚の写真を生成する。

HDR+とは

これに対してPixelのHDR+は同じ露出の写真を多数枚組み合わせて一枚の写真を生成する。Pixelはカメラアプリを開いた時から撮影を始め、シャッターが押されたポイントを撮りたいシーンと理解する。露出を上げないので暗い部分はノイズが乗ることになる。しかし、暗い部分の写真を数多く重ね合わせることで数学的にノイズを減らす。この手法により、重ね合わせがシンプルになり、ゴーストが発生しないという特徴がある。下の写真はまぶしい雲を背景に星条旗が風にたなびいているが、ゴーストは発生していなく細部まで写っている。

出典: VentureClef

Software-Defined Camera

Pixelカメラは特殊なハードウェア機構は備えていない。Googleはコモディティカメラを使いソフトウェアでイメージング技術を向上させるアプローチを取る。これは「Software-Defined Camera」と呼ばれソフトウェアがカメラの性能や特性を決定する。一眼レフカメラは高価なハードウェアで1枚だけ撮影する。これに対しGoogleは安価なカメラで大量の写真を撮影してソフトウェアで最適化する。イメージング技術はAIを含むアルゴリズムが勝敗を決める。

音声で写真撮影

Pixelカメラは音声で写真を撮影できる。これはAssistantの一部で、フロントカメラで自撮りする時は、「Ok Google, take a selfie」と語るとシャッターが下りる。腕を伸ばして難しい姿勢でシャッターを押す必要はない。メインカメラで写真撮影をするときも、「Ok Google, take a picture」と言えばシャッターが下りる。タイマーを使う代わりに音声で集合写真を撮影できる。メインカメラからフロントカメラに切り替えるときは、Pixelを縦に持ち二回ひねる。

指紋センサー

Pixelをアンロックする時には指紋認証を使う。上述の通りPixelにはホームボタンはなく、背後の指紋センサーに指をかざす。片手で操作でき、かつ、スリープ状態から直接アンロックできるのでとても便利。Pixelは指紋認証の認識率が非常に高く、殆どのケースで1~2回程度でアンロックできる。指紋で認証できないときはPINなど従来方式の認証を行う。

Googleが独自のネットワークを運営

Pixelは米国最大のキャリアVerizonが販売している。また、Google独自のネットワーク「Fi Network」を使うこともできる。Fi NetworkはMVNO (仮想モバイルネットワーク) 方式のネットワークで、背後でSprintとT-Mobile USの4G LTEが使われている。Fi Networkを利用する時は専用のSIM Cardを挿入する。PixelはGoogleオリジナルのスマホをGoogleネットワークで運用する構造となっている。

Fi Networkの特徴

Fi Networkは単に通信網を提供するだけでなく、両者のうち電波強度の強いネットワークに自動で接続する。また、LTEやWiFiなど異なるネットワーク間で最適な通信網を選択し、サービスを途切れなく利用できる。屋内では通話やテキストメッセージはWiFi経由で交信する。屋外に出るとGoogleの移動体ネットワークFi Networkに接続される。

出典: VentureClef

ネットワーク間での自動切換え

このためネットワーク間で途切れなくサービスを利用できる。自宅でWiFi経由で電話している時、屋外に出るとネットワークがLTEに切り替わる (上の写真左側)。通話は途切れることなくシームレスにハンドオーバーされる。通話だけでなくデータ通信でも自動でネットワークが切り替わる。自宅のWiFiでGoogleの音楽ストリーミングを聞きながらクルマで屋外に出るとFi Networkに切り替わる (上の写真右側)。

出典: VentureClef

クルマの中でAssistantが大活躍

クルマの中では言葉でAssistantに指示して好みの音楽を聴ける。電話やメッセージもAssistantに言葉で指示して発信する。ナビゲーションもAssistantに言葉で語り掛けて使う。少し大きめの声で語り掛ける必要はあるが、Assistantは運転中に絶大な威力を発揮する。今ではPixelはドライブに必須のインフォテイメントデバイスとなった。

シンプルで良心的な料金体系

Fi Networkの料金体系はシンプルで基本料金とデータ料金の組み合わせで構成される。基本料金は月額20ドルで、ここに通話、テキストなどが含まれる。データ通信は月額10ドル/GBで、例えば2GBで契約すると月額20ドルとなる。制限量まで使っていない場合は、翌月分の料金から差し引かれる、良心的な料金体系となっている (上の写真左側)。またデータ通信料はグラフで示され (上の写真右側) 使用量を明確に把握できる。(ロックスクリーン左上にFi Networkと表示される、下の写真左側。アイコンは小さめの円形になりホームスクリーンのデザインがすっきりした、下の写真右側。)

出典: VentureClef

Samsungとの関係は微妙

Googleのモバイル事業はAndroidを開発しこれをパートナー企業に提供することで成り立っている。SamsungなどがAndroidを利用してスマホを販売している。このためスマホ事業はSamsungなどに依存しているだけでなく、Googleの収益構造が問われてきた。事業が拡大するのはSamsungでGoogleは大きな収益を上げることが難しい状態が続いている。GoogleがPixelでスマホ事業に乗り出すことで、Appleのような垂直統合型となり、収益構造も改善すると期待される。一方、Android陣営内でGalaxy顧客がPixelに乗り換えることも予想され、Samsungなどパートナー企業との関係が難しくなる。

ソフトウェア+デバイス+ネットワーク

Googleは基本ソフト (Android) とデバイス (Pixel) だけでなく、ネットワーク (Fi Network) を含めた垂直統合システムでモバイル事業を始めた。Appleのようにスマホを販売するだけでなく、それを運用するネットワークも提供する。キャリアが提供するネットワーク単体では技術進化が停滞している。Googleはデバイスとそれをつなぐネットワークを統合することでイノベーションを起こせるとしている。AIスマホを独自のネットワークで結び、Googleはスマホ事業の近未来の姿を示している。

GoogleはAIメッセージング「Allo」をリリース、仮想アシスタントとの対話は近未来のライフスタイルを感じる

Saturday, September 24th, 2016

Googleは2016年9月、AIを搭載したメッセージングアプリ「Allo」をリリースした。AlloはLineのようにテキストやマルチメディアを使って会話するメッセンジャーとして位置づけられる。これに加え、Alloは仮想アシスタント「Google Assistant」を搭載しているのが最大の特徴 (下の写真左側)。仮想アシスタントとは会話型AIで、コンシェルジュのように対話しながら応対してくれる。使ってみると、まだまだ開発途上であるが、会話型AIが巨大ビジネスに成長する兆しを感じる。

Googleはメッセージング市場で苦戦

メッセージング市場ではFacebook MessengerとSnapchatが先行し、AppleがMessageでこれを追っている。日本ではLineがトップを走り世界市場を目指している。Googleはメッセージングプラットフォーム「Hangouts」を運用しているが苦戦を強いられている。Googleは新たに、Alloを投入しAIを基軸に製品ラインアップを大幅に見直している。

メッセージングの表現力が豊かになる

この市場で勝つためには若者層を引き付ける必要がある。Alloは表現力が豊かで、メッセージをグラフィカルに示する。これは「Whisper or Shout」と呼ばれ、メッセージ欄のスライドを上下してテキストの大きさを変更できる。上にあげると文字やシンボルが大きくなる (下の写真右側上段)。またAlloオリジナルのStickerが数多く揃っており、メッセージで表現できる幅が広がった。 (上の写真右側下段)。

返信文を自動で生成

Alloは受信メッセージを読み、これを理解して、自動で返信文を生成する。これは「Smart Reply」と呼ばれる。「Do you like to drive」とのメッセージを受信すると、それに対してAlloはリアルタイムで「Sure」、「Yes」、「No」の返信文を生成する (下の写真左側)。自分でタイプする必要はなく、ボタンにタッチするだけで返信でき大変便利。Smart Replyは既にメール「Inbox」で導入され人気の機能となっている。

写真に対しても返信文を生成

AlloのSmart Replyはテキストだけでなく写真に対しても使える。空港で撮影した飛行機の写真を受信すると、Alloは「Nice plane」、「Have a nice flight」、「Bon voyage!」と返信文を生成する (上の写真右側)。Alloは高度なイメージ認識能力を持っている。ひまわりの写真を受信すると、Alloは「Beautiful」、「Nice sunflower」、「Pretty」と返信文を生成する (下の写真左側)。Alloは花だけでなく、この花がひまわりであることを把握する。花の種別を判定するには高度な技術を要し、この背後にはニューラルネットワークが使われている。

利用者のスタイルを反映した返信文

しかしAlloは食べ物の写真についてはうまく判定できない。サラダの写真に対し、「Yummy!」、「Wish I could try」と返信文を生成する (上の写真右側)。Alloはこれは食べ物であると理解するが料理の種類までは特定できない。Googleはイメージ認識技術で世界のトップを走っており、料理の種類を認識することは容易い。近々にこの機能がAlloに実装されると思われる。Alloは機械学習を重ねることで利用者の表現方法を学んでいく。利用者のスタイルを反映した返信文を作成できるようになる。

Assistantが手助けする

Alloの最大の特徴は仮想アシスタントGoogle Assistantをメッセージングに導入したこと。Assistantがコンシェルジュのように、会話しながら生活の手助けをする。Assistantは利用者同士のチャットを聞いており、手助けが必要と判断すると会話に割り込みアドバイスする。背後で会話を聞かれているのは奇異な気がするが、使ってみると便利な機能であることに気付く。

Assistantがレストランを教えてくれる

今日はイタリア料理を食べようと話していると、Assistantが気を利かせて近所のイタリア料理店を紹介する。友人に「Let’s go for Italian food」とメッセージを送ると、Assistantはコンテキスト理解してして「Italian food places nearby」と語り、近所のイタリア料理店を紹介する (下の写真左側)。ここではGoogle Knowledge Graph機能が使われている。

レストランのカードにタッチするとその詳細情報が表示され、店舗内の写真などをみることができる。気に入ればこのレストランをそのまま予約できる。ただ、レストランを予約するには専用アプリ「OpenTable」を起動し、ここから予約する仕組みとなる (下の写真右側)。まだ、Alloから直接予約することはできなくて、別アプリで実行することになる。Assistantと会話しながらタスクを実行できれば生活が格段に便利になる。

Assistantとの直接対話

友人との会話を離れ、直接Assistantと対話することができる。Assistantに指示すれば有能な秘書のようにこれに答えてくれる。「Cute dog pictures」と指示すると、Assistantは「Check out these pictures」と述べ、可愛い犬の写真を探してくる。更に「Cute puppy images」と指示すると、子犬の写真を表示する。ここではGoogle Image Searchの検索結果が使われている。

Assistantがこなせるタスク

Assistantは対応できるタスクをカードとして示する。それらは「Subscription (ニュース購読)」、「Action (タイマーセットなど)」、「Fun (ゲームなど)」、「Translation (翻訳)」、「Weather (天気予報)」、「Travel (旅行案内)」、「Sports (スポーツニュース)」、「Answer (Q&A)」、「My Assistant (Assistantの自己紹介)」となる。

旅行案内で格安フライトを探す

Travelカードにタッチすると旅行関連の情報が表示される。フライトを探すときには「Flights to New York」と指示すると、現在地 (San Francisco) からNew Yorkまでの航空運賃が表示される。条件で絞り込んで希望のフライトを探す。また、到着地のホテルの検索もできる。ここでもフライトやホテルの予約はリンク先のウェブサイトで行う。まだ、Assistantから直接予約することはできない。

一日のスケジュールを管理

Assistantは利用者のスケジュールを把握しており、秘書のように会議予定などを管理をする。例えば、「Show my flights」と指示すると、予約しているフライト情報を表示する (下の写真左側)。また、「What’s my next meeting」と言えば、今日の予定を表示する (下の写真右側)。Assistantは忙しい生活の中でなくてはならない存在になりつつある。AssistantはGoogle Calendarとリンクしスケジュールを把握している。

AlloとGoogle音声検索

Alloはメッセージング機能では目新しさを感じないが、Assistantの会話型AIは便利であると感じる。Assistantがインターフェイスとなり対話を通してGoogleを利用する。ただ、Assistant機能の多くはGoogle音声検索からも使える。Googleに「What’s my schedule today?」語り掛けると、今日のスケジュールを教えてくれる。音声検索とAlloでできることに大きな違いはないが、Alloは会話を通して利用者とインタラクションする点が大きく異なる。検索結果が表示されそこで会話が止まるのではなく、連続して対話が進む点が大きな特徴となる。

メッセージを暗号化して送る

Alloはセキュリティにも配慮している。匿名モード「Incognito Mode」を選択すると、Alloのメッセージは暗号化される (下の写真左側)。また、メッセージは指定時間だけ表示され、制限時間を過ぎると消去される。例えば、相手に送るメッセージは10秒間だけ表示されるよう設定することもできる (下の写真右側)。この方式はSnapchatなどで人気を呼び、ティーンエイジャーから圧倒的な支持を得ている。きわどい内容のメッセージでも記録に残らないので、安心して伝えることができるためである。

通常モードのメッセージの安全性

つまり、Alloの通常モードのメッセージは暗号化されているわけではない。ハッシュ処理 (HTTPSのプロトコール) で最低限のセキュリティは確保されるが、Alloはハッカーによる盗聴に対して弱点がある。ただ、Alloだけでなく、Facebook Messengerも同様に、暗号化オプション (Secret Conversation) を指定しない限りメッセージは暗号化されない。前述の通り、Alloは利用者のメッセージを背後で聞いており、メッセージが暗号化されるとこの機能が使えない。

データ保存とAI開発

Googleは当初、Alloで交わされるメッセージを一時的に利用するが、長期的にサーバに保管することはないと述べていた。しかし、Googleはこの指針を変え、Alloで交わされたメッセージを長期間保管する。目的はアルゴリズムの開発で、保管されたデータを使ってAIを教育する。AIがインテリジェントになるためにはデータがカギを握る。メッセージングデータがAI開発の宝の山で、Googleは長期間保管に踏み切った。

プライバシー保護とクールな機能

これに対して市場からは懸念の声も聞かれる。米国国防総省諜報機関の元職員Edward SnowdenはAlloを使わないように呼び掛けている。Googleが保管するメッセージングデータが犯罪捜査などで利用されることを懸念しているためだ。個人のプライバシー保護に配慮するのは当然であるが、厳しすぎるとAIが提供する便利な機能の恩恵を受けられない。プライバシー保護とクールな機能のバランスが難しい。

インターフェイスに温かみを感じる

Alloは「Preview Edition」と表示されているように、使ってみると開発途上のベータ版との印象を受ける。まだまだ生活するうえでの必須ツールとは言い難い。一方、Alloは人間とマシンの関係で大きな将来性を感じる。Assistantと対話できることでインターフェイスに温かみを感じる。音声検索で機械的に結果を表示されるのとは異なり、言葉を交わしながら目的を達成できるのはフューチャリスティックでもある。対話型AIが巨大ビジネスに成長する兆しを感じる。

Appleの人工知能戦略、SiriはiOS 10でボイスクラウドに進化

Thursday, September 15th, 2016

Appleは2016年9月13日、iPhone向け基本ソフトiOS 10をリリースした。早速使ってみたが、Siriが大きく成長する兆しを感じた。Siriの機能が一般に公開され、企業は音声で操作するアプリを作ることができる。SiriはもはやOS機能ではなく、ボイスクラウドとして位置づけられる。AIで足踏みをしているAppleが巻き返しに転じた。

メッセージングが劇的に機能アップ

iOS 10を使って驚いたのはメッセージング「Messages」の機能が飛躍的に向上したこと。絵文字やマルチメディアが使えるだけではなく、画面いっぱいのアニメーションが目を引く。お祝いメッセージの背後で紙吹雪が舞い散る (上の写真左側)。沢山の風船が舞い上がり、夜空に大輪の花火が上がるシーンもある。文字も大文字でジャンプしながら表示され、インパクトのあるメッセージを送ることができる。Apple Watchで登場した心臓が鼓動するアニメーションやキスマーク (上の写真右側) が使え、メッセージが格段にカラフルになった。Messengerはお洒落でハイセンスでAppleらしい製品に仕上がっている。ヒットすること間違いない。

メッセージングに若者が集う

ここにはFacebook MessengerやSnapchatに対抗するAppleの姿勢がうかがえる。ソーシャルメディアは伸び悩み、若者はメッセージングに集っている。ここが人気スポットで、生活の基盤であり、買い物をする場所でもある。ビジネスとして大きな可能性を秘め、Appleが全力でキャッチアップしている姿勢が見て取れる。

オープンなプラットフォーム

iOS 10の最も重要なポイントはプラットフォームが広範囲にわたり公開されたこと。音声アシスタントSiriはApple製アプリだけで使われてきたが、iOS 10ではサードパーティが開発したアプリから利用できる。企業はSiriの機能を組み込んだアプリを開発できるようになり、ユーザインターフェイスが格段に向上した。音声操作のアプリが勢いを増す中で、Siriを組み込んだボイスアプリのエコシステムが広がっている。

写真を言葉で検索する

Apple製アプリについてもSiriがカバーする範囲が広がった。特に便利なのは写真アプリ「Photos」を言葉で操作できる機能。「Show my photos from airports」と言えば空港で撮影した写真を表示する (下の写真左側)。旅行で撮影した写真を探すときは「Find my pictures from my trip to San Francisco」と言うと、サンフランシスコで撮影した写真を表示する (下の写真右側)。Deep Learningでイメージ検索技術が格段に向上し、質問に対しズバリ結果を表示する。使ってみてとても便利と感じる。

電車の乗り換えを教えてくれる

Siriは電車の路線案内ができるようになった。現在地からサンフランシスコ空港に行くには「Give me public transit directions to San Francisco Airport」と言えば、バスと電車を乗り継いで空港に行く経路を示す (下の写真左側)。また、クルマの中で目的地までの道順を尋ねるときは「Give me directions to San Jose Airport」と指示する。ナビゲーションが始まるので、それに沿って運転する。

Appleのスマートホーム

iOS 10からスマートホームアプリ「Home」が登場した (下の写真)。このアプリがハブとなり開発キット「HomeKit」で定義された家電を操作する。Siriに「Turn on the living light」と言えばリビングルームの電灯が灯る。Homeでは家の中の雰囲気を設定する「Scene」という機能がある (下の写真左側、中央部)。Siriに「Set my movie scene」といえば、テレビで映画を見るために最適な暗さになる。電灯の輝度が落ちうす暗くなる。

また、Automationという機能を使うと、家の中の家電を自動制御できる (下の写真右側)。家の中が暗くなったら自動で電灯が点灯する。「At Sunset」という機能を使うと日没時に電灯がオンとなる。また、「When I Arrive Home」という機能を使うと、自宅に到着すると部屋の電灯が灯る。シンプルな機能だが電灯が自動でオンオフするのは便利と感じる。

Siriでクルマを呼ぶ

iOS 10の最大の特徴はパートナー企業がSiriの機能を組み込んだアプリを開発できること。企業はSiri開発キットである「SiriKit」でアプリを開発する。SiriKitで開発されたアプリはSiriの機能を実装し、利用者が音声でアプリを操作できる。

ライドシェア「Lyft」はSiriKitでアプリを開発した。Siriに「Get me a ride to San Francisco Airport」というとLyftのクルマを呼ぶことができる (下の写真左側)。Siriの画面にLyftアプリのウインドウが表示され、近所にいるLyftのクルマがマップ上に表示される。Siriはクルマは7分で来ますが呼びますかと尋ねる。これにYesと答えるとクルマが配車される。ライドシェアではLyftの他にUberも使える。

Siriでお金を送る

Siriから送金することができる。「Send money with Venmo」と指示すると、無料の送金アプリ「Venmo」の送金プロセスが起動する (下の写真左側)。Siriは誰に送るのか、また、金額と添えるメッセージを聞いてくるので、これらに応えると確認画面が表示される (下の写真右側)。ここで「Yes」と答えると送金が完了する。Venmoの他に「Square Cash」で送金することもできる。

Siriからメッセージを送り電話をかける

Siriからメッセージアプリ「WhatsApp」を起動しメッセージを送信できる。「Send a WhatsApp message to Alice..」と指示する (下の写真左側)。また、ソーシャルネットワーク「LinkedIn」で友人にメッセージを送信できる。「Send a LinkedIn message to John..」と指示する (下の写真右側)。この他にSiriから「Skype」や「Vonage」を使って電話をかけることができる。

Apple WatchからSiriを利用すると便利

SiriはApple Watchからも利用できる (下の写真左側)。家の中や外出先では、iPhoneを取り出す代わりにApple WatchでSiriを使うのが便利。Apple Watchに「Hey Siri, Set my movie scene」と語り掛けタスクを実行する (下の写真右側)。iPhoneでも「Hey Siri、」と呼び掛けてSiriを起動できるが、その際はiPhoneを電源に接続しておく必要がある。

SiriKitで音声アプリを開発

前述の通り、SiriKitは開発者向けのツールで、これを利用してSiriの音声機能を組み込んだアプリを開発する。SiriKitは業務領域「Domain」ごとに提供される。DomainはVoIP calling、Messaging、Payments、Photo、Workouts、Ride bookingなどから構成される。SiriKitがユーザとのやり取り全てを担う。音声認識や自然言語解析などのAI機能はSiriKitが提供する。ただし、開発者は業務に固有の言葉を登録し、Siriのボキャブラリーを増やす必要がある。

Siriは輝きを取り戻すか

新しくなったSiriを使うと利用できるシーンが増えてとても便利になったと感じる。同時に、Siriの音声認識精度についてフラストレーションを感じることも少なくない。GoogleやAmazonと比べるとその差が歴然としてきた。iOS 10からはSiriの機能が公開され、ボイスクラウドに進化した。この基盤上でクールなアプリが登場しようとしている。AIに対して及び腰であったAppleであるが、Open Siriで機能アップが期待される。最初にSiriを使った時の驚きは鮮明で、SiriKitはこの輝きを取り戻す切っ掛けになるのかもしれない。

Androidの「Now on Tap」は便利!ユーザーインターフェイスとしての人工知能がその秘密

Friday, December 4th, 2015

Googleは2015年10月、最新基本ソフトAndroid 6.0 “Marshmallow”のリリースを開始した。Marshmallowは大幅に機能アップし、その中でもインテリジェントな検索機能「Now on Tap」は素晴らしい。ホームボタンを長押しすると、知りたい情報がカード形式で表示される。この背後で人工知能が稼働し、利用者の疑問を先読みし、その回答を表示する。

g437_ai_google_now_on_tap_01

インテリジェントな情報検索

「Now on Tap」はアプリ内のインテリジェント機能として位置づけられ、ホームボタンを長押しすると、表示されている頁を検索する。検索結果はGoogle Nowカードとして表示される。例えば、Facebookに投稿された記事を読んでいる時に、知らない言葉に出会ったら、Now on Tapを使う。上の写真がその事例で、FacebookでHillary Clintonが投稿した記事を読んでいるところ (左側)。この記事は「Rosa Parks」について述べているが、誰だかわからない。その際には、ホームボタンを長押しすると、三枚のカードが表示される (中央)。一番下の「Rosa Parks」カードにこの人物に関する情報が表示される。更に、カード下部のアイコンにタッチすると、そのサイトにジャンプする。Google アイコンにタッチすると、Google Appが開き、ここにRosa Parksの詳細情報がKnowledge Graph形式で示される(右側)。これを読むと、Parksは黒人女性の活動家で、黒人の人権を主張して戦ったことが分かる。今までは、Facebookを離れ、検索アプリを開いて情報を検索したが、Now on Tapではそのまま必要な情報にジャンプできる。

g437_ai_google_now_on_tap_02

アーティストの評価を読む

音楽ストリーミング「Spotify」で音楽を聞くときも、Now on Tapはとても便利。アーティストの評判や最近の話題に瞬時にアクセスできる。上の写真はSpotifyの新曲ページ「New Releases」を閲覧している様子 (左側)。この中で「The Vamps」というグループが気になるが、どんなバンドなのか知らない。ここでホームボタンを長押しすると、掲載されているアーティストのカードが登場する (中央)。この中で二段目が「The Vamps」カードで、英国大手新聞社Guardianのアイコンにタッチする。そうすると、ニュースアプリが立ち上がり、Vampsに関するレビュー記事を読むことができる (右側)。これによると、Vampsは英国の音楽グループで、その存在感を確立するために苦闘しているとある。音楽を聞きながらアーティストについての理解が深まる。

メールを読みアクションを取る

Now on Tapは受信メールで威力を発揮する。受信メールを読んでいる時に、Now on Tapを使うと、知らない情報を教えてくれ、次のアクションを素早く取れる。下の写真はその事例で、受信メールを読んでいる時に、Now on Tapを起動した様子。

g437_ai_google_now_on_tap_03

メールは、「SpectreをCinema 16に見にいこう」という内容 (左端)。Now on Tapは内容を理解し、「Century Cinema 16」、「Spectre」、「Create calendar event」の三枚のカードを表示した (左から二番目)。Now on Tapは、Spectreとは映画であると認識し、カードに関連リンクを表示した。ここでYouTubeアイコンにタッチすると、映画の予告編を見ることができる (左から三番目) 。また、Now on Tapは、Cinema 16は映画館であると理解し、映画館の情報を表示。ここで映画館の場所や上映時間をチェックできる。更に、Now on Tapは予定表カード「Create calendar event」を表示した。このカードにタッチすると、カレンダーアプリが起動し、映画の予定を登録できる (右端)。Now on Tapは情報検索に加え、次に必要な操作を先回りして示し、アプリを離れないでタスクを完遂できる。

g437_ai_google_now_on_tap_04

音声で入力するオプション

しかし、Now on Tapは、こちらが探している情報のカードを表示しない時もある。上の写真はその事例で、レストラン予約アプリ「OpenTable」でメニューを確認している様子 (左側)。メニューの「Spanakotiropita」について知りたいのが、Now on Tapはこのカードを提示しない(中央)。このような場合は、Now on Tapの画面で、知りたい単語を音声で入力する。具体的には、「Ok, Google, Spanakotiropita」と語ると、Googleの検索結果が表示される(右側)。これはギリシャ料理で、ほうれん草を挟んだパイであることが分かる。

g437_ai_google_now_on_tap_05

Now on Tapの仕組み

Marshmallowは「Assistant」という機能を導入し、アプリを使う新しい方式を始めた。具体的には、ホームボタンを長押しするか、キーフレーズを音声で入力すると、ウインドウが開く。このウインドウで、閲覧しているページに関連するアクションを実行する。この方式の一つが、デバイスにインストールしているアプリとの連携である。

利用者が「Source App」でホームボタンを長押しすると、「Assistant App」が起動し、カード上で利用者がアアクションを取る構造となる。これに従って、「Destination App」が起動して一連の処理が完結する。上の写真がこの一連の流れを示している。ここでは、Source Appは写真アプリ「Instagram」で、川の流れの写真が掲載されている (左側)。Assistant AppはGoogle Nowとなる (中央)。現在は、Assistant Appに登録されているのはGoogle Nowだけである。カードに表示されたGoogleアイコンにタッチすると、Knowledge Graphが表示される (右側)。この場合Destination Appは「Google App」で、検索エンジンが起動する。

Assistant Appはシステムが提供する「Assist API」を使って開発する。このAPIで、Source Appのテキスト及びイメージをコピーし、Destination Appに送信するなどの処理を定義する。また、Source Appは特別な変更は必要ないが、Destination Appは事前に登録しておく必要がある。

AIがUIとなる

Now on TapはGoogle Nowの拡張機能として捉えることができる。そもそもGoogle Nowとは、利用者に関する情報を解析し、求めている情報を先回りして提示する機能を指す。具体的には、利用者のコンテクストを理解し、利用者に回答を提示し、利用者に次のアクションを促す。

Now on Tapはこの一連のアクションを瞬時に提供することを目的に開発された。いま使っているアプリから離れることなく、必要な情報を表示し、次のアクションを取ることができる。構造としては、スマホアプリの上位レイヤーで機能し、Now on Tapが新しいユーザーインターフェイスを構成する。Now on Tapの背後では、自然言語解析など、人工知能が幅広く使われている。ヒトとマシンの関係は、クールなデザインに加え、これからは人工知能がユーザーインターフェイスの重要な部分を担う。

Googleが通信キャリア事業をスタート、LTEとWiFiを統合し生活空間が単一の通信網となる

Friday, July 17th, 2015

Googleが通信キャリア事業に乗り出した。このサービスは「Project Fi」と呼ばれ、MVNO (仮想移動体通信事業者) 方式でネットワーク・インフラを提供する。低価格でサービスを提供するだけでなく、通信キャリアが提供する機能を根本から改良する。スマホの理想形「Nexus」を開発したように、ネットワークのあるべき姿を探求する。米国でProject Fiがスタートし、通信キャリア市場を揺さぶっている。

g420_google_project_fi_01

近未来の通信網

Googleは2015年6月から、米国で「Project Fi」を始動した。Googleはこのプロジェクトを試験的に展開するとし、地域ごとに人数を限定してサービスを始めた。このため、プロジェクトへの参加は、Googleから招待状が必要となる。筆者も申し込みをしていたが、やっと招待状を受け取り、Project Fiを使い始めた。サポート対象デバイスはNexus 6で、Project Fi専用SIMカード (上の写真) を挿入して利用する。SIMカードはクリップ止めされており、これを使ってスロットを開ける。

g420_google_project_fi_02

実際に使ってみると、Project Fiは近未来の通信網と言っても過言ではない。LTEやWiFiなど、異なるネットワーク間で、最適な通信網を選択し、サービスを途切れなく利用できる。屋内では、通話やテキストメッセージは、WiFi経由でやり取りする。屋外に出ると、Googleの移動体ネットワーク「Fi Network」に接続される。

ロックスクリーン左上にFi Networkと表示され、Project Fiのネットワークを利用していることを確認できる (上の写真左側)。また、ネットワークの設定や使用状況などは専用アプリ「Project Fi」を使う (上の写真右側)。Network FiはSprintとT-Mobile USの4G LTEを利用している。この意味でMVNOであるが、単に通信網を利用するだけでなく、Fi Networkは両者のうち電波強度の強いネットワークに接続する。

g420_google_project_fi_03

WiFiとLETでシームレスな通信

印象的なのは、ネットワーク間で途切れなくサービスを利用できることだ。自宅でWiFi経由で電話している時、屋外に出るとネットワークがLTEに切り替わる。通話は途切れることなく、シームレスにハンドオーバーされる (上の写真左側)。屋内でWiFiを使って通話している時は「Calling via Home-7392」と表示される (Home-7392は筆者宅のWiFi)。屋外では「Fi Network」と表示され、Googleの通信網を利用していることが分かる。(上の写真の事例では表示されていない。) Fi Networkと表示されるだけで、背後でSprintとT-Mobileのうち、どちらのネットワークが使われているかは示されない。屋外でWiFiホットスポットがあれば、自動的にここに接続される。

通話だけでなく、データ通信でも自動でネットワークが切り替わる。自宅のWiFiでGoogleの音楽ストリーミング「Play Music」を聞きながら、自動車で屋外に出るとFi Networkに切り替わる。音楽は途切れることなくシームレスに続き、ドライブしながら好みの曲を楽しめる。今まではWiFi域外に出ると、エラーメッセージが表示され、再度接続する必要があった。WiFiとLTEの壁が取り払われ、生活空間全てが単一のネットワークになった感覚だ。どこでも継続して電話やインターネットを使え、生活が格段に便利になったと感じる。

g420_google_project_fi_04

消費者に優しい料金体系

もう一つの魅力は消費者に優しい料金だ。料金体系はシンプルで、基本料金とデータ料金の組み合わせで構成される。基本料金は月額20ドルで、ここに、通話、テキストなどが含まれる (上の写真、The Fi basicsの部分)。データ通信は月額10ドル/GBとなる。例えば2GBで契約すると月額20ドルとなる(上の写真)。制限量まで使っていない場合は、翌月分の料金から差し引かれる、良心的な料金体系となっている。Project Fiを使い始め、電話料金が半額になった。

ネットワークでイノベーションを興す

革新的なネットワークを低価格で提供するが、Googleの狙いはどこにあるのか、興味深い発言がある。Android部門などの責任者Sundar Pichaiは、Project Fiについての見解を表明した。Googleは基本ソフト (Android) とデバイス (Nexus) だけでなく、ネットワークを含めた統合システムで、技術開発を進める必要がある。個々のネットワークでは技術進化が停滞しているが、包括的なネットワーク環境ではイノベーションが起こると期待を寄せている。

通信キャリアとの関係にも言及した。Project Fiは限定的なプロジェクトで、VerizonやAT&Tなど、既存キャリアと競合することは無い。SprintとT-Mobileはネットワーク回線をGoogleに卸し、空回線を有効利用できる。これにより、ユーザ数が減少し収入は減るかもしれないが、利益率が改善し、収益は増えると期待している。

既存キャリアへの圧力

米国の消費者は低価格で先進的なサービスを使うことができるとして、一様にProject Fiを評価している。つまり、Project Fiが新しい基準となり、VerizonやAT&Tを値下げや新サービス開発に向かわせる可能性を秘めている。Project Fiが黒船となり、米国のキャリア市場が大きく変わろうとしている。

g420_google_project_fi_05

既に米国キャリアの中で、Project Fi方式を模したサービスが登場した。ノースカロライナ州に拠点を置くRepublic Wirelessは、MVNO方式のキャリアでProject Fiと類似のサービスを導入した。通信はWiFi経由で行い、WiFi環境がない場合は携帯電話回線を利用する。両者の間でシームレスな移行はできないが、有料サービスを最小限に留める仕組みとなる。料金体系でProject Fiの方式を模している。基本料金 (通話とテキストとWiFi) は月額10ドルで、データ通信 (1GB) は月額15ドルとなる (上の写真)。未使用の部分は翌月に払い戻しを受ける仕組みとなっている。Project Fi方式が米国市場で普及し始めた。

g420_google_project_fi_06

Googleの狙い

モバイル環境でイノベーションが起こり、便利な機能が登場し、通信価格が下がれば、利用者数の増加につながる。これは消費者にとってのメリットであり、同時に、これがGoogleの狙いでもある。より多くの人がインターネットにアクセスすれば、Googleサービス利用者が増え、広告収入などが増える。

Googleは一貫してこの手法を展開しており、Project Fi以外に、高速ブロードバンド「Google Fiber」の前例がある。Google Fiberの最大転送速度は1Gbpsで、主要都市で施設が進んでいる。大手ケーブル会社Comcastはこれに対抗するため、Google Fiberの二倍の性能を持つ「Gigabit Pro」の施設を始める。15年以上無風状態であった米国のブロードバンド市場が、Google Fiberの登場で一気に動き出した。

地球規模では、Googleは気球インターネット「Project Loon」の開発を急いでいる (上の写真)。アフリカや南米など、インターネット環境が整っていない地域に、気球からブロードバンドサービスを展開する。地域住民の社会インフラを提供するとともに、インタネット利用者を増やし、Googleサービスの利用者を増やす狙いがある。

Project Fiの日本への影響

前述の通り、Project Fiの背後では、SprintとT-Mobileの通信網が使われている。T-Mobile最高経営責任者John Legereは、Project Fi向けにネットワークを供給し、新技術が展開されることにを全面的にサポートしている。

一方、Sprint親会社SoftBankの孫正義社長は、Project Fiへの参加に躊躇したとも言われている。Sprintは多くのMVNOに回線を卸しているが、Googleに対しては懐疑的なポジションを取っている。この理由は明らかにされていないが、Googleが通信キャリア事業に参入し、Sprintと競合することを避けたいという思惑があったと推察される。

しかし、Google向けに通信網を提供したのは、Project Fiの手法を学び、日本で類似サービスを展開する意図があるのかもしれない。SoftBankが直接手掛けないとしても、日本のMVNOはProject Fiから学ぶところは少なくない。モバイルサービスは完成形ではなく、まだまだ大きく進化できる余地があることをProject Fiは示している。