Archive for the ‘ロボット’ Category

Googleは家庭向けロボットを開発!? 先行するAmazonを追随する

Friday, October 5th, 2018

Amazonは家庭向けロボットを開発していると噂されている。Googleはこれに対抗して、同じく、家庭向けロボットの開発に乗り出した。Googleは五年前、ベンチャー企業を買収してロボット開発を始めたが、このプロジェクトは頓挫した。GoogleはAmazonに刺激され、ロボット開発を再開し、高度なAIを武器にインテリジェントなシステムを開発している。

出典: Dmitry Kalashnikov et al.

ロボット開発の経緯

Googleは2013年、プロジェクト「Replicant」を発足し、ロボット開発に乗り出した。ロボット開発は「X」(当時のGoogle X)が担い、Andy Rubinが指揮を取っていた。Rubinは「Android Inc.」創業者で、2005年にGoogleが買収し、スマホ事業の基礎を築いた。Rubinはインテリジェント・マシンに興味を持っており、ドイツの製造会社でロボットエンジニアとして働いていた。

ベンチャー企業買収

Googleはロボット企業8社を相次いで買収した。最大規模の買収はBoston Dynamicsで、同社は、軍事支援ロボットとヒューマノイドを開発していた。日本企業でヒューマノイドを開発しているSchaftも買収された。また、コンピュータビジョンをロボットに応用したIndustrial Perceptionや次世代ロボットアームを開発していたRedwood Roboticsも含まれ、Googleはロボット市場に本格的に参入すると見られていた。

開発を中止

しかし、Googleは突然ロボット開発を中止した。Andy Rubinは2014年にGoogleを離れ、その直後、Replicantは活動を停止した。Googleは買収したBoston Dynamicsの買い手を探していたが、2017年、SoftBankが同社を買収することで合意した。これに先立ち、SoftBankは2012年にAldebaran Roboticsを買収し、ロボット事業を開始した。

中止の理由

Googleがロボット開発を中止した理由はロボットを事業化するのが難しいと判断したため。ロボットは配送センターや組み立て工場使われる工業ロボットが中心で、一般社会で使われるサービスロボットの開発には時間がかかる。Rubinは2020年頃に製品を投入する予定でいたが、Google幹部は短期間で成果を求めており、この意識の相違が中止に繋がった。

ロボット基礎研究

Replicant中止の後も、Googleは高度なAIをロボットに適用する研究を進めてきた。Googleはコモディティハードウェアに最新のAI技法を取り込み、インテリジェントなロボットを開発している。具体的には、Deep LearningとReinforcement Learningをロボットの頭脳として使う。Googleのロボット研究施設は「Arm Farm」と呼ばれ(先頭の写真)、10台超のロボットアームが並列に稼働しスキルを学ぶ。

AI研究内容

研究ではロボットアームでドアのノブを回し、それを手間に引いてドアを開けるタスクが実行された (下の写真)。それぞれのロボットはニューラルネットワークのコピーを搭載し、Reinforcement Learningの手法で教育された。行動(Action)を実行するとき、与えられた環境(Sate)で値(Value)を算定し、ロボットはValueを最大にする方向でActionを決定する。ロボットがタスクを実行するときにノイズを加え、それぞれのロボットは異なる環境でタスクを実行する環境を構築する。

出典: Google

ロボットクラウド

これらのデータはクラウドに収集されネットワークを最適化する。アルゴリズムは収集されたデータからうまく処理できたケースとそうでないケースを検証し、Actionとタスク完遂の関係を把握し、ネットワークを改良していく。このサイクルを繰り返し、ロボットの性能を向上する。ロボットは数時間の教育でドアを開けることができるようになった。

最新のAI研究

Googleは最新のAI技法「QT-Opt(Q-function Targets via Optimization)」を開発した。Arm FarmにQT-Optを搭載するとオブジェクトをつかむ(Grasp)精度が飛躍的に向上する。QT-Optとは分散型Q-Learning(Reinforcement Learningの一つのモデル)で、連続したアクション(Continuous Action)を安定的に処理できる点に特徴がある。

ロボットでモノをつかむ

ロボットはカメラのRGB画像からオブジェクトを把握し、アーム先端のグリップを開きそれをつかむ。ロボットが複雑な形状のオブジェクトを正確につかむためには高度な技法が要求される。これは「Picking Challenge」と呼ばれ、多くの企業や研究機関がこのテーマに挑戦している。いかに正確にかつ高速にモノをつかめるかがロボットの商品価値を決める。

アルゴリズム教育

アルゴリズムはカメラの画像を読み込み、ロボットアームの動きと、グリッパーの開閉を出力する(下の写真、左側)。最初にオフラインでアルゴリズムを教育し、次に、ロボットを稼働させオンラインで教育する。オフライン教育では1000種類のオブジェクトが使われ(下の写真、右側)、ロボットはこれらを580,000回つかむ試験が実施された。完成したアルゴリズムを使い、ロボットの性能を検証したところ、オブジェクトをつかむ成功率は96%と好成績をマークした。

出典: Dmitry Kalashnikov et al.

研究の意義

アルゴリズムはオブジェクトを正確に掴むことができるほか、操作をインテリジェントに理解する。アルゴリズムは上手く掴めなかったときには、異なる掴み方を自動で学習する。また、オブジェクトを掴む手法を長期レンジで把握する。(下の写真上段:オブジェクトが纏まっているときはそれを崩す(Singulation)ことを自律的に学習する。中段:立っているローソクはつかみにくいのでそれを倒して実行する。下段:軽くてつかみにくいボールはトレイの端に寄せてつかむ。上の写真右側:煩雑な環境でもオブジェクトをつかむことができる。)

出典: Dmitry Kalashnikov et al.

実社会への応用

Googleのロボット開発はGoogle BrainとXで進められている。GoogleのArm Farmで開発された技術は、ロボットアームだけでなく、ロボットの基礎技術として応用される。実社会には様々な形状のオブジェクトがあり、それに触れた時、オブジェクトの物理挙動も異なる。ロボットを実社会で使うためには多くの課題を解決する必要があるが、これらの研究がその手掛かりとなる。

家庭向けのロボット

Googleは家庭向けロボットの開発を進めていると噂されている。AIスピーカー「Google Home」は人気商品で、多くの家庭で使われている。GoogleはAIスピーカーを駆動型にしたロボットを開発しているとみられている。ロボットは家の中を自律的に走行し、タスクを実行することとなる。

Amazonに対抗

Amazonは「Vesta」という名前でロボットを開発している。これはAmazonの人気商品Amazon Echoを駆動型にしたモデルである。GoogleはVestaに刺激を受け、ロボット開発を再開したとみられる。AIスピーカー市場ではAmazon EchoとGoogle Homeが競い合っているが、今度はロボットで両社が鎬を削る。両社ともロボット技術はまだまだ未成熟であるが、商品化に向けての開発が進み、大きなブレークスルーが期待される。

フェイスブックは家庭向けロボットを開発!?ロボットの頭脳に人間の常識を教える

Friday, July 13th, 2018

ロボティックスに関するカンファレンス「RE•WORK Deep Learning in Robotics Summit」がサンフランシスコで開催された (下の写真)。ロボットの頭脳であるDeep Learningにフォーカスしたもので、OpenAIやGoogle Brainなど主要プレーヤーが参加し、基礎技術から応用技術まで幅広く議論された。

出典: VentureClef

Embodied Vision

フェイスブックAI研究所 (Facebook AI Research) のGeorgia Gkioxariは「Embodied Vision」と題して最新のAI技術を紹介した。Embodied Visionとは聞きなれない言葉であるが、Computer Visionに対比して使われる。Computer Visionがロボット (Agent) の視覚を意味することに対し、Embodied Visionはロボットの認知能力を指す。ロボットが周囲のオブジェクトを把握するだけでなく、人間のようにその意味を理解することに重点が置かれている。

Learning from Interaction

フェイスブックAI研究所はこの命題にユニークな視点から取り込んでいる。Gkioxariは、AIを人間のようにインテリジェントにするためには、「Learning from Interaction」が必要だと主張する。これは文字通り、インタラクションを通じて学習する手法を意味する。いままでにAIはデータセットからComputer Vision習得した。例えば、写真データセット「ImageNet」から猫や犬を判定できるようになった。これに加え、AIは環境 (Environment) のなかで、モノに触れて、その意味を学習することが次のステップとなる。Gkioxariは、赤ちゃんが手で触ってモノの意味を学ぶように、AIもインタラクションを通じ基礎知識を学習する必要があると説明した。

仮想環境を構築

このため、フェイスブックAI研究所は、AI教育のために仮想環境「House3D」を開発した。これは住宅内部を3Dで表現したもので、ロボットがこの中を移動しながら常識を学んでいく。ロボットが移動すると、目の前のシーンが変わっていくだけでなく、シーンの中に登場するオブジェクトには名前が付けられている。つまり、ロボットは仮想環境の中を動き回り、オブジェクトに接し、これらの意味を学習する。ロボットは異なるタイプの部屋からキッチンの意味を把握し、そこに設置されているオーブンや食器洗い機などを学んでいく (下の写真)。

出典: Georgia Gkioxari

学習方法

フェイスブックAI研究所は三つの視点からロボットを教育する。ロボットが仮想環境の中で、モノを見て言葉の意味を学習する。これは「Language Grounding」と呼ばれ、ロボットは環境の中でモノと名前を結び付ける (部屋の中で長い緑色のロウソクをみつけることができる)。二番目は、ロボットは家の中で指定された場所に移動する。これは、「Visual Navigation」と呼ばれ、ロボットは家の中の通路を辿りドアを開け、指定された場所まで移動する (寝室に行くように指示を受けるとロボットはそこまで移動する)。

EmbodiedQA

三つめは、ロボットは質問を受けると、家の中を移動してその解を見つけ出す。これは「EmbodiedQA」と呼ばれ、ロボットは回答を見つけるために仮想環境の中を移動する。従来のロボットはインターネット上で答えを見つけるが、EmbodiedQAは物理社会の中を移動して解を求める。例えば、「自動車は何色?」という質問を受けると (下の写真左側)、ロボットは質問の意味を理解し、家の中で自動車を探し始める。自動車はガレージに駐車されているという常識を働かせ、家の中でガレージに向かって進む。ロボットはその場所が分からないが、ここでも常識を働かせ、ガレージは屋外にあると推測する。このため、ロボットは玄関から屋外に出て、庭を移動し、ガレージにたどり着く。そこでロボットは自動車を発見し、その色が「オレンジ色」であることを把握する (下の写真右側)。

出典: Georgia Gkioxari

必要な機能

このタスクを実行するためには、ロボットの頭脳に広範なAI技法が求められる。具体的には、視覚(Perception)、言葉の理解(Language Understanding)、移動能力(Navigation)、常識(Commonsense Reasoning)、及び言葉と行動の結びつき(Grounding)が必要になる。Gkioxariの研究チームは、前述の3D仮想環境「House3D」でEmbodiedQAのモデルを構築しタスクを実行することに成功した。

ロボットの頭脳

このモデルでロボットの頭脳はPlannerとControllerから構成され (下の写真)、Deep Reinforcement Learning (深層強化学習) の手法で教育された。Plannerは指揮官で、進行方向(前後左右)を決定し、Controllerは実行者で、指示に従って進行速度(ステップ数)を決定する。PlannerはLong Short-Term Memory (LSTM) というタイプのネットワークで構成され、上述の通り、これをDeep Reinforcement Learningの手法で教育する。Plannerは人間のように試行錯誤を繰り返しながら常識を習得する。

出典: Georgia Gkioxari

知的なAIの開発は停滞

フェイスブックAI研究所は、これらの研究を通して、インテリジェントなロボットの開発を進めている。AIが急速に進化し、イメージ判定では人間の能力を上回り、囲碁の世界ではAIが人間のチャンピオンを破り世界を驚かせた。AIの計り知れない能力に圧倒されるが、AIは知的というにはほど遠い。AIはオブジェクト(例えば猫)の意味を理解しているわけではなく、また、囲碁という限られたタスクしか実行できない (例えばAlphaGOはクルマを運転できない)。いまのロボットは人間のように家の中を移動することさえできない。つまり、人間のようにインテリジェントに思考できるAIの開発はブレークスルーがなく滞ったままである。

精巧な仮想環境

このため、フェイスブックAI研究所は、全く異なるアプローチでAIを開発している。実社会を模した3D仮想環境の中でAIを教育し、この中でAIが複雑なタスクを自ら学んでいくことを目指している。AIが実社会の中で学習することで、人間のような視覚を持ち、自然な会話ができ、次の計画を立て、知的な思考ができるアルゴリズムを開発する。このためには、実社会そっくりな仮想環境が必要で、家の中を写真撮影したように忠実に描写した3D環境を開発している。同様にOpenAIやGoogle DeepMindもこのアプローチを取っており、精巧な仮想環境でDeep Reinforcement Learningの開発競争が激化している。

フェイスブックがロボット開発

ロボットの頭脳が知的になることで、人間の暮らしが根本的に変わる。フェイスブックは仮想アシスタント「M」を開発してきたが、製品としてリリースすることを中止した。Mはホテルのコンシェルジュのように、どんな質問にも答えてくれる仕様であったが、人間との会話トピックスは余りにも幅が広く、AIはこれに対応できなかった。また、フェイスブックはAIスピーカーを開発しているとも噂されている。Embodied Visionは仮想アシスタントやAIスピーカーを支える重要な基礎技術となる。更に、この研究が上手く進むと、家庭向けロボット開発のロードマップが見えてくる。フェイスブックがインテリジェントな家庭向けロボットを開発するのか、市場の注目が集まっている。

自律走行型オフィス警備ロボットが登場、人間社会と共存できる優しいデザインが特徴

Friday, March 3rd, 2017

シリコンバレーでオフィス警備ロボットが登場した。ロボットは多種類のセンサーとAIを搭載し自動走行する。施設内で異常を検知するとオペレータに通知する。不審者を見つけると身分証明書の提示を求める。警備を担うロボットであるが威圧感は無く、形状は流線型で親しみやすいデザインとなっている。自動運転車で培った技術がロボットに生かされている。

出典: Cobalt Robotics

屋内警備を担うセキュリティロボット

このロボットはシリコンバレーに拠点を置くCobalt Roboticsにより開発された。ロボットは「Cobalt」という名前で、屋内警備を担うセキュリティロボットとして登場した (上の写真)。ロボットは多種類のセンサーを搭載し自律的に移動する。ここにはComputer VisionやAIなど先進技術が使われている。プロモーションビデオをみるとCobaltはロボットというより家電に近いイメージだ。

施設を自動走行し異常を検知

ロボットは事前に設定されたルートを巡回して警備する。また、ロボットがランダムに施設内を移動することもできる。ロボットは経路上で人物や物を認識し、問題と思われるイベントを検知しこれを管理室に通報する。例えば、ドアがロックされないで開けられた状態であれば、これを異常事態と認識しオペレータ(Human Pilotと呼ばれる)に対処を促す。

環境をモニタリング

ロボットはオフィス環境をモニタリングし、水漏れなどの異常を検知することもできる。また、オフィスに不審物が置かれていれば管理室にアラートを上げる。備品管理機能があり、倉庫での棚卸や資材管理にも利用できる。更に、オフィス内のWiFiシグナル強度をモニターする機能があり、不正アクセスポイントを検知できる。

社員とのインターフェイス

ロボットは人間を認識でき、オフィス環境で共存できることを設計思想とする。ロボットは正面にディスプレイを搭載しており、社員が直接オペレータとビデオを介して話すことができる。また、非常時にはオペレータがロボットを遠隔で制御し社員を安全な場所に誘導する。更に、ロボットは定時以降オフィスに残っている人に対しては身分証明書の提示を求める。社員は身分証明書をロボットのリーダーにかざし滞在許可を受ける (下の写真)。

出典: Cobalt Robotics

多種類のセンサーを搭載

ロボットは多種類のセンサーを搭載している。光学カメラは360度をカバーし全方向を見ることができる。暗闇での警備のために赤外線カメラを搭載している。Point Cloud Cameraで周囲のオブジェクトを3Dで把握する。Lidarと呼ばれるレーザースキャナーで周囲のオブジェクトを3Dで把握する。遠距離まで届くRFIDリーダーでオフィス備品などに張り付けられているタグを読み取り資材を管理する。

自動運転車で培われたAI技法を採用

ロボットはAIやMachine Learningの手法でセンサーが読み込んだデータを解析する。周囲のオブジェクトを判別し、安全に走行できる経路を計算し、ロボットが自律的に走行する。また、Computer Visionで水漏れなどの異常を検知する。更に、ロボットはマッピング技術を実装しており、走行時にLidarで周囲のオブジェクトをスキャンし高精度3Dマップを生成する。生成された3Dマップを頼りにロボットは自動走行する。多くの技術は自動運転車で開発され、Cobalt Roboticsはこの成果をロボットに応用している。

家電に近いロボット

Cobaltは警備ロボットであるが外観は人間に親しまれる形状となっている (下の写真)。これは著名デザイナーYves Béharによりデザインされ、表面は金属ではなく柔らかい素材が使われている。また、Cobaltはヒューマノイドではなく、下に広がる円筒形のデザインとなっている。ロボットというと鉄腕アトムのようなヒューマノイドを思い浮かべるが、Cobaltは家電とか家具に近いイメージだ。自動走行する家電と表現するほうが実態に合っている。

出典: Cobalt Robotics

若い世代が考えるロボット

Cobalt RoboticsはErik SchluntzとTravis Deyleにより創設された。Schluntzはハーバード大学在学中にインターンとしてSpaceXとGoogle Xで製品開発に従事した。Deyleはジョージア工科大学でロボット研究を専攻し、Google XでSmart Contact Lensの開発に携わった。二人とも大学を卒業して間もなくCobalt Roboticsを創設した。若い世代がロボットを開発するとCobaltのように優しいイメージになる。

警備ロボットは既に社会で活躍

実は警備ロボットは既にアメリカ社会で活躍している。シリコンバレーに拠点を置くベンチャー企業Knightscopeはセキュリティロボットを開発している。このロボットは「K5」と呼ばれ、多種類のセンサーを搭載し屋外の警備で使われている。Microsoftがキャンパス警備でK5を採用したことで話題を集めた。Knightscopeの敷地内をK5がデモを兼ねて警備にあたっている(下の写真)。

出典: VentureClef

屋内向け警備ロボットを投入

Knightscopeは小型ロボット「K3」を投入した。K3は建物内部を警備するためのロボットで、K5に比べて一回り小さな形状となっている。サンフランシスコで開催されたセキュリティカンファレンス「RSA Conference」でK3が紹介された (下の写真)。人間に代わりオフィスを警備するロボットで、高度なセンサーとAIを搭載し自律的に移動する。K3は形状が小型化しただけでなく、対人関係を考慮したキュートなデザインとなっている。

出典: VentureClef

ロボットは商用施設に向かう

いまロボットは、オフィス、銀行、病院、高齢者介護施設、ホテル、小売店舗など商用施設で受け入れられている。警備機能だけでなく、ここでは既に多種類のロボットが稼働し企業の効率化を支えている。これら企業環境はロボットにとって自動走行しやすい場所である。企業のオフィスを例にとると、レイアウトが固定で通路が明確で、そこで働く社員は社会的な行動を取る。ここがロボット適用のスイートスポットで事業が急速に拡大している。

最後のフロンティアに向かっての準備

反対にロボット最後の市場は家庭環境といわれている。家庭のフロアには玩具や衣類が散在し、子供やペットが走り回る。WiFi通信は不安定で通信は頻繁に途切れる。AI家電のAmazon EchoやGoogle Homeは対話するロボットして位置づけられるが、移動する機能はない。一般家庭が最後のフロンティアで、商業施設向けロボットはその準備段階として重要な意味を持つ。

トランプ大統領は米国に製造業を呼び戻すが自動化で雇用は増えない、強い国づくりにはロボット産業再生が必須

Friday, January 27th, 2017

トランプ大統領は米国に製造業を呼び戻すことを最重点課題として掲げている。自動車メーカーに工場を米国に移転するよう強く求めている。しかし、最新工場はロボットなどで自動化が進み、従業員の数は多くない。新工場が稼働しても生み出される雇用者数は限られる。

出典: UNCTAD

本国回帰Reshoringの流れが始まる

これと並行して、工場が高度に自動化されることで、労働賃金の安い国で製造するメリットが薄らいでいる。発展途上国での生産施設を本国に戻す動きが起こっている。この流れはOff-Shoringに対し「Reshoring」と呼ばれている。トランプ大統領に要請されなくても、米国で製造するメリットが大きい時代になってきた。この潮流はトランプ政権の産業政策に大きな影響を与えることになる。

発展途上国で職が失われる

国際連合 (United Nations) の主要組織であるUNCTAD (United Nations Conference on Trade and Development) は2016年11月、Reshoringの流れを分析したレポートを発表。UNCTADは発展途上国への投資や経済支援などを目的に設立された組織で、先進国でロボットが普及すると発展途上国労働者の職が奪われると予想する。労働賃金が低いことで成立していた発展途上国の製造工場が、ロボットの普及で脅かされていると警告している。

自動車とエレクトロニクス

ロボットなどの自動化技術の進化で最も影響を受けるのは発展途上国で、今後2/3の職が失われると指摘する。まだ経済へのインパクトは小さいが、これから多くの企業が製造施設を本国に戻す流れが本格化すると予測している。産業用ロボットは主に自動車とエレクトロニクス産業で使われており、これらの製造工場が集中するメキシコとアジア諸国への影響が大きいと分析している。

中国に産業用ロボットが集中

レポートは世界の産業用ロボットの稼働状況についても分析している (先頭のグラフ)。中国は2013年から産業用ロボットを大規模に導入している。年間の購入金額は30億ドルを超え、2016年末には設置台数で日本を抜くと予想している。今までは日本が産業用ロボットの設置台数で世界をリードしてきたが、これからはロボットは中国に集中することになる。

出典: Tesla

製造業はアメリカ回帰の傾向

Reshoring先は製品最終仕向け地や製造施設を運用する環境などが判断材料になる。自動車では巨大市場を擁すアメリカに製造施設を移転する可能性が高くなる。ロボットで自動化が進むと、米国内での製造コストがメキシコ工場でのコストと大きな違いがなくなる。Teslaはシリコンバレー郊外でクルマを製造するが (上の写真)、工場は高度に自動化されコスト競争力があることを示している。トランプ大統領の強い要請でFordはメキシコ工場建設計画を撤回し、ミシガン州で製造規模を拡大する。この決断の背景には輸入税 (Border Tax) だけでなく工場の自動化技術があるのかもしれない。

工場は戻るが雇用は限定的

しかし、工場が米国に戻って来てもロボットによる自動化で従業員数は大きくは増えない。産業がアメリカに回帰するものの、雇用を生み出すという面ではその効果は限定的である。更に、AIやロボットにより米国産業全体で職が失われることになる。トランプ政権ではAIによる大失業時代を迎えることとなり、その対策で重い荷を背負うこととなる。

ロボット産業育成が重要

製造業を支える重要な基盤技術はロボットであるが、これら産業用ロボットは欧州と日本で開発されている。強いアメリカを取り戻すためには、ロボット技術を持つことが要件となる。トランプ大統領はロボット政策について見解を発表していないが、New York Timesとのインタビューでこれに触れている (下の写真)。New York Timesが「工場で職を奪うのはロボットでは?」との問いかけに対し、「その通りで、(米国で)ロボット開発を進める必要がある」と答えている。また、米国に産業用ロボット企業が無いことも認識しており、ロボット産業育成が重要であるとの見解を示した。

出典: New York Times

市場でもロボット産業育成の声

米国産業界でロボット開発を進める必要性について議論が高まっている。ロボットニュースサイトRobot Reportによると、ロボットの2/3が米国外で生産されている。更に、産業用ロボットについては全て海外製である。産業用ロボットは米国で生まれたが、今では米国は全てを輸入に頼っている。シリコンバレーに拠点を置くAdept Technologies社が米国における最後の産業用ロボット企業といわれてきた。しかし同社はオムロンに買収され、米国から産業用ロボット企業がなくなった。

トランプ大統領への提言

米国の産業用ロボットが衰退した理由は政府からの補助金が少ないためという意見が多い。米国の実業家で投資家であるMark Cubanは、トランプ大統領に対してロボット開発を推進するよう提言した。トランプ大統領は1兆ドル (100兆円) をインフラ整備に投資するとしているが、Cubanはその中で1000億ドル (10兆円) をロボット開発に投資すべきとしている。米国で生まれたロボットを復活させる必要があると主張する。政府はEVや再生可能エネルギー産業の育成で成功したように、今度はロボット産業に注力すべきとの見解を示している。

高度なAI技法をロボットに適用

ロボット開発ではGoogleが最新のAIを活用し研究開発を加速している。Googleのアプローチはコモディティ・ハードウェアに最新のAI技法を取り込み高度なロボットを開発するというもの。この背後では「Reinforcement Learning」といわれるAI技法が使われている。この技術は囲碁ソフトAlphaGoで使われ、人間のチャンピオンを破り世界の注目を集めた。今度はこれをロボットに応用する。

ロボットがお互いに教え合う

ロボットは学習したノウハウを他のロボットと共有する。数多くのロボットがReinforcement Learningの手法で学習するが、習得した知識はクラウド「Cloud Robotics」に集約される。ここで知識をポリシーに昇華し他のロボットと共有する。つまり、数多くのロボットが並列で学習することで、技能の習得が格段に早くなる。この手法は「Transfer Learning」と呼ばれ注目されている。(下の写真は4台のロボットがドアの開け方を学習している様子。それぞれのロボットが学んだことを4台で共有する。)

出典: Google

ロボットが人間のように学ぶ

人間や動物は試行錯誤で新しいスキルを学習するが、このモデルをロボットに応用したのが上述のReinforcement Learningである。ロボットは失敗を繰り返しながら、目的を完遂できるよう自ら学習していく。人間や動物はこれに加え、物に触るとそれがどう動くかを理解している。人間は内部にメンタルモデルを構築し、アクションを起こすとそれに応じて環境がどう変わるかを予想できるとされる。

ロボットがタッチ感覚を習得

Googleはこれと同じモデルを構築し、ロボットに物の扱い方を教える。テーブルに様々な文房具を置き、ロボットが特定のオブジェクトに触るとそれがどう動くかをこのモデルは予測する。このモデルで教育すると、ロボットは人間のように意図を持った操作ができるようになる。つまり、ロボットにオブジェクトと場所を指示すると、ロボットはそれを指定された場所に移動する。このモデルは「Deep Predictive Model」と呼ばれ、ロボットは人間のようにタッチ感覚を習得する。

Googleロボット開発の行方

先進技術を生み出すGoogleロボット開発であるが、この事業は中止されるとのうわさが絶えない。GoogleはBoston Dynamicsを5億ドルで買収したが、2016年にはこれをToyotaまたはAmazonに売却すると報道された。これに先立ち、プロジェクト責任者Andy RubinはGoogleを離れた。Alphabet配下の開発プロジェクトが相次いで中止される中、Googleのロボット開発がどこまで進むのか注視されている。

Boston Dynamicsの四つ足ロボット

先行きが見えない中でもBoston Dynamicsはロボット開発を積極的に進め、新技術を相次いで公開している。同社が開発するロボットは動物のように四本足で走行するのが特徴で、足場が悪くても歩けるため軍事への展開を目指していた。最近ではロボットを小型化し、家の中で移動し家事をこなす機能を実装している。下の写真は「SpotMini」というモデルで手 (頭に見える部分) で物を掴み操作できる。主人にビールを運び、シンクから食器を持ち上げウォッシャーに入れることができる。高度なインテリジェンスを持つが、外見は小型恐竜のようにも見え、家で使うにはデザイン面で工夫が必要かもしれない。

出典: Boston Dynamics

米国ロボット産業が再び花開く

Googleロボット事業の先行きが不透明なものの、ロボット開発はAIと密接に関係し、Googleの強みを生かせる分野である。GoogleはDeepMindと連携してロボット開発を進めており、世界最先端のAI技法を取り込むことができる。自動運転車と並んでロボット開発は将来の事業を支える柱に成長する可能性を秘めている。また、トランプ政権がロボット開発を国策として後押しする可能性もあり、開発が一気に加速するかもしれない。米国ロボット産業が再び花開く兆しを感じる。

音声操作できない製品はもう売れない!家電、ロボット、クルマが相次いでAmazon AIボイスクラウドを採用

Friday, January 20th, 2017

AmazonのAIスピーカーEchoが爆発的に売れている。その理由はAIの適用で会話機能が格段に進化したためだ。自然な会話でEchoを快適に使うことができる。Amazonはこの会話機能をAIボイスクラウドとして一般に公開した。メーカーは相次いでAIボイスクラウドの採用を決めた。Amazonはサーバクラウドの次はAIボイスクラウドで市場を席捲しようとしている。

出典: Amazon

Amazon Echoとは

Amazonは2014年にAIスピーカー「Echo」を発売し、累計で510万台が出荷され、大ヒット商品となった。今では「Echo Tap」(携帯版Echo) と「Echo Dot」(小型版Echo、上の写真) が製品ラインに加わった。製品の背後ではAIボイス機能「Alexa」が稼働し会話を司る。デバイスに話しかけて音楽を再生しニュースを聞く。また、スマートホームのハブとして機能し、家電を言葉で操作できる。

コンセプトは宇宙大作戦

Amazon Alexaの開発は2012年に始まり、クラウド機能をすべて音声で操作するシステムを目指した。このアイディアはテレビ番組「Star Trek」(宇宙大作戦) にあり、宇宙船内の複雑な機器を言葉で操作できるシーンからヒントを得た。Alexaはデバイスに触ることなく言葉だけで情報にアクセスし、家電を操作できる構造となっている。言葉は人間の本質的なコミュニケーション手段で、Amazon開発チームはこれをAlexaに応用した。

Amazon Alexaはプラットフォーム

Amazon AlexaはEchoだけでなく一般に公開され、多くの企業にボイスサービスを提供している (下の写真)。つまり、Alexaはプラットフォームとして位置づけられ、ここにエコシステムが形成されている。パートナー企業はこの機能を使い音声で操作するボイスアプリを開発する (下の写真、Alexa Skills Kitの分部)。また、家電や自動車メーカーはそれぞれの製品にボイス機能を組み込むことができる (下の写真、Alexa Voice Serviceの分部)。更に、スマートホーム企業は音声で操作できる機器を開発する (下の写真、Amazon Smart Homeの分部)。

出典: Amazon

ボイスアプリの数が急増

ボイスアプリはAmazonだけでなくパートナー企業により開発されている。ボイスアプリはAmazon Echoで稼働し、出荷当初は10本程度であったが、今では5000本を超えた。人気のボイスアプリは「Amazing Word Master Game」で、Echoとゲームで対戦する。これはしりとりをするゲームで、単語の長さが得点となる。Echoを相手にゲームをする形式で、英語の勉強にもなる。一人で時間を持て余している時にEchoが遊び相手になってくれる。

Alexaでレンタカーを予約

ビジネスと連携したボイスアプリが増えてきた。旅行サイト「Expedia」はAlexaを使って言葉で予約できるサービスを開始した。航空機を予約している人は言葉でフライト内容を確認できる。「Alexa, ask Expedia to get my trip details」と指示すると、Echoは予約状況を読み上げる。「Alexa, ask Expedia to book a car」と指示すればレンタカーを予約できる。ただし、フライトとホテルの予約にはまだ対応していない。

LenovoはAmazon Echo対抗製品を発表

LenovoはAIスピーカー「Smart Assistant」 (下の写真) を発表した。Echoとよく似た形状で、ボイス機能としてAmazon Voice Serviceを使っている。形状だけでなく機能的にもEchoと類似の製品仕立てになっている。Smart AssistantがEchoと異なる点はプレミアムスピーカー「Harman Kardon」を搭載している点。価格は179.99ドルで2017年5月から出荷が始まる。この事例が示すように、Amazonは競合デバイスの開発を歓迎しており、事業の目的はAIボイスクラウドの拡大にある。

出典: Lenovo

Fordはクルマに会話機能を組み込む

Fordは自動車メーカーとして初めてAlexa Voice Serviceの採用を決めた。利用者は家庭のAmazon Echoからクルマを操作できる。「Alexa, ask MyFord Mobile to start my car」と指示するとエンジンがかかる。運転中はナビゲーションパネルから音声でAlexaを利用できる (下の写真)。目的地の検索やガレージドアの開閉などを言葉で指示できる。これはFord「SYNC 3」技術を使ったもので、ドライバーのスマホアプリからクルマにアクセスする構成となる。前者の機能は2017年1月から、後者の機能は夏から利用できる。クルマが自動運転車に向かう中、ドライバーとクルマのインターフェイスはボイスとなる。

出典: Ford

HuaweiはスマホにAlexaを組み込む

Huaweiは最新のスマートフォン「Mate 9」 (下の写真) にAlexaをプレインストールして出荷することを明らかにした。Mate 9はボイスアプリを搭載し、この背後でAlexa Voice Serviceが使われている。利用者は音声で備忘録を作成し、天気予報や渋滞情報を尋ねることができる。また、スマートホームのハブとして家電を操作することもできる。ボイスアプリは2017年初頭から提供される。GoogleはAndroid向けにAI会話機能「Assistant」を提供しており、Alexaと正面から競合することになる。

出典: Huawei

UBTechはロボットのインターフェイスにAlexaを採用

UBTechはShenzhen (中国・深セン) に拠点を置くロボット開発会社で「Lynx」 (下の写真) を発表した。LynxはAlexa Voice Serviceを組み込み、言葉でロボットを操作することができる。音楽再生やメールの読み上げなどを言葉で指示できる。Alexaが提供する機能の他に、Lynxは搭載しているカメラで利用者を識別し、個人に沿った対応ができる。また、カメラをセキュリティモニターとして使えば、Lynxが留守宅を監視する。価格は800ドルから1000ドルで2017年後半に発売される。ロボット開発では会話機能がネックとなるが、Alexa Voice Serviceを使うことで、開発工程が短くなる。手軽にロボットを開発でき、市場への参入障壁が大きく下がる。LynxはAlexaがロボットの標準インターフェイスとして普及する可能性を示唆している。

出典: UBTech

テレビを音声で操作する

DISHは衛星テレビ会社でテレビ放送やインターネットサービスを提供する。DISHはセットトップボックス「Hopper DVR」をAmazon Echo又はDotとリンクし、テレビを言葉で操作できる機能を提供する (下の写真)。Echoに対し「Alexa, Go to ESPN」と指示すると、テレビはスポーツ番組「ESPN」にチャンネルを変える。番組を検索するときは「Alexa, what channel is the Red Sox game on?」と尋ねる。EchoはRed Soxの試合中継があるチャンネルを回答する。このサービス2017年前半から提供される。これからのテレビはリモコンだけでなく、音声操作が必須のインターフェイスとなる。GoogleはAI会話機能「Assistant」でテレビを音声で操作する機能を提供している。テレビ操作のインターフェイスでもAmazon AlexaとGoogle Assistantが覇権を争うことになる。

出典: DISH

LGは冷蔵庫にAlexaを搭載

LGはスマート冷蔵庫「Smart InstaView Door-in-Door」 (下の写真) でAlexa Voice Serviceを利用することを発表した。冷蔵庫は29インチのタッチパネルを搭載し (下の写真、右上のパネル) Microsoft Cortanaを音声インターフェイスとして利用してきた。今般、LGはこれをAlexa Voice Serviceに変更する。Alexaが組み込まれることで、音声でレシピを検索し、ショッピングリストを作成できる。また、Amazonでの買い物が音声でできる。冷蔵庫はスマートホームのハブとしても機能する。LGスマート冷蔵庫は音声で操作できない家電は売れなくなることを示唆している。

出典: LG Electronics

AIを駆使した高度な会話機能

メーカーが相次いでAlexaを採用する理由はAIを駆使した高度な会話機能にある。Alexaを搭載したデバイスは「Alexa」という枕言葉を検出すると、それに続く音声ストリームをクラウドに送信する。一連の会話処理はクラウドで実行される。具体的には音声認識 (Speech Recognition)、自然言語解析 (Natural Language Processing)、音声生成 (Text-to-Speech Synthesis) の処理が実行され、これらのプロセスでAIが使われている。単一のAIではなく、各モジュールに高度なAIが実装されボイスサービスを支えている。

Alexa人気の秘密は教育データ

Amazon Alexaが高度な会話機能を提供できる理由はAIアルゴリズムを最適化する教育データにある。教育データとは喋った言葉 (サウンド) とそれを書き下した文字 (テキスト) の組み合わせを指す。ボイス教育データとしてはコールセンターのオペレータの会話が使われる。しかし、家庭環境での会話 (「ガレージのドアを閉めて」など) をベースにした教育データは存在しない。Amazonは2014年に製品を出荷し、利用者からのフィードバック (下の写真) などを使い、教育データを整備してきた。この蓄積が高度な会話機能を支え、他社の追随を許さない理由になっている。

出典: VentureClef

日本企業のオプションは

家電メーカー、自動車メーカー、ロボット開発企業はAlexa Voice Serviceを利用することで製品に会話機能を組み込むことができる。自社でAIボイス機能を独自に開発する手間が省ける。Amazon AWSを利用するように、これからはAlexa Voice Serviceが標準ボイスクラウドとなる勢いをみせている。AIの基礎技術であるボイスサービスをAmazonに頼るのか、それとも独自で開発する道を進むのか、日本産業は岐路に差し掛かっている。