Amazon Goがサンフランシスコにオープン、レジ無し店舗が全米に広がる

November 9th, 2018

Amazonは2018年10月、サンフランシスコでレジ無し店舗「Amazon Go」をオープンした(下の写真)。Amazon Goはシアトルで3店舗とシカゴで2店舗が運営されており、サンフランシスコ店は6番目の店舗となる。Amazonは2021年までに3000店舗を開設すると報道されており、全米で急速にレジ無し店舗が普及する勢いだ。

出典: VentureClef

近未来のショッピング

オープンしたばかりのAmazon Goで買い物をしたが、近未来のショッピングを体験できる。店舗内は高級コンビニという嗜好で、食料品を中心に品ぞろえされていた。Amazon Goにはレジはなく、取り上げた商品を持ってそのまま店を出ることができる。店舗を出てしばらくすると、購入した商品の代金が登録しているクレジットカードから引き落とされた。

QRコードで入店する

Amazon Goは専用アプリで利用する。店舗に入る際にアプリを起動し、表示されたQRコードをリーダーにかざすとゲートのバーが開く(下の写真)。友人や家族と来店した際にも同じ手順であるが、QRコードをかざして同伴者を先に入店させる。(天井に設置されているカメラが利用者だけでなく同伴者も把握する。)

出典: VentureClef

買いたいものを手に取る

店舗内では、商品を手に取り、買いたいものを自分のバッグに入れたり、手に持って買い物をする(下の写真)。品物を取り上げた時点で利用者の「Virtual Cart(仮想カート)」に商品が入る。気が変わり、取り上げた商品を棚に戻すと、Virtual Cartから取り出される。同伴者も同じ方式で買い物ができる。しかし、商品を取り上げて同伴者に手渡すことは禁止されている。(AIアルゴリズムの教育ができていないためか。)

出典: VentureClef

買い物が終わると

店舗にはレジはなく、買い物が終わると出口専用のゲートを通るだけで支払い処理が完了する(下の写真)。購入した商品の代金は登録しているクレジットカードから引き落とされる。ゲートの横でAmazon Goスタッフが顧客の質問に答えていたが、万引きなどの不正をチェックしている様子はなかった。(万引きすると売り上げ処理されるので不正行為はできない仕組み。)

出典: VentureClef

品揃えに特徴あり

Amazon Goはコンビニのように食料品や飲料水を中心に品ぞろえをしている。デリのコーナーもあり、サラダやサンドイッチなどが並んでいる。入口近くの棚には様々な種類のランチボックスが陳列されていた(下の写真)。ランチボックスは日本のお弁当のように、調理された食材が綺麗に配置されている。他に、フルーツやスープやデザートなどもそろっている。出口そばにはテーブルと椅子が用意されており、買ったものをその場で食べることができる。

出典: VentureClef

ロケーション

Amazon GoはサンフランシスコのFinancial Districtと言われる金融街にオープンした(下の写真、正面ビルの角)。ここに大企業のオフィスが集中しており、周辺にはレストランやデリなどが立ち並ぶ。Amazon Goは忙しい社員のために、食料品やランチボックスを販売する。短い昼休みであるが、レジ待ちの時間が無くなり、ゆっくり食事をすることができる。一方、周囲のデリやファーストフードは売り上げが減る可能性がある。

出典: VentureClef

大規模に展開

AmazonはAmazon Goを2018年末までに10店舗開設する。2019年までに50店舗を、2021年までに3000店舗を開設すると報道されている。当初、Amazonはレジ無し店舗の技術を他社にライセンスすると噂されていたが、自ら店舗を運営する戦略であることが明らかになった。この市場ではAmazon Goに刺激され競争が激しくなっている。ベンチャー企業からAIを駆使したレジ無し店舗技術が登場し、店舗での実証実験が進んでいる。

Amazonが小売店舗をつぶしたのか

Amazon.comの登場で多くの小売店舗が売り上げを減らし、また、廃業に追い込まれている。先月、全米で最大規模のデパートであったSearsが130年の歴史に幕を閉じ、会社更生法の適用を受けた。AmazonがSearsを殺したという解釈があるが、小売店舗は進化の努力をしていないとの意見もある。Amazonは小売店舗をテクノロジーで改良し、消費者に快適な買い物環境を提供する戦略を取る。その一つがAmazon Goで消費者はレジ待ちの苦痛から解放される。Amazon Goは小売店舗が成長できる方向を示しているとみることもできる。

Amazon Goの仕組み】

カメラで顧客と商品を認識

天井には数多くのボックスが設置され、ここにカメラが実装されている(下の写真)。ボックスはプロセッサーで、カメラが捉えたイメージの基礎的な解析を実行する。具体的には、人の存在の認識、顧客の特定と追跡、顧客の動作の意味の把握を実行する。顧客が移動すると、別のカメラがこれをフォローする。更に、カメラは棚の商品を認識し、取り上げられた商品の名前を特定する。

出典: VentureClef

センサーの情報

商品棚には重量計が搭載されている。重量計が棚の重さを計測し、重量が減ると商品が取り上げられたと認識する。カメラが捉えたデータと重量計のデータから、取り上げられた商品を特定する。Amazonはこの方式をSensor Fusionと呼んでいる。

Deep Learningで意味を把握

これら一連のデータはサーバーに送信され、Deep Learningが売り上げを推定する。天井のカメラは顧客の位置を追跡し、特定の商品棚の前にいることを認識し、その挙動 (手を伸ばすなど) を捉える。その棚の商品が取り上げられたことをカメラと重量計で認識する。これら一連の情報をDeep Learningで解析し、特定の顧客が特定の商品を取り上げたことを判定する。

自動運転車は高齢者と若者のどちらの命を救うべきか、アルゴリズムに倫理的な判断が求められる

November 2nd, 2018

MIT Media Labは倫理的な自動運転技術を研究している。自動運転車開発ではトロッコ問題(Trolley Problem)が重要な研究テーマとなる。自動運転車が事故を避けられない状況に陥ったとき、誰を救い、誰を犠牲にするかが議論となる。MIT Media Labはこの問題を一般化し、全世界で世論調査を実施し、その結果を公表した。自動運転車に求める倫理判断は普遍的ではなく、地域で考え方が大きく異なることが分かった。日本を含むアジア圏は欧米と比べ際立った特徴を示している。

出典: Iyad Rahwan et al.

Moral Machine

研究結果は「The Moral Machine experiment」として科学雑誌Natureに掲載された。MIT Media Labはトロッコ問題を一般化した「Moral Machine」という研究を進めている。トロッコ問題とは倫理学の思考実験で、ある人を救うためにある人を犠牲にすることは許されるか、というテーマが議論される。Moral Machineはこのテーマを自動運転車に適用し、13のケースを作り出し、公開実験としてウエブサイトに掲示している。

ウェブサイトでの公開試験

全世界の利用者はMoral Machineにアクセスし、これらの質問に回答することができる。13のケースについて、自動運転車が取るべきアクションを投票することができる。具体的には、自動運転車のブレーキが故障した時、アルゴリズムは人命を救うためにどう判断すべきかが示されている。ここには二つのアクションが提示され、被験者はどちらが倫理的な判断であるかを回答する(上の写真)。このケースでは、自動運転車は直進し歩行者三人を犠牲にする(上の写真左側)。または、自動運転車はハンドルを切りブロックに衝突し、搭乗者三人が犠牲になり歩行者を救う(上の写真右側)。被験者は二つの中から自動運転車が取るべきアクションを選ぶ仕組みとなる。

回答を集約し解析

このように、MIT Media LabはMoral Machineを公開し、クラウドソーシングの手法で回答を取集した。その結果、過去四年間で世界233か国から100万人を超える被験者から回答が集まった。世界最大規模のトロッコ問題の世論調査となり、自動運転車が取るべき倫理的アクションについて知見を得ることができた。(Moral Machineのサイトで回答すると自分の倫理観は世界の標準と比べどの位置にあるかが分かる。)

アルゴリズムに求めること

論文は回答結果を解析し、自動運転車が取るべき倫理的なアクションについて、9のケースにまとめ、その順位を示している(下の写真、棒グラフの長さが重要度を示す)。自動運転アルゴリズムが考慮すべき要因として、歩行者の性別、社会的地位、年齢などをあげている。その結果、アルゴリズムに求めることのトップ3は、「ペットより人の命を救う」、「一人でも多くの人命を救う」、「老人より若者の命を救う」という結果が示された。

出典: Iyad Rahwan et al.

地域による特性

一方、自動運転車に求める倫理的なアクションは国により際立った特性を示していることも分かった。国ごとの特徴を分類すると、世界を三つのグループに分けることができる。Western(米国や欧州)、Eastern(日本を含むアジア圏)、Southern(南米など)の三つに区分でき、これらグループ内では共通の特性を示した(下の写真、グラフは9のケースについて重要度を示す)。

Easternの特性:老人の命を救う

Easternには日本や中国や韓国などが含まれており、国は異なるが同じ特性を示している(下の写真中央)。具体的には、自動運転車は「老人と若者のどちらの命を救うべきか」について、両者の間に違いはなく、特に若者の命を優先する必要はないと回答している(中央のグラフで「Sparing the Youngの値がゼロ」)。これは孔子思想の影響で、年配の人を尊敬する文化に起因すると分析している。

出典: Iyad Rahwan et al.

Westernの特徴:多くの人命を救う

Westernは9のケースについてどれも重要だという結果を示している(上の写真左側)。特に、Westernは「できるだけ多くの人命を救う(Sparing More)」ことを求めているのに対し、Easternはこの項目につては重要視していない。また、Southernは「社会的地位の高い人を救うべき(Sparing Higher Status)」と答えている(上の写真右側)。個人主義が価値観を構成するWesternは多くの人命を、貧富の差が激しいSouthernは社会的地位の高い人を救う傾向がある。

地域にあったアルゴリズム

世界で共通な倫理アルゴリズムが議論されるが、この研究により危険回避の方式は地域により大きく異なることが分かった。つまり、アジアでは老人の命を守る自動運転車が求められるが、南米では社会的地位の高い人を守るクルマが評価される。自動車メーカーはこれら消費者の要望に沿ったアルゴリズムを開発する必要がある。また、政府機関は同様に、市民の要望に沿った形で法令を整備することが求められる。

これを実現するのは難しい

しかし、この思考実験を自動運転技術に落とし込むには、解決すべき課題が少なくない。コンピュータビジョンが歩行者の性別や年齢や服装を判定できるが、自動運転車のセンサーがこれを瞬時に100%の精度で判定するのは難しい。また、交通事故は物理現象が複雑に絡み合い、誰が死亡するかの予測は限界があり、怪我の度合いも考慮する必要がある。このため、最初のステップとしては単純なモデルから考察を始めることになる。もうすでに、ペットではなく人命を優先する技術などが開発されてる。

倫理的なクルマとは

セーフティドライバーが搭乗しない無人の自動運転車が走行を始めたが、クルマが特定の人の命を救う判断を下すことになる。人間の生死をマシンが決めることになり、自動運転車と生活を共にするには違和感を覚える。不安を解消するためには、自動運転車の安全性や事故を回避する仕組みを説明することが最初のステップとなる。そのうえで、国ごとに何が倫理的なアクションなのかを議論し、倫理的なクルマについてのコンセンサスづくりが必要となる。この研究はその手掛かりを示している。

Waymoはシリコンバレーで無人タクシーの走行試験を開始、ロボットカーが公道を走る

October 26th, 2018

Waymoはカリフォルニア州で自動運転車を無人で運行するための認可を受けた。自動運転車の試験走行ではセーフティドライバーの搭乗が義務付けられているが、これにより無人の車両を公道で走らせることができるようになった。Waymoが認可を受けた最初の企業となり、無人タクシーの営業運転が視野に入ってきた。

出典: Waymo

Waymoの開発経緯

Waymoはカリフォルニア州で2009年から自動運転車の走行試験を展開してきた。当時はToyota PriusやLexusに自動運転技術を搭載し開発が進められた。2015年に、Waymoはハンドルのない自動運転車「Prototype」を開発しLevel 5の自動運転技術の開発を始めた。2017年には、WaymoはFiat Chryslerと提携し、Pacific Minivanをベースとした自動運転車(上の写真)の開発に方向転換した。

アリゾナ州での実証試験

Waymoはシリコンバレーだけでなく全米25の都市で試験走行を展開している。アリゾナ州フェニックスでは、既に、セーフティドライバーが搭乗しない無人タクシーの実証試験を進めている。今年末からは、有料サービスを開始するとしており、無人タクシーの商用運行が始まる。今回の認可でWaymoはカリフォルニア州においてもこれに追随する形となる。

カリフォルニア州での試験条件

カリフォルニア州においてWaymoは限られた条件の下で無人タクシーの試験を実施する。走行地域はWaymoの拠点であるMountain Viewを中心とした地域に限定される(下の写真、青色のシェイドの部分)。自動運転車は昼間だけでなく夜間も走行できる。また、気象条件としては霧や小雨の時も走行できる。これらの条件が発行された認可証に規定されている。クルマは許可された域内であればどこでも走れるが、Waymoは最初は走行場所を限定して試験を始め、自信がつくと試験範囲を拡大するとしている。

出典: Waymo

問題が発生すると

試験走行中に無人車両で問題が発生すると、規定された手順に従って対応策を取る。もし、自動運転車が状況を理解できない状況に陥ると、クルマは安全に停止して規定のプロセスに従う。クルマが自分で問題を解決できない際は、監視センターにコンタクトして、サポートを受ける仕組みとなる。具体的には、センターの監視員が遠隔操作でクルマを路肩など安全な場所に移動させ、道路の通行を妨げない措置を取る。クルマは無人で走行するが、監視センターが運行状況をモニターする。

カリフォルニア州政府の判断

カリフォルニア州では既に60社近くが自動運転車の走行試験を展開している。自動運転車を運行する際はセーフティドライバーが搭乗し、緊急事態に備えることが義務付けられている。カリフォルニア州は2018年4月、これを改定し、無人車両が公道で走行試験を実施できる法令を制定した。一部の識者からはクルマを無人で走行させることに対する懸念が表明されるなか、カリフォルニア州は技術進化と安全性のバランスを取りながら法令制定に踏み切った。全米では既にアリゾナ州やフロリダ州で無人車両の試験走行が認められている。多くの自動運転車ベンダーが拠点を置くカリフォルニア州はハイテクで首位の座を守るためにもこの措置に踏み切った。

消費者の反応

技術開発が進む中、米国の商品者は自動運転車を信頼していないという厳しい事実がある。元々、米国の消費者は自動運転技術に懐疑的であったが、UberやTeslaの自動運転車が相次いで事故を起こし、この流れが決定的になった。最新の世論調査によると、消費者の40%は自動運転車に乗りたくないと答えている。米国は技術先進国であるが、同時に、消費者の多くは技術を信用していない国でもある。

Waymoの対応策

Waymoは安全なクルマを開発する他に、如何に消費者の信頼を得るかが課題となる。自動運転車開発当初はWaymoは情報を積極的に配信し、著名記者をクルマに乗せ安全性をアピールしていた。しかし、2015年頃から方針を変え、Waymoは自動運転車についての情報発信を抑制的に行っている。自動運転車の新機能や達成した目標などはブログで情報発信するにとどめ、目立ったイベントなどは実施していない。無人タクシーの商用運行で実績を積み、消費者の安心感が広がるのを待つ戦略のようにも思える。

出典: VentureClef

ロボットカーと一緒に走る

シリコンバレーは自動運転車の実験場で、クルマを運転していると様々な種類の自動運転車に出会う。走っていて一番よく見かけるのはWaymo(上の写真、中央の車両)で、試験車両の台数が多いことが分かる。Waymoの試験走行距離は1000万マイルを超え、技術完成度は他社を大きく引き離しトップを走っている。Waymoの自動運転車と毎日一緒に走行しているが特に不安を感じることはない。しかし、これからはセーフティドライバーが搭乗しないロボットカーが街を走ることになり、何か落ち着かない心持となる。今までと同じアルゴリズムで走行するが、本当に仕様通りに稼働するのか心配でもある。これからはロボットカーと供に暮らすことになり、ドライバーとしては心の準備も必要となる。

Googleは家庭向けロボットを開発!? 先行するAmazonを追随する

October 5th, 2018

Amazonは家庭向けロボットを開発していると噂されている。Googleはこれに対抗して、同じく、家庭向けロボットの開発に乗り出した。Googleは五年前、ベンチャー企業を買収してロボット開発を始めたが、このプロジェクトは頓挫した。GoogleはAmazonに刺激され、ロボット開発を再開し、高度なAIを武器にインテリジェントなシステムを開発している。

出典: Dmitry Kalashnikov et al.

ロボット開発の経緯

Googleは2013年、プロジェクト「Replicant」を発足し、ロボット開発に乗り出した。ロボット開発は「X」(当時のGoogle X)が担い、Andy Rubinが指揮を取っていた。Rubinは「Android Inc.」創業者で、2005年にGoogleが買収し、スマホ事業の基礎を築いた。Rubinはインテリジェント・マシンに興味を持っており、ドイツの製造会社でロボットエンジニアとして働いていた。

ベンチャー企業買収

Googleはロボット企業8社を相次いで買収した。最大規模の買収はBoston Dynamicsで、同社は、軍事支援ロボットとヒューマノイドを開発していた。日本企業でヒューマノイドを開発しているSchaftも買収された。また、コンピュータビジョンをロボットに応用したIndustrial Perceptionや次世代ロボットアームを開発していたRedwood Roboticsも含まれ、Googleはロボット市場に本格的に参入すると見られていた。

開発を中止

しかし、Googleは突然ロボット開発を中止した。Andy Rubinは2014年にGoogleを離れ、その直後、Replicantは活動を停止した。Googleは買収したBoston Dynamicsの買い手を探していたが、2017年、SoftBankが同社を買収することで合意した。これに先立ち、SoftBankは2012年にAldebaran Roboticsを買収し、ロボット事業を開始した。

中止の理由

Googleがロボット開発を中止した理由はロボットを事業化するのが難しいと判断したため。ロボットは配送センターや組み立て工場使われる工業ロボットが中心で、一般社会で使われるサービスロボットの開発には時間がかかる。Rubinは2020年頃に製品を投入する予定でいたが、Google幹部は短期間で成果を求めており、この意識の相違が中止に繋がった。

ロボット基礎研究

Replicant中止の後も、Googleは高度なAIをロボットに適用する研究を進めてきた。Googleはコモディティハードウェアに最新のAI技法を取り込み、インテリジェントなロボットを開発している。具体的には、Deep LearningとReinforcement Learningをロボットの頭脳として使う。Googleのロボット研究施設は「Arm Farm」と呼ばれ(先頭の写真)、10台超のロボットアームが並列に稼働しスキルを学ぶ。

AI研究内容

研究ではロボットアームでドアのノブを回し、それを手間に引いてドアを開けるタスクが実行された (下の写真)。それぞれのロボットはニューラルネットワークのコピーを搭載し、Reinforcement Learningの手法で教育された。行動(Action)を実行するとき、与えられた環境(Sate)で値(Value)を算定し、ロボットはValueを最大にする方向でActionを決定する。ロボットがタスクを実行するときにノイズを加え、それぞれのロボットは異なる環境でタスクを実行する環境を構築する。

出典: Google

ロボットクラウド

これらのデータはクラウドに収集されネットワークを最適化する。アルゴリズムは収集されたデータからうまく処理できたケースとそうでないケースを検証し、Actionとタスク完遂の関係を把握し、ネットワークを改良していく。このサイクルを繰り返し、ロボットの性能を向上する。ロボットは数時間の教育でドアを開けることができるようになった。

最新のAI研究

Googleは最新のAI技法「QT-Opt(Q-function Targets via Optimization)」を開発した。Arm FarmにQT-Optを搭載するとオブジェクトをつかむ(Grasp)精度が飛躍的に向上する。QT-Optとは分散型Q-Learning(Reinforcement Learningの一つのモデル)で、連続したアクション(Continuous Action)を安定的に処理できる点に特徴がある。

ロボットでモノをつかむ

ロボットはカメラのRGB画像からオブジェクトを把握し、アーム先端のグリップを開きそれをつかむ。ロボットが複雑な形状のオブジェクトを正確につかむためには高度な技法が要求される。これは「Picking Challenge」と呼ばれ、多くの企業や研究機関がこのテーマに挑戦している。いかに正確にかつ高速にモノをつかめるかがロボットの商品価値を決める。

アルゴリズム教育

アルゴリズムはカメラの画像を読み込み、ロボットアームの動きと、グリッパーの開閉を出力する(下の写真、左側)。最初にオフラインでアルゴリズムを教育し、次に、ロボットを稼働させオンラインで教育する。オフライン教育では1000種類のオブジェクトが使われ(下の写真、右側)、ロボットはこれらを580,000回つかむ試験が実施された。完成したアルゴリズムを使い、ロボットの性能を検証したところ、オブジェクトをつかむ成功率は96%と好成績をマークした。

出典: Dmitry Kalashnikov et al.

研究の意義

アルゴリズムはオブジェクトを正確に掴むことができるほか、操作をインテリジェントに理解する。アルゴリズムは上手く掴めなかったときには、異なる掴み方を自動で学習する。また、オブジェクトを掴む手法を長期レンジで把握する。(下の写真上段:オブジェクトが纏まっているときはそれを崩す(Singulation)ことを自律的に学習する。中段:立っているローソクはつかみにくいのでそれを倒して実行する。下段:軽くてつかみにくいボールはトレイの端に寄せてつかむ。上の写真右側:煩雑な環境でもオブジェクトをつかむことができる。)

出典: Dmitry Kalashnikov et al.

実社会への応用

Googleのロボット開発はGoogle BrainとXで進められている。GoogleのArm Farmで開発された技術は、ロボットアームだけでなく、ロボットの基礎技術として応用される。実社会には様々な形状のオブジェクトがあり、それに触れた時、オブジェクトの物理挙動も異なる。ロボットを実社会で使うためには多くの課題を解決する必要があるが、これらの研究がその手掛かりとなる。

家庭向けのロボット

Googleは家庭向けロボットの開発を進めていると噂されている。AIスピーカー「Google Home」は人気商品で、多くの家庭で使われている。GoogleはAIスピーカーを駆動型にしたロボットを開発しているとみられている。ロボットは家の中を自律的に走行し、タスクを実行することとなる。

Amazonに対抗

Amazonは「Vesta」という名前でロボットを開発している。これはAmazonの人気商品Amazon Echoを駆動型にしたモデルである。GoogleはVestaに刺激を受け、ロボット開発を再開したとみられる。AIスピーカー市場ではAmazon EchoとGoogle Homeが競い合っているが、今度はロボットで両社が鎬を削る。両社ともロボット技術はまだまだ未成熟であるが、商品化に向けての開発が進み、大きなブレークスルーが期待される。

AIがeスポーツにデビュー、5台のAIが5人の人間と戦闘ゲームで対戦

September 21st, 2018

AIは囲碁のチャンピオンを破り、次の目標をeスポーツに定め、開発が進んでいる。eスポーツとはビデオゲームを使った対戦で、スポーツのように試合が実況中継される。いまeスポーツファンの数が急増し、日本のプロ野球に匹敵する規模のビジネスとなっている。OpenAIは「Five」というAIを開発し、eスポーツのトップチームと対戦した。

出典: OpenAI

OpenAIとは

OpenAIとはAI研究の非営利団体で、Elon Muskらにより2015年に設立された。Muskらが10億ドルを拠出し、最初の数年間でその一部が使われる。OpenAIは他の研究機関と連携し、特許や研究結果を公開し、オープンな手法でAI開発を進めている。高度なAIが社会及ぼす危険性を回避するため、安全なAIを開発する。研究テーマの中心は深層強化学習(Deep Reinforcement Learning)で、安全なインテリジェンスの開発を目指す。

ゲームをプレーする「Five」

OpenAIはビデオゲーム「Dota 2」をプレーするAI「Five」を開発した。Dota 2とは、五人のチームが森の中で戦闘を繰り返し、陣取り争いをするゲーム (上の写真)。Fiveは五人の人間を五セットのAIで置き換え、AI同士が連携しながらプレーする。Fiveは国際ゲームイベントで人間のトップチームと対戦し好成績を収めた。

Dota2とは

Dota 2は米国Valve社が開発したビデオゲームで、MOBA(Multiplayer Online Battle Arena)に区分される。MOBAとは、チームメンバーがキャラクターを操作し、相手のチームと対戦する形式を指す。Dota2では、二つのチーム(「Radiant」と「Dire」)が対戦し、相手のタワー「Ancient」を崩壊させたほうが勝ちとなる。チームは五人で構成され、それぞれがキャラクター(Heroと呼ばれる、下の写真、その一部)を操作し、相手のキャラクターを攻撃する。対戦では戦略やチームプレーが求められ、AIにとって極めて複雑なゲームとなる。

eスポーツとは

Dota 2はeスポーツ(eSports)で最も人気のあるゲーム。eスポーツとはビデオゲームを使った対戦で、有名チームの試合が放映され、ファンがそれを観戦する構造となる。eスポーツファンの数が急増し、2018年には2億人を超え、2021年には3億人になると予想されている。eスポーツの収入は2018年は$905.6Mと予想され、巨大ビジネスとなっている。(ゲームの対戦をスポーツと呼ぶには違和感を感じる人も多いが、実際にプレーを見ると激しい格闘技で、デジタル時代のプロレスと言える。)

出典: Dota2 Wiki

The International

eスポーツの最高峰がDota 2のワールドカップともいえる「The International」(下の写真)。今年はカナダ・バンクーバーで開催され、18チームがトーナメント形式で対戦した。特設会場のステージで競技が行われ、ゲーム画面が大型モニターに映し出される。今年は、欧州チーム「OG」が中国チーム「PSG.LGD」を3対2で破り優勝。対戦の模様はYouTubeなどで中継され、観戦者数は6679万人に上った。これはゴルフ「Masters」の観戦者数に匹敵し、世界中で人気が広まっている。

Fiveの対戦結果

The Internationalという晴れの舞台で、Fiveはエグジビションゲームとして、プロチームと対戦した。Fiveはブラジルチーム「paiN Gaming」及び中国チーム「rOtK」と対戦したが、どちらも1対0で敗戦した。paiN Gamingとの対戦で、序盤は人間チームが優勢であったが、中盤はAIチームが形勢を逆転した。しかし、終盤で人間チームの戦略的な攻撃をうけ敗戦を期した。人間の技には及ばなかったが、対戦時間は51分と長く(平均は45分)、接戦の末の敗戦となった。

出典: Dota2 Wiki

Fiveの概要

Fiveはニューラルネットワーク(Long Short Term Memory、LSTM)で構成され、深層強化学習の手法で教育された。LSTMはRecurrent Neural Network方式のネットワークで、記憶機能があり、長期間にわたる相関関係を処理するのに適している。アルゴリズムはAI同士の対戦を通じて、Dota2のプレーの仕方を学習した。

ゲームをプレーする理由

OpenAIがDota 2をプレーするAIを開発する理由は、ゲーム環境が実社会によく似ているため。Dota 2は、森林の中で敵味方が入り乱れ、攻撃と防御を繰り返す。勝つためには作戦を立て、AI同士のチームワークが要求される。Fiveはゲームという仮想社会で技術を習得するが、ここで培った技法は実社会に応用できる。ロボットや自動運転車が家庭や街中で稼働するとき、Fiveで習得した技術が役に立つ。

囲碁の次はeスポーツ

Google DeepMindはAlphaGoで囲碁のチャンピオンを破り世界を驚かせた。囲碁は複雑なゲームであるが、Dota 2はそれよりはるかに複雑なゲームとなる。囲碁は150手ほどで勝敗が決まるが、Dota 2は2万手と長い。また、囲碁は正規化された空間でプレーするが、Dota2は人間社会を模したカオスな環境で実行される。囲碁を制したAIは、次はeスポーツでトップチームと対戦し、勝利することを目標に据えている。