Archive for December, 2014

コンピューターの”視覚”が劇的に進化! Deep Learningを使ったニュービジネス

Friday, December 19th, 2014

人工知能の最新トレンドであるDeep Learningを取り入れたビジネスが拡大している。その中で、「Convolutional Neural Networks」という技法はイメージ解析に最適であることが、様々なベンチマークで証明されてきた。コンピューターの“視覚”が劇的に進化し、ここに大きなビジネスチャンスが生まれている。

人工知能ソリューション

この分野で注目を集めているベンチャーは、シリコンバレーに拠点を置く「MetaMind」で、企業向けに人工知能ソリューションを提供する。人工知能は「AI Platform」として提供され、テキストやイメージを高精度で認識・解析する。MetaMindが提供する主要機能は「Language」と「Vision」。前者は自然言語解析エンジンで、財務諸表などを理解し、リスクを査定する。後者はイメージ認識 (Image Prediction) エンジンで、イメージからそこに写っているオブジェクトを22000の区分に分類する。

g395_metamind_01

高度なイメージ認識機能

上の写真がVisionの機能で、写真に写っているオブジェクトを分類する。左側は入力したイメージで、右側がその解析結果である。イメージ認識機能は、写真はTabby Cat (トラネコ) と正しく認識している。解答には解答候補と自信度が表示される。Tabby Catの自信度は25%で、Egyptian Cat (エジプシャンマウ) は23%で、判定の難しさもうかがい知れる。動物や植物の種類を言い当てるのは、人が行っても専門知識が必要で、判定が難しい。

g395_metamind_02

写真が何を意味しているか

利用者が写真をアップロードしてイメージ認識機能を試験できる。上の事例はケーブルカーの写真をアップロードしたものであるが、解析結果はMoving Van (動いているバン) と回答した。解答候補にはスクールバスや自動車などが並ぶが、ケーブルカーはでてこない。但し、ケーブルカーを横から撮影した写真では正しく認識する。更に、Moving (動いている) の部分は正しく認識している。単に、オブジェクトを言い当てるだけでなく、どんなシーンであるかも理解する。これを「scene understanding」と呼び、写真が何を意味しているのかを、ある程度理解できるようになった。

g395_metamind_03

食品に対する認識機能が強化された

Visionの特徴は料理など、食品に対する認識機能が強化された点である。上の事例はスパゲッティの写真をアップロードしたものでるが、Visionは「Spaghetti Bolognese」(スパゲッティ・ボロネーゼ) と正しく答えている。単に、スパゲッティというのではなく、料理の各パーツを認識し、その種類も特定できる。更に、皿に乗っているサラダで一部が隠れているが、正しく回答した。

イメージ認識の応用分野

食品の写真からその種類を特定する機能は、健康管理アプリで使われている。スマートフォンで食事を撮影すると、システムがイメージを分類し、食事内容を把握し、カロリー量を計算する。今までは、マニュアルで食事の内容を入力していたが、MetaMindを使うと、この面倒な作業を自動化でき、健康管理アプリの使い勝手が大きく向上する。この他に、病院で乳がんの検査を受けると、MetaMindが撮影イメージを解析し、その結果を判定する。このような機能はMachine Visionと呼ばれ、自動車に搭載すると、周囲の歩行者や自転車を認識し、自動で停止するなど、安全性向上に大きく寄与する。

g395_metamind_08

イメージ認識機能を教育する

Visionが高精度でイメージを判定できる背景には、システムを効率的に教育する環境が整っているためである。この教育システムは「IcMe」(Image Classification Made Easy) と呼ばれ、イメージをドラッグ&ドロップするだけで、簡単に利用できる。上の写真はIcMeを使ってクロワッサンの教育を行っているところ。ここではイメージ判定モジュール (Image Classifier) にプレイン・クロワッサンとアーモンド・クロワッサンの違いを教えている。それぞれのサンプルイメージをシステムにアップロードして教育する。上の写真はプレイン・クロワッサンの写真をアップロードしているところ。

g395_metamind_05

教育が終わると、その成果を試験できる。上の写真がベンチマーク結果で、アーモンド・クロワッサンのサンプルイメージをアップロードすると、イメージ判定モジュールは正しく認識した。更に、自信度は99%と高く、自信を持って回答した。人が見てもアングルやアーモンドスライスのつき方により、両者を見間違うことがあるが、MetaMindは食料品に対しては高精度で判定を下す。

ビジネスモデル

上の事例の通り、MetaMindはIcMeを公開しており、だれでも無償で自由に利用できる。MetaMindのビジネスモデルはシステムインテグレーションやカスタマイゼーションで、企業向けに、ミッションクリティカルなシステムを構築する。具体的には、業務に特化したデータを大量に使い、イメージ判定モジュールを教育し、判定精度を上げる。(上述ケーブルカーの事例では、教育が十分にできていなかった。) また、MetaMindは企業向けに教育やテスト環境をインテグレーションするサービスも提供している。人工知能専門家が少ないなかで、企業はMetaMindを活用することで、限られた知識で人工知能ソリューションを構築できる。

g395_metamind_06

Deep Learningを活用

MetaMindの特徴はDeep Learningをイメージ判定に応用していること。この手法を使うことで、イメージのピクセルを読み込み、特性 (アーモンド・クロワッサンなど) を特定できる。こちらが指定した名称 (「Almond Croissant」など) を元に、IcMeは読み込んだイメージの種類を学習していく。IcMeは既に基本学習を終えており、新しいカテゴリーを素早く学習できる。基本学習ではイメージデータベース「ImageNet」が定義するカテゴリーを利用している。ImageNetは、英単語のデータベース「WordNet」に対応するイメージを格納したもので、イメージ解析の“教材”として利用されている。上の写真はその事例で、「Dasiy」(デイジー、キク科植物) の分類と対応する写真を示している。IcMcはこれを学習しており、「Daisy」を見分けることができる。MetaMindはその将来性を高く評価され、Salesforce.com創設者Marc Benioffなどが投資している。

Convolutional Neural Networks

IcMeはDeep Learningの中で、「Convolutional Neural Networks (CNN)」という技法を利用している。CNNとは、スタンフォード大学が公開しているチュートリアルを参照すると、複数階層の「Neural Network」で「Convolutional Layers」から構成される。CNNは2D構造(イメージやスピーチシグナル) の入力を解析するために利用される。「Pooling」などの処理を通して、不変な特徴を抽出すると定義される。

これが公式の定義であるが、平たく書くと、CNNは脳の構造を模したネットワーク (Neural Network) で、写真を読み込み、そこに何が写っているか、その特徴を抽出 (Convolutional Layersでの演算) する。この特徴からそのままイメージ判定を行うと、計算量が膨大になるため、特徴量を統計処理し小さく纏める (Pooling)。この処理を繰り返し、この小さくまとまった特徴を判定し、写真に写っているオブジェクトを把握する。CNNの特徴はパラメターの数が少なく、教育が簡単なことで、今ではイメージ解析の定番ツールとなっている。

コンピューターの視覚が劇的に進化

CNNは生物の脳がイメージ処理する方式にヒントを得て開発された。コンピューターが視覚系を模したものであるが、今までは計算能力に制限があり、適用は限定的であった。今では、GPUを含め高速計算を低価格で行えるようになり、アルゴリズムの進化と共に、この技術が一気に開花した。コンピューターの視覚が劇的に進化している。

犯罪者の社会復帰を後押しするインキュベーター、刑務所は人材の宝庫!

Friday, December 12th, 2014

米国で犯罪者の社会復帰を支援する事業が話題を集めている。インキュベーターのモデルで、罪を犯した人が起業するのを支援する。犯罪者の中には優秀な人材が埋もれており、これを社会に役立てようという試みである。実際に、刑務所内でプログラミング教育が始まり、その成果に注目が集まっている。刑務所を舞台に新たな取り組みが始まった。

g394_defy_ventures_01

犯罪歴のある人の事業を支援

この事業を推進してるのが「Defy Ventures」というニューヨークに拠点を置く非営利団体で、刑期を終え出所した人を対象に、事業のスタートアップを支援し出資する。創設者でCEOのCatherine Hoke (上の写真、右側の女性) が、シリコンバレーで開催されたカンファレンス「DEMO Fall 2014」で、事業の狙いを自らの体験を交えて紹介した。また、出所して起業家の道を歩んでいる二人 (上の写真、男性二人) が、事業を起こす経緯を語った。

Defy Venturesは犯罪歴のある人を対象としたインキュベーターで、教育プログラムと起業資金を提供し、事業のスタートアップを支援する。このプログラムは10万ドルのファンドを用意し、成績優秀な受講者複数に振り分ける。コンペティションの形でプログラムが進行する。

g394_defy_ventures_02

プログラムの内容

受講者は、まず、導入プログラム「Introductory Training Program」で三週間の教育を受ける。このプログラムを通過した人は「Defy Academy」に進む (上の写真)。これは七か月の集中教育で、受講者はリーダーシップやビジネスの基礎を学習する。今年からオンライン教育を開始し、七つの州から参加している。受講者は「Entrepreneurs-in-Training」 (教育中の起業家) と呼ばれる。講師陣には著名ベンチャーキャピタル「Draper Fisher Jurvetson」のTim Draperなどが含まれている。受講生はプログラムの中で起業について学ぶだけでなく、実際に起業しビジネスを始める。

Defy Venturesは受講者に対し、前述の10万ドルのファンドから、起業のために一人当たり最大2万ドルを出資する。Defy Venturesが出資先を選定する際は、ビジネスの将来性、ビジネスピッチ、プログラムの成績などが考慮される。出資対象ビジネスは精査され、Defy Venturesが認めているビジネスタイプに限定される。

プログラムの実績とビジネスモデル

このプログラムを終了し、実際に起業した件数は71社に上る。ベンチャーキャピタルと異なり、Defy Venturesは出資した資金を回収するのが目的ではない。Defy Venturesは篤志家からの寄付で運用している。一方、今年から授業料を徴収するモデルに変更し、中期的には授業料収入で事業を運営することを目指している。

米国では毎年200万人を超える人が収監され、世界の中で単位人口当たりの受刑者数が一番多い。Hokeによると、これら犯罪者にはHustler (やり手) が多く、犯罪者が巨大な人材プールを形成している。Defy Venturesは、ここから優秀な人を発掘することを目指している。このプログラムへの参加者は2012-13年は115人で、2014年は172人に増えている。2015年は大幅に増え1000人となり、このうち500人はサンフランシスコ地区で教育を受ける計画である。

プログラムを受講した感想

ステージ上で二人の受講者が起業に至る経験を紹介した。一人はドラッグディーラーで (先頭の写真、左側の人物)、刑務内で雑誌を読みDefy Venturesを知り、出所してすぐに応募した。今ではスポーツ用品販売の事業を立ち上げている。もう一人 (先頭の写真、中央の人物) は脱税で収監された。服役中に食品ビジネスを立ち上げ、今はそれを拡大し「Inside Out Bars」というブランドでグラノラバーの販売を行う計画だ。話し方はソフトで素敵な笑顔でグラノラバーは売れそうだと感じた。Hokeは28歳の時に、テキサス州で受刑者を起業家に育ているプログラムに参加し衝撃を受けたと述べた。刑務所には優秀な人材が眠っていることを発見し、このビジネスを始めたとしている。Hokeの持論は、受刑者から学ぶことが多いということで、犯罪者は間違った方向に進んでいるものの、ビジネスセンスに長けた人が少なくないという解釈だ。

g394_defy_ventures_03

刑務所内でプログラミング教育

既に刑務所内で受刑者に対する教育が始まっている。「The Last Mile」はサンフランシスコに拠点を置く非営利団体で、受刑者にプログラミングを教育することで、社会復帰を支援している。手に職を付けると、刑期を終えた受刑者が再び犯罪を起こす確率が下がり、刑務所維持費を大幅に削減できるとしている。これは「Prison Programs」と呼ばれ、受刑者に起業のための教育とプログラミング教育を実施する。サンフランシスコ近郊の刑務所「San Quentin State Prison」で10月から18人の受刑者を対象に始まった。これは「Code 7370」と命名され、六か月にわたり、HTML、CSS、JavaScriptなどのプログラミング言語を学ぶ (上の写真)。

教育はプログラミング教育ベンチャー「Hack Reactor」が務める。講師はGoogle Hangoutsを使って受刑者にリモートで講義を行う。受刑者はパソコンを使い、実際にプログラムをコーディングする。受刑者はインターネットにアクセスすることが禁じられており、オフラインで学習する。インターネットにアクセスする際は、刑務所の専任スタッフが受刑者に代わり、検索などを行う。受刑者がプログラミング技術を習得することで、社会復帰を後押しする。収監中はカリフォルニア州政府向けにプログラムの開発を行う。

The Last Mileはプログラミングを社会復帰の手段に利用しているが、長く収監されている受刑者は、キーボードやマウスに触ったことが無い人も少なくない。iPhoneはテレビのコマーシャル知ったという人も多い。解決すべき課題は少なくないが、ITを社会復帰に利用する取り組みが始まった。

g394_defy_ventures_04

大手ベンチャーキャピタルが注目する理由

上述のTim Draper (上の写真、前列中央の人物、受講生との集合写真) はDefy Venturesの講師を務め、プログラム運用に深くかかわっている。Draperは、受刑者はある意味で起業家であり、社会復帰のためには自らがビジネスを興すことが最適の選択肢であると述べている。投資家の眼からすると、受刑者たちは起業に向いていると見ている点は興味深い。また、Hokeの話しを聞くと、犯罪者に対して同じ目線で接し、家族の一員のように対応しているのを感じる。米国は失敗しても再度挑戦できる社会であるが、犯罪者は多くの企業から敬遠されているのも事実である。DraperやHokeは、事業の観点からは、ここに大きなチャンスがあることを感じ取っている。米国という“犯罪大国”だけで成立するモデルかもしれないが、受刑者から革新的なビジネスが登場するのも、そう遠くはないとの印象を受けた。

ウエアラブルでお洒落になる!スマートドレスが似合う洋服を教えてくれる

Wednesday, December 3rd, 2014

米国クリスマス商戦で、オンラインストアーの売り上げが大幅に伸びている。しかし、衣料品の購入では自分に合うサイズの商品を見つけるのが難しい。これは自分のサイズを詳細に掴んでいないのと、業界で統一したサイズ基準が無いためである。この永遠の課題に終止符を打つ技術が登場した。スマートドレスを着ると、サイズを測定でき、自分にフィットする洋服が分かるのだ。

g393_likeaglove_01

スマートドレスでサイズを測定

これは「LikeAGlove」という新興企業が開発しているスマートドレス「Smart Garment」で、シリコンバレーで開催された「DEMO Fall」で公開された。このドレスを着ると体のサイズを詳細に測定でき、自分にフィットする洋服が分かる。上の写真のモデルさんが着ている赤いドレスがSmart Garmentで、伸縮する素材でできている。この素材には伝導性ファイバーが織り込まれ、身体サイズをドレスが計測する。収集したデータは衣服のコントローラーからタブレットに送信される (モデルさんの持っているタブレット)。

g393_likeaglove_02

測定結果をタブレットで閲覧

上の写真が測定結果サンプルで、身体の五か所のサイズが表示される。具体的には、わき下間サイズ、カップサイズ、バンドサイズ、ウエスト、ヒップが計測される。実際にモデルさんにデモを見せてもらったが、お腹をへこませると、その結果がリアルタイムでタブレット上に表示された。実際には、Smart Garmentを数分間着装し、サイズを測定する。

g393_likeaglove_03

消費者にフィットする商品を表示

スマートドレスで自分のサイズが正確に分かるが、これでフィットする洋服を見つけられる訳ではない。もう一つの問題は、衣服のサイズに統一基準がないことである。つまり、同じサイズでも、ブランドにより大きさが異なるのだ。LikeAGloveは主要ブランドの衣服サイズのデーターベースを構築している。サイズが分かると、データベースを検索し、消費者にフィットする商品を表示する (上の写真)。更に、LikeAGloveはサイズだけでなく、消費者の体型を考慮し、一番似合う衣服を推奨する。

g393_likeaglove_04

何故サイズを統一できないのか

ジーンズやシャツを買うとブランドによりサイズが異なり不便を感じる。米国アパレル業界では、洋服のサイズ表記について統一したルールが無いためである。同じサイズ表記でもブランドが異なると、実際の大きさが異なる。上のグラフはそれを示しており、「サイズ10」でもブランドにより、大きさが異なる。黒色の線は業界の中央値で、ピンク色の線は米国人気ブランド「K-mart」を示す。K-martブランドの衣服は、標準値より大きめに設定してあり、「サイズ10」でも、実際にはその上の「サイズ12」に近い。これは「Vanity Sizing」(虚栄心サイジング)というマーケティング戦略である。K-martに行くと、一つ小さい「サイズ10」の服も着れるということで、売り上げが伸びる仕組みだ。

ビジネスモデルは検討中

DEMO Fall会場で、LikeAGlove CEOのSimon Cooperと、CMOのJessica Insalacoから、製品概要とビジネスモデルの説明を受けた。LikeAGloveはSmart Garmentとして、キャミソール (上述のドレス) の他に、ソックス、シャツ、レギングスを開発している。女性用だけでなく、男性向けには、シャツとレギングスを提供する。Smart Garmentの販売チャネルについては未定としているが、複数のオプションを検討している。具体的には、Amazonなど、オンラインストアー経由で販売することを目指している。また、消費者に直販するモデルも検討されている。価格は公表されていないが、量産すると安くなるとしている。

g393_likeaglove_05

eBayは超高精度な仮想試着室を開発中

オンラインストアーの技術進歩が著しい中、eBayは高精度なコンピューターグラフィックスを駆使し、仮想の試着室を開発している。eBayは2014年2月、3Dモデリング技術を開発している企業「PhiSix」を買収し技術開発を開始した。PhiSixは衣服の写真やパターンファイルなどから3Dモデルを生成し、衣服の挙動をシミュレーションする。消費者は高精度のコンピューターグラフィックスを見て、どの洋服を買うかを決める。消費者が体のサイズを入力すると、システムは体にフィットする商品を推奨する。

仮想試着室では異なる環境の中で衣服を着て動くことができる。上の写真はファッションショーのステージをイメージしたもので、モデルの動きは極めて精巧で、人間の動きと見分けがつかない。衣服もその特性に合った挙動をする。このケースではトップスは薄手のシャツで、歩くと風を切って、シャツが軽くたなびく。周囲の環境はステージの他に、街中や、ゴルフ場などが開発されている。購入する服を着て街中を歩くと、どのような感じなのかを把握できる。ゴルフ場では、購入するウエアを着てスイングすると、周りからどう見えるのかを理解できる。eBayはこの仮想試着室をオンラインストアーやモバイルアプリなどで展開する。仮想試着室でリアルなイメージが掴めれば、オンラインストアーの売り上げが伸びるという目論見だ。

g393_likeaglove_06

シリコンバレーでサイズ測定専用機が登場

消費者にフィットする洋服を見つけるために、ベンチャー企業はしのぎを削ってきた。「Bodymetrics」と言うベンチャー企業は、消費者の体をスキャンしてサイズを測定する技術を開発した。この装置はシリコンバレーの高級デパート「Bloomingdales’」に設置された (上の写真)。消費者はこの装置の中で、サイズを測定する。Bodymetricsは16台のMicrosoft Kinectを実装しており、3Dカメラで被写体の体を撮影し、立体オブジェクトを生成する。

10秒ほどで測定ができ、その結果は小売店のiPadに表示される。200ヵ所のサイズを計測し、アプリは最適な商品を推奨する。消費者は事前に専用アプリをインスト―ルしておくと、測定結果を自分のiPhoneで見ることができる。同様に、アプリは最適なサイズの商品を推奨する。従来はレーザー光での測定であったが、Kinectを使うと低価格で簡単に測定ができる。街で話題となった技術であるが、現在は使われていない。

ウエアラブルでサイズを測定するという発想

多くのベンチャー企業から、衣服にセンサーを組み込み、心拍数や心電図を測定し、健康管理に役立てる技術が登場している。これに対し、LikeAGloveはファッションの用途で、スマートドレスで身体サイズを計測する。しかし、一度サイズが分かればドレスは不要となる。家族や知人で利用する方法もあるが、LikeAGloveはドレスの再利用についてはコメントしていない。もし利用者が定期的にサイズを測定すれば、体型の変化を把握でき、健康管理やフィットネスに役に立つ。もう少し先になるが、3Dプリンターで衣服を印刷できれば、身体の詳細な三次元データが必要不可欠となる。究極の洋服を作れるが、Smart Garmentのようなセンサーが再び必要となる。Smart Garmentのデモを見て夢の広がる技術だと感じた。