Archive for March, 2018

フェイスブック個人情報の不正使用問題、Cambridge Analyticaとはどんな企業か、大統領選挙への影響はあったのか

Saturday, March 31st, 2018

Facebook利用者の個人情報が不正に使われ、情報管理の責任が厳しく問われている。この疑惑の中心は英国のCambridge Analyticaというベンチャー企業で、5000万人の個人情報を不正に入手した疑いがもたれている。Cambridge Analyticaはこれら個人情報をAIの手法で解析し、米国大統領選挙に影響を与えたとされる。

出典: Google

Cambridge Analyticaとは

Cambridge Analyticaはロンドンに拠点を置くベンチャー企業で、データサイエンスの手法で消費者や有権者のパーソナリティを把握する技術を開発 (上の写真、本社ビル)。二つのソリューションを提供しており、広告企業には消費者を対象としたターゲティング広告を、選挙関係者には有権者を解析する選挙ツールを提供する。Facebook個人情報が有権者の政治指向を把握するために使われたと疑われている。

Psychographic Analysisという技法

消費者や有権者を解析する際に「Psychographic Analysis (心理解析)」と呼ばれる技法が使われる。これは、個人の性格を把握しグループ化する手法で、Facebookプロフィール情報を使って、利用者の性格特性を導き出す。具体的には、利用者がLike Button (いいね!ボタン) を押した情報でパーソナリティを把握することができる。

モデルを応用すると

このモデルを使うとアルゴリズムは、画家のダリ (Salvador Dalí) が好きな人は開放的な性格で、ジョギングを趣味とする人は几帳面な性格と判定する。また、アニメや漫画が好きな人は社交的でないと診断する。これを選挙に応用すると様々な知見を得ることができる。このモデルは共和党支持者と民主党支持者を正確に判定できる。更に、共和党支持者のなかで、閉鎖的で心配性な有権者を特定することができる。アルゴリズムはこのグループが低学歴で高齢の男性の共和党支持者と推定する (トランプ大統領のコア支持者層を示す)。Psychographic Analysis はLike Buttonを押すパターンとパーソナリティの間には強い相関関係があることを示している。

————————————————————————————-

Psychographic Analysisとは】

ベースとなる研究論文

この技法のベースとなる理論は、ケンブリッジ大学心理学部 (Department of Psychology, University of Cambridge) とスタンフォード大学コンピューターサイエンス学部 (Department of Computer Science, Stanford University) が共同で開発した。この手法を使うとLike Buttonデータをアルゴリズムに入力すると、被験者のパーソナリティを5つの要素で推定する。人間のパーソナリティは五つの要素で構成され、それぞれ、Openness(開放性)、Conscientiousness(良心的)、Extraversion(外交的)、Agreeableness(協調性)、Neuroticism(不安感) となる。これらがどんな比重で構成されるかで人の性格が決定づけられる。

出典: Michal Kosinski et al.

Personality Test

両大学はPsychographic Analysisについて論文「Computer-based personality judgments are more accurate than those made by humans」でその手法を発表した。この手法は被験者のパーソナリティをFacebookのLike Buttonから判定する。最初に、被験者 (70,520人) がPersonality Test (性格診断テスト) を受け、性格を判定する。性格は上述の五つの要素で構成され、Personality Testによりそれぞれの重みが決まる (上のグラフィック、左端)。

Facebook Likes

次に、これら被験者の Facebook個人プロフィール情報を参照する。Like Buttonを押した対象 (例えばRunning、Ford Explorer、Barak Obamaなど) を把握し、被験者がどの項目に興味を示しているかを掴む (上のグラフィック、左から二番目)。

情報収集方法

これら個人情報を収集するためにアプリ「myPersonality」が開発された。利用者はこのアプリでPersonality Testを受け自分の性格を知ることができる。また、利用者の許諾のもと、アプリはLike Buttonが押された情報を収集する。これらの情報は学術研究のためだけに利用された。

機械学習の手法

Personality TestとLike Buttonの情報が集まると、次に、これらデータ間の関連性を機械学習 (Linear Regression) の手法で導き出す。パーソナリティといいね!ボタンの関連性を定義する変数を導き出す。例えば、外向性が強い人は、Running、Ford Explorer、Barak Obamaなどの項目をどんなパターンで好むかを算定する (上のグラフィック、左から三番目)。

モデルで判定

決定したモデルを使って実際の判定を実施する。Personality Testを受けていない被験者のLike Button情報をこのモデルに入力すると、個人のパーソナリティを判定する。上述の五つの構成要素がどの割合であるかを推定する (上のグラフィック、右端)。このモデルはLike Button情報だけで、その人物の性格を推定できることを示している。

————————————————————————————-

モデル開発を開始

Cambridge Analyticaは米国大統領選挙に先立ち、モデルを開発するために、Psychographic Analysisを開発したケンブリッジ大学にコンタクトし協力を求めた。しかし、賛同をえることができず、この研究に詳しい同大学のAleksandr Kogan教授に支援を求めた。Kogan教授は上述の手法をベースにモデルを開発した。

5000万人の個人情報を収集

Kogan教授は上述「myPersonality」を模した性格診断テストアプリ「thisisyourdigitallife」を開発し、Facebook利用者27万人がこれを利用した。利用者はこのアプリで自分のパーソナリティを知ることができる。同時に、アプリは個人情報にアクセスすることを求め、プロフィールデータが収集された。更に、アプリは利用者の友人のプロフィール情報にもアクセスし、Kogan教授は5000万人分の個人情報を入手した。このデータに対しPsychographic Analysisの手法で解析を実行し、3000万人のパーソナリティを推定した。

個人情報を不正に提供

Kogan教授はこれらの情報をCambridge Analyticaに提供したとされる。その当時、Facebookは利用者の許諾を得ると、第三者が個人情報を収集することを認めていた。しかし、収集した情報を他人に渡すことは禁じていた。ここが問題の核心部分で、Facebookの規定を逸脱し、Cambridge Analyticaは個人情報を不正に受け取った。Cambridge Analyticaはこれを否定しているが、英国政府はデータ不正使用の容疑で捜査を開始した。

個人情報はどう使われた

Cambridge Analyticaに渡された個人情報がどのように使われたかについては明らかになっていない。Psychographic Analysisを選挙戦に適用すると、Like Buttonが押された情報から、有権者のパーソナリティを把握できる。ひいては、有権者の政治的指向を把握でき、最適なキャンペーンを展開できる。

出典: Reuters

有権者の弱点を突く

この問題を告発した元社員Chris Wylie (上の写真、英国議会での公聴会) は、このモデルを米国大統領選挙にどう適用したかについて証言した。このモデルは有権者の精神的な弱点を洗い出すことを目的としていた。更に、この弱点を刺激するフェイクニュースをターゲティング送信することで、有権者を特定方向に向かわせ、トランプ候補への投票を促すとしている。ただ、Wylieは、モデルを運用するプロセスには関与しておらず、実際にどう活用されたかは分からないとも述べている。

効果を疑問視する声も

Psychographic Analysisは既にターゲティング広告で使われており、消費者のパーソナリティを把握し最適な広告メッセージが配信されている。Netflixは視聴者が好むであろう映画を推奨するためにこのモデルを使っている。一方、この手法が有権者にどれだけインパクトを与えるかについては疑問視する声が多い。有権者の心を動かすのは難しく、Cambridge Analyticaが大統領選挙に及ぼした影響は限定的であるとの見方が大勢を占めている。

Facebookの責任は重大

大統領選挙への影響のあるなしにかかわらず、Facebookは個人データ管理の責任を厳しく問われている。Facebookは個人情報保護対応を進めており、プロフィール設定方式を分かりやすくした。今までは、個人情報設定は20画面に分散していたが、これを1つの画面に集約し、情報管理を容易にした。また、Facebookは第三者機関が生成する解析データの提供を中止した。データ解析企業ExperianやAcxiomなどがオフラインデータを解析し、これを広告主に提供しているが、これを停止すると発表した。

真相究明

Cambridge Analyticaは米国大統領選挙だけでなく、英国Brexit国民投票で離脱派の解析ツールとしても使われた。多くの識者は同社の影響力を疑問視するが、国民世論がデータ解析で操作されているとの感触はぬぐい切れない。Cambridge Analyticaが不正にデータを受け取り、大統領選挙に影響したのか、真相解明は今後の捜査を待つことになる。

Uber自動運転車が死亡事故を起こす、システムに重大な問題があるのか

Tuesday, March 27th, 2018

Uber自動運転車が道路を歩いていた女性をはね死亡さる事故を起こした。事故原因については調査中であるが、Uberのシステムに重大な問題があるとの見方が出ている。この事故を受け、アリゾナ州は無期限でUberの走行試験を認めないことを発表。重大事故でUberへの信頼が大きく低下している。

出典: Uber

事故現場

事故は2018年3月18日、Tempe (アリゾナ州フェニックス郊外) で起こった。自動運転車Volvo XC90 SUVが、時速40マイルで走行中、女性をはねた。女性は自転車を押しながら、道路を左から右に横切っていた。クルマは減速することなく直進し、女性をはねて死亡させた。クルマにはセーフティドライバーが搭乗していたが、危険回避措置を取ることはなかった。(下の写真が事故現場で、女性は左側の中央分離帯の辺りから、右方向に歩いていた。Uberは一番右の車線を走っていた。)

出典: Google Street View

自動運転車のセンサー

Uber自動運転車は複数のセンサーを搭載し、クルマ周囲のオブジェクトを認識する (下の写真)。屋根の上に1台のLidar (レーザーセンサー) と7台のカメラを搭載している。また、レーダーを設置しており、周囲360度をモニターする。

出典: Uber

Lidarは歩行者を認識する

事故が起こったのは午後10時ころで、夜間走行中の出来事であった。周囲が暗くてもLidarはオブジェクトを認識し、歩行者ほどの大きさであれば確実に検知できる。UberはVelodyne社製のLidar (HDL-64E)を搭載しており人物を把握する (下の写真、Lidarが捉えたポイントクラウド)。Velodyneはコメントを発表し、このケースではLidarは女性と自転車を確実に認識できるとしている。また、回避措置を取る判断はLidarではなくシステムがするとも付け加え、Uber自動運転ソフトウェアに問題があるとの見解を示している。

出典: Velodyne

カメラもイメージを捉えている

Uberは屋根の上にカメラを7台搭載しており、前方のカメラは近距離と遠距離をカバーする。カメラは前のクルマが減速するのを把握し、また、歩行者を認識する。更に、信号機や道路標識を読み取るために使われる。事故直後のニュース報道を見ると、夜間であるが道路照明灯が設置されており、一定の明るさであることが分かる。カメラの性能は公表されていないが、ダイナミックレンジが広く、女性を捉えている可能性が高い。

ダッシュボードカメラ

自動運転を制御するカメラとは別に、ダッシュボードにモニター用のカメラが備え付けられ、前方と車内を撮影していた。事故捜査に当たっている警察 (Tempe Police Department) は、ダッシュボードカメラの映像を公開した。これを見ると歩行者は左から右に道路を横断していることが確認できる (下の写真)。また、クルマは減速しないでそのまま直進したことも分かる。

出典: Tempe Police Department

セーフティドライバー

車内を撮影したビデオを見ると、セーフティドライバーは前方を見ておらず、視線を下に落としていたことも判明した。前を注視し問題が発生するとそれを回避するのがセーフティドライバーの任務であるが、この事故ではこの措置が取られなかった。

レーダーは補助的な役割

Uberはクルマ周囲360度を見渡せるレーダーを搭載している。レーダーは走行中のクルマや停車しているクルマなどを把握する。レーダーはドップラー効果を利用して、オブジェクトの移動速度を把握する。しかし、レーダーの解像度は低く、ピンポイントでオブジェクトの位置を特定することはきない。このため、一般にレーダーは単独で使われることはなく、レーダーが歩行者を捉えても、アルゴリズムはこの情報だけでブレーキをかけるようにはプログラムされていない。

事故調査が始まる

UberのLidarは確実に歩行者を認識しており、カメラもその画像を捉えている可能性が高い。それにもかかわらず、クルマはなぜ回避措置を取らなかったのか、議論を呼んでいる。ここが事故原因を解明するポイントとなる。現在、国家運輸安全委員会 (National Transportation Safety Board、NTSB) が事故調査を進めている (下の写真)。NTSBは航空機事故だけでなく、交通事故でも重要な案件を担当する。自動運転車事故のように、クルマのソフトウェア解析が求められる高度な案件は、NTSBが原因を究明する。

出典: National Transportation Safety Board

システムに問題か

NTSBによる調査結論は出ていないが、Uberの自動運転システムに重大な問題があるとみられている。New York TimesはUberのDisengagement (自動運転機能解除措置) の頻度は13マイルと報道している。Disengagementとは、自動運転車が問題に遭遇し、セーフティドライバーが自動運転モードをを解除する措置を示す。つまり、Disengagementを実行することは、自動運転車が危険な状態にあることを意味し、不具合の件数とも解釈できる。Uberではこれが13マイル毎に発生し、システムはまだまだ未熟な状態にあることが分かる。一方、WaymoのDisengagementの頻度は5,600マイルで、両者の製品完成度には大きな開きがある。

アリゾナ州知事による試験運行停止命令

アリゾナ州知事 (Doug Ducey) は、自動運転車の市街地走行試験に寛大であるが、今回の事故を受けて、Uberに試験走行を停止する命令を下した。更に、事故の原因は間違いなくUberにあるとも述べ、厳しい姿勢で対応していくことを明らかにした。これ以上のコメントはないが、Uberはアリゾナ州で自動運転車走行試験を再開できないとのうわさも広がっている。州知事は、事故の少し前に、Waymo無人タクシーの運行を認めたばかりである。この事故により、アリゾナ州だけでなく他の州でも、自動運転に対する規制が厳しくなると見られている。

自動運転車の開発方針

Uber自動運転車事故は、システムが不安定であるにもかかわらず、セーフティドライバーが注意を怠り、回避措置をとらなかったことに原因がある。ネット上には、Uber自動運転車が市街地を軽快に走行しているビデオがたくさんあり、技術が完成したようにも思える。しかし、実際にはシステムは未完成で、市街地を走るにはリスクが高いことを認識させられた。Uberはこれから自動運転車開発をどう続けていくのか、大きな判断を迫られる。

Waymo自動運転車がついに完成!!無人タクシーの営業運転を開始

Friday, March 16th, 2018

Waymoは無人タクシーの営業運転を始めたことを明らかにした。スマホでクルマを呼ぶと、ドライバーが搭乗していないWaymo自動運転車がやって来る (下の写真)。Google・Waymoは2009年から自動運転車を開発しているが、ついにこの技術が完成するに至った。

出典: Waymo

無人タクシーとして運行開始

Waymoはアリゾナ州フェニックスで自動運転車の実証実験を続けている。これは「Early Ride Program」と呼ばれ、2017年11月からは無人タクシーとしての試験走行が始まった。しかし、無人タクシーといっても、安全のためにセーフティドライバーが搭乗し、緊急事態に備えていた。2018年3月からは、セーフティドライバーが搭乗しない、文字通り無人タクシーとして運行を開始した。

安全性をPRするビデオ

これに先立ち、Waymoは無人のクルマがどのように安全に走行できるのかを説明したビデオを公開した。ビデオはX-View形式で、クルマの周囲360度を見渡すことができる。スマホでこのビデオを見ると、クルマの前方だけでなく、体を回転させると側面から背後まで見ることができる。

クルマが認識する世界

ビデオはクルマに搭載されているセンサーが周囲のオブジェクトをどのように捉えるかを中心に構成されている。つまり、クルマのセンサーは何を見て、どのようにハンドルを切るのかを、グラフィカルに説明している。

Lidarが捉えるイメージ

クルマの眼の中心はLidar (レーザーセンサー) で、三種類のモデルが搭載されている。「Short-Range Lidar」はクルマの前後左右四か所に設置され、車両近傍のオブジェクトを認識する。クルマのすぐ近くにいる小さな子供などを把握する。解像度は高く、自転車に乗っている人のハンドシグナルを読み取ることができる。(下の写真、路上の緑色のポイントクラウドの部分。)

「Mid-Range Lidar」と「Long-Range Lidar」は屋根の上のドームの内部に搭載され、中長距離をカバーする。後者は可変式で、レーザービームがスキャンする角度を変えることができ、特定部分にズームインする。これらのLidarは周囲の車両や歩行者など把握し、最も重要なセンサーとなる。 (下の写真、青色のポイントクラウドの部分。)

出典: Waymo

レーダーの機能

クルマはレーダーを搭載しており「Radar System」と呼ばれ、ミリ波を利用して路上のオブジェクトを把握する。ミリ波は水滴の中でも移動でき、雨や霧や雪のなかでも機能する。また、日中だけでなく夜間でも使うことができる。クルマの屋根の四隅に搭載され、周囲のオブジェクトまでの距離とその移動速度を把握する。 (下の写真、走行中や駐車中のクルマまでの距離と速度を表示。)

出典: Waymo

高精度なカメラ

カメラは「Vision System」と呼ばれクルマの屋根のドームに格納されている。ダイナミックレンジの広いカメラの集合体で、8つのモジュール から構成される。カメラは信号機や道路標識を読むために使われる。 (下の写真、信号機を把握している。) モジュールは複数の高精度センサーから成り、ロードコーンのような小さなオブジェクトを遠方から検知できる。ダイナミックレンジが広く、暗いところから明るいところまでイメージを認識できる。

出典: Waymo

PerceptionとPrediction:周囲の状況を理解

Waymoは複数のセンサーの情報を統合して周囲の構造を把握する。交差点では、周囲のクルマ、自転車、歩行者などのオブジェクトを把握する。また、信号機とその色を把握してそれに従う。更に、横断歩道や道路の路肩なども把握する。ソフトウェアは、これらオブジェクトが移動している方向、速度、加速度などを推定する。(下の写真、クルマは青色の箱で示され、その距離と移動速度を把握。クルマの走行経路を予想して、それを青色の実線で示す。右前方のクルマは「Police Car」と認識。歩行者は茶色の箱で示される。信号機は白色の枠で示され、「STOP」か「GO」かを認識する。)

出典: Waymo

Planning:走行経路を決定

クルマ周囲のオブジェクトの動きを予想して、ソフトウェアは最適な走行ルートを決める。具体的には、Waymoの進行方向、速度、走るレーン、ハンドル操作を決定する。センサーが認識できる範囲は広く、フットボールコート二面先のヘルメットを識別できる。(下の写真右側、Waymoが認識する周囲のクルマとその予想進行経路。これを元にアルゴリズムはWaymoの進行経路を算出する。それが緑色の実線で表示されている。下の写真左側、同じシーンをシミュレータで表示したもの。)

出典: Waymo

安全運転をプログラミング

ソフトウェアは「Defensive Driving」としてプログラムされている。これは安全サイドのプログラミングを意味し、自転車と十分間隔を取るなど、慎重な運転スタイルに設定されている。運転スタイルがクルマの性格を決めるが、Waymoは安全第一にプログラミングされている。(下の写真、左折中に前方から自転車が接近してきたケース。自転車は桃色の箱で示され、距離は50フィートで速度は毎時9マイル。自転車の予想走行ルートはピンクの実線で示される。自転車は直進するか、右折するオプションがあるが、アルゴリズムは直進する可能性が大きいと判定。このため、Waymoは路上で一旦停止する判断を下した。)

出典: Waymo

ビデオから読み取れる自信

Waymoが公開したビデオを見ると、アルゴリズムは何を見て、どのように運転しているのか、その一端を窺うことができる。そこから、Waymoの技術に対する自信も読み取れ、自動運転車が完成の域に入ったことを感じる。

開発はこれからが本番

ついに、無人タクシーが市街地を走行できるようになったことの意味は大きい。ただ、走行できる範囲はアリゾナ州フェニックスの一部に限定されている。ここは砂漠地帯に作られた街で、天気は良く、自動運転車にとって走りやすい環境である。Waymoは全米の25都市で試験走行を展開しており、難易度が高い地域での無人タクシー運行が次のステップとなる。多くの難題があり、自動運転車の開発はこれからが本番となる。

米国政府は23andMeの遺伝子解析による乳がん検査を認可、消費者はがん発症リスクを知り健康管理

Friday, March 9th, 2018

アメリカ食品医薬品局 (FDA、Food and Drug Administration) は23andMeに対し、遺伝子解析で乳がん発症のリスクを検査することを認可した。これにより消費者は、乳がんを発症するかどうかを知ることができるようになった。FDAがこの手法を認可したことで、米国では個人向け遺伝子解析サービスが急拡大する勢いとなってきた。

出典: VentureClef

23andMeの遺伝子解析サービス

FDAから認可を受けたのはMountain View (カリフォルニア州) に拠点を置く23andMeというベンチャー企業で、個人向け遺伝子解析サービスを提供している (上の写真)。23andMeは、遺伝子配列の変異から被験者がどんな病気を発症するのかを予測し、米国医療市場に衝撃を与えた。しかし、FDAは2013年、予測精度が十分でなく、消費者が不要の手術を受けるなど危険性が伴うとして、業務停止命令を出した。このため、23andMeは医療解析サービスを中止し、人種解析サービスに特化して事業を進めてきた。

FDAから認可を受ける

その後23andMeは事業内容を改良し、2017年4月、FDAは10種類の病気に限り遺伝子解析サービスを認可した。ここにはパーキンソン病やアルツハイマー病が含まれており、消費者は病気を発症するリスクを把握できるようになった。これに続き、2018年3月、FDAは乳がんや子宮頸がんに関する遺伝子解析サービスを認可した。病院では乳がんのスクリーニングで遺伝子解析が使われているが、消費者は23andMeのサービスを使ってがん発症のリスクを知ることができるようになった。

BRCA1とBRCA2遺伝子

乳がん検査では「BRCA1」と「BRCA2」という遺伝子(下の写真)を解析する。BRCA1とBRCA2は共に、ガン発症を抑える機能を持ち、がん抑制遺伝子 (Tumor Suppressor Gene) と呼ばれる。BRCA1とBRCA2は傷ついた遺伝子を修復するためのたんぱく質を生成する。しかし、BRCA1とBRCA2がダメージを受けると、この修復機能が影響を受け、がん発症のリスクが高まる。特に、女性の乳がんと子宮頸がんの発症が高まる。男性にも関与ており、前立せんがんの発症リスクが高まる。

出典: Wikipedia

遺伝子変異とリスク

BRCA1とBRCA2の遺伝子変異ががん発症のリスクを高めるが、これらはAshkenazi Jewish (ユダヤ人のグループ) に多く見られる。このグループの40人に一人がこの遺伝子変異を持つとされる。また、この遺伝子変異を持つ女性の45-85%が70歳までにガンを発症するともいわれている。女優Angelina JolieはBRCA1の遺伝子変異が見つかり、予防のために両乳腺を切除する手術を受けたことを公表した。このニュースのインパクトは大きく、BRCA遺伝子変異と乳がんの関係が認識され、遺伝子検査への関心が高まった。

遺伝子解析の限界

BRCA1とBRCA2に注目が集まっているが、これらの遺伝子変異が検出されなければガン発症のリスクがゼロになるというわけではない。23andMeが試験する範囲は限られており、がん発症リスクをすべて網羅するものではない。BRCA1とBRCA2の遺伝子変異の数は1000を超えるが、23andMeはこのうちの三つを対象に検査する。また、がん発症はライフスタイルとも大きく関係しているが23andMeはこの要素は勘案していない。乳がん発症の原因は数多いが、23andMeはその中で代表的なBRCA1とBRCA2に特化してリスクを評価している。

解析結果をどう解釈すればいいのか

このように遺伝子解析は複雑で完全なものではなく、23andMeから受け取るレポートをどう解釈すればいいのか、消費者から戸惑いの声が聞かれる。これに対して、CEOであるAnne Wojcickiは、ブログの中で、解析結果の活用方法を述べている。23andMeの遺伝子検査は「病気を診断するものではなく」、また、「病被験者が検査結果を見て医療方針を決めてはならない」としている。つまり、検査結果の解釈については、病院の医師などに相談し、判断を仰ぐべきとしている。また、23andMeは、遺伝子解析専門のカウンセラー(Genetic Counselors)に相談してアドバイスを受けることを推奨している。

遺伝子解析専門カウンセラー

遺伝子解析専門カウンセラーとは馴染みのない名前であるが重要な役割を担っている。病院の医療チームの一員で、遺伝子疾病 (Genetic Disorder) に関し、患者にカウンセリングする職務である。サンフランシスコ地区では多くの病院で遺伝子解析専門カウンセラーを置いており患者をサポートしている (下の写真、大手病院Kaiser Permanenteの事例)。個人向け遺伝子解析サービスが急増する中、解析結果を解釈する仕事が増えている。カウンセラーは、遺伝子解析結果を被験者に分かりやすく説明し、必要であれば専門医を紹介する。

出典: Kaiser Permanente

病院の先生は否定的

病院の医師の多くは消費者が独自に遺伝子解析を受けることに対し否定的な考えを持っている。病院では家系に乳がんの病歴がある患者に限り遺伝子解析などでスクリーニングテストを実施している。この条件に該当しない患者が遺伝子検査を受けることは実用的でなく、また、心理的な負担が大きいとしている。

もし遺伝子変異が見つかると

医師の考え方とは裏腹に、多くの消費者が既に23andMeの遺伝子検査を受けている。今までは、BRCA1とBRCA2に関する解析結果は被験者に通知されなかったが、FDAの認可を受け、23andMeはその結果を会員に順次通知する。この結果、発がんリスクが高いと判定された被験者は、23andMeの指針に沿ってカウンセラーや病院の医師の診察を受けることになる。女性の場合は乳がんなどで、男性の場合は前立せんがんが対象となる。

解析と治療のギャップ

これから相談を受ける医師がどのように対応するのかは見通せないが、病院で詳細な検査を実施し、定期的にスクリーン検査を受けることなどが予想される。このように23andMeは遺伝子解析結果を示すにとどまり、その後の医療措置はカウンセラーや医師に任された形となっている。消費者としては両者の間に大きなギャップを感じ、サービスが完結していないとも感じる。

出典: 23andMe

未完のサービスであるが

未完のサービスであるが消費者の間で遺伝子解析サービスの利用者が急増している。23andMeで遺伝子検査を受け、アルツハイマー病を発症するリスクが高いと診断された消費者は、介護保険を購入する動きが急拡大している。病気のリスクを把握し、それに応じてライフプランを修正する人が増えている。消費者は自分の将来の健康状態を知りたいという欲求が強く、問題を抱えながらも、個人向け遺伝子解析サービスが急成長している。

更新履歴:BRCAの表記を訂正

AIが人の死亡時期を予測する、医師より正確で終末期医療で使われる

Friday, March 2nd, 2018

Deep Learningで人がいつ死ぬかを正確に予測できるようになった。アルゴリズムに医療データを入力すると、医師より正確に患者の死亡時期を算出する。AIに余命を宣告されるのは違和感を覚えるが、病院ではこれが重要な情報となる。

出典: Stanford Medicine

スタンフォード大学の研究

スタンフォード大学の研究チームは入院患者の余命をDeep Learningで予測する研究成果を発表した。論文「Improving Palliative Care with Deep Learning」によると、アルゴリズムは患者の余命を93%の精度で予測する。この研究成果は終末期医療を上手く運営するために使われる。現在は医師が終末期医療が必要な患者を選び出すが、余命を長めに推定する傾向が強く、多くの患者がケアを受ける前に亡くなっている。

Palliative Care

スタンフォード大学大学病院 (上の写真) は終末期医療を提供している。これはPalliative Care (パリアティブ ケア) と呼ばれ、余命一年以内の患者を対象とし、治療を進めるとともに本人の意思を尊重し、苦痛や不安を和らげる処置も取られる。Palliative Careは患者とその家族の生活の質を向上させることを目的にしている。

ケアを受ける患者

大学病院はPalliative Careを運営するものの、この治療が必要な患者を上手く特定できないという問題を抱えている。このケアが必要な患者とは余命が3か月から12か月の患者と定義している。このケアを受けるには前準備で3か月かかり、また、12か月を超えてケアを継続するには医師やナースの数が足らない。

医師による余命の算定

このため、担当医師が余命が3か月から12か月の患者を特定し、Palliative Careに移管する仕組みとなっている。しかし、多くのケースで担当医師は患者の余命を長めに予測する。そのため、患者の多くはPalliative Careを受けることなく死亡する。医師は患者の電子カルテのデータを参照し、今までの経験から余命を推定する。人間としての定めなのか、余命の算定は長めになる場合が多い。

患者データとアルゴリズム

このような背景のもとでDeep Learningによる余命算定の研究が進められた。アルゴリズム開発で、スタンフォード大学病院の患者データベース「Stanford Translational Research Integrated Database Environment」が使われた。これは患者の電子カルテ情報を集約したもので、アルゴリズム教育と検証に使われた。患者医療データをアルゴリズムに入力すると、死亡時期を算定する。具体的には、Deep Learningモデルは、患者が3か月から12か月以内に死亡するかどうかを判定 (Binary Classification) する。

アルゴリズム教育

アルゴリズム教育のために221,284人の患者のデータが使われた。この中には3か月から12か月の間に亡くなった患者(15,713人)と、12か月を超えて生存した患者(205,571人)が含まれている。これらのデータを使ってDeep Learningアルゴリズムを教育し、その結果が検証・試験された。

出典: Nigam H. Shah et al.

ネットワーク構造

アルゴリズムはDeep Neural Networkで、入力層と中間層 (18段) と出力層から成る。入力層は13,654のディメンション (13,654種類のデータを入力) で、出力層はスカラーで3-12か月の間に死亡する・しないを判定する。ネットワーク構造はトライアルエラーの方式で多くのモデルが試された。これはHyper-Parameter検索と呼ばれ、ネットワークの基礎となる構造 (ネットワークの段数やアクティベーションファンクションの種類など) を決めていく。

アルゴリズムの評価

完成したアルゴリズムは様々な角度から評価された。対象となる患者を判定する精度 (AUC) は0.93で (上の写真)、100人の患者を選ぶと93人が正しいということになる。また、評価指標として「Precision Recall」を示している。アルゴリズムのPrecision (精度) が0.9の時、Recall (範囲) は0.34をマークした。アルゴリズムの精度が0.9のとき、全対象患者の0.34をカバーするという意味になる。アルゴリズムは精度が高く病院で使えることを示している。

アルゴリズムの判定メカニズム

この研究ではアルゴリズムの精度だけでなく、アルゴリズムが判定した根拠を解析する試みが行われた。複雑な構造のネットワークを直接解析するのは難しいので、入力するデータのパラメーターを変更することで、アルゴリズムが判定した根拠を導き出した。つまり、アルゴリズムのブラックボックスを開けて、その仕組みを垣間見たことになる。

医学的な根拠は

入力データのパラメータを変更することで、患者の生存率を判定する要因を導いた。入力データの種類は、病状だけでなく、治療措置や検査回数など幅広い情報を含む。その結果、アルゴリズムが死亡時期を判定するときに重視した項目は、膀胱腫瘍、前立腺腫瘍、病理検体摘出措置、放射線検査回数などとなる。病気の種類で余命が決まることは直感的に理解できるが、アルゴリズムは病理検体が抽出されることやMRI検査などの回数から死亡時期を算出した。これ以上の説明はないが、MRI検査を頻繁に受けることは、ガンが転移していることの傍証になるのかもしれない。

米国でPalliative Careが広がる

米国内で多くの病院がPalliative Careの導入を進めている。2008年には病院の53%がこのケアを提供していたが、2015年には67%に増加している。Palliative Careを提供する病院が増えているものの、必要な患者の7-8%しかこのケアを利用していないという統計もある。このギャップは病院側のリソース不足に加え、上述の通り、担当医師が対象となる患者を正しく判定できないという問題がある。このため、Deep Learningなどテクノロジーの果たす役割が期待されている。