Archive for the ‘医療’ Category

米国政府は23andMeの遺伝子解析による乳がん検査を認可、消費者はがん発症リスクを知り健康管理

Friday, March 9th, 2018

アメリカ食品医薬品局 (FDA、Food and Drug Administration) は23andMeに対し、遺伝子解析で乳がん発症のリスクを検査することを認可した。これにより消費者は、乳がんを発症するかどうかを知ることができるようになった。FDAがこの手法を認可したことで、米国では個人向け遺伝子解析サービスが急拡大する勢いとなってきた。

出典: VentureClef

23andMeの遺伝子解析サービス

FDAから認可を受けたのはMountain View (カリフォルニア州) に拠点を置く23andMeというベンチャー企業で、個人向け遺伝子解析サービスを提供している (上の写真)。23andMeは、遺伝子配列の変異から被験者がどんな病気を発症するのかを予測し、米国医療市場に衝撃を与えた。しかし、FDAは2013年、予測精度が十分でなく、消費者が不要の手術を受けるなど危険性が伴うとして、業務停止命令を出した。このため、23andMeは医療解析サービスを中止し、人種解析サービスに特化して事業を進めてきた。

FDAから認可を受ける

その後23andMeは事業内容を改良し、2017年4月、FDAは10種類の病気に限り遺伝子解析サービスを認可した。ここにはパーキンソン病やアルツハイマー病が含まれており、消費者は病気を発症するリスクを把握できるようになった。これに続き、2018年3月、FDAは乳がんや子宮頸がんに関する遺伝子解析サービスを認可した。病院では乳がんのスクリーニングで遺伝子解析が使われているが、消費者は23andMeのサービスを使ってがん発症のリスクを知ることができるようになった。

BRCA1とBRCA2遺伝子

乳がん検査では「BRCA1」と「BRCA2」という遺伝子(下の写真)を解析する。BRCA1とBRCA2は共に、ガン発症を抑える機能を持ち、がん抑制遺伝子 (Tumor Suppressor Gene) と呼ばれる。BRCA1とBRCA2は傷ついた遺伝子を修復するためのたんぱく質を生成する。しかし、BRCA1とBRCA2がダメージを受けると、この修復機能が影響を受け、がん発症のリスクが高まる。特に、女性の乳がんと子宮頸がんの発症が高まる。男性にも関与ており、前立せんがんの発症リスクが高まる。

出典: Wikipedia

遺伝子変異とリスク

BRCA1とBRCA2の遺伝子変異ががん発症のリスクを高めるが、これらはAshkenazi Jewish (ユダヤ人のグループ) に多く見られる。このグループの40人に一人がこの遺伝子変異を持つとされる。また、この遺伝子変異を持つ女性の45-85%が70歳までにガンを発症するともいわれている。女優Angelina JolieはBRCA1の遺伝子変異が見つかり、予防のために両乳腺を切除する手術を受けたことを公表した。このニュースのインパクトは大きく、BRCA遺伝子変異と乳がんの関係が認識され、遺伝子検査への関心が高まった。

遺伝子解析の限界

BRCA1とBRCA2に注目が集まっているが、これらの遺伝子変異が検出されなければガン発症のリスクがゼロになるというわけではない。23andMeが試験する範囲は限られており、がん発症リスクをすべて網羅するものではない。BRCA1とBRCA2の遺伝子変異の数は1000を超えるが、23andMeはこのうちの三つを対象に検査する。また、がん発症はライフスタイルとも大きく関係しているが23andMeはこの要素は勘案していない。乳がん発症の原因は数多いが、23andMeはその中で代表的なBRCA1とBRCA2に特化してリスクを評価している。

解析結果をどう解釈すればいいのか

このように遺伝子解析は複雑で完全なものではなく、23andMeから受け取るレポートをどう解釈すればいいのか、消費者から戸惑いの声が聞かれる。これに対して、CEOであるAnne Wojcickiは、ブログの中で、解析結果の活用方法を述べている。23andMeの遺伝子検査は「病気を診断するものではなく」、また、「病被験者が検査結果を見て医療方針を決めてはならない」としている。つまり、検査結果の解釈については、病院の医師などに相談し、判断を仰ぐべきとしている。また、23andMeは、遺伝子解析専門のカウンセラー(Genetic Counselors)に相談してアドバイスを受けることを推奨している。

遺伝子解析専門カウンセラー

遺伝子解析専門カウンセラーとは馴染みのない名前であるが重要な役割を担っている。病院の医療チームの一員で、遺伝子疾病 (Genetic Disorder) に関し、患者にカウンセリングする職務である。サンフランシスコ地区では多くの病院で遺伝子解析専門カウンセラーを置いており患者をサポートしている (下の写真、大手病院Kaiser Permanenteの事例)。個人向け遺伝子解析サービスが急増する中、解析結果を解釈する仕事が増えている。カウンセラーは、遺伝子解析結果を被験者に分かりやすく説明し、必要であれば専門医を紹介する。

出典: Kaiser Permanente

病院の先生は否定的

病院の医師の多くは消費者が独自に遺伝子解析を受けることに対し否定的な考えを持っている。病院では家系に乳がんの病歴がある患者に限り遺伝子解析などでスクリーニングテストを実施している。この条件に該当しない患者が遺伝子検査を受けることは実用的でなく、また、心理的な負担が大きいとしている。

もし遺伝子変異が見つかると

医師の考え方とは裏腹に、多くの消費者が既に23andMeの遺伝子検査を受けている。今までは、BRCA1とBRCA2に関する解析結果は被験者に通知されなかったが、FDAの認可を受け、23andMeはその結果を会員に順次通知する。この結果、発がんリスクが高いと判定された被験者は、23andMeの指針に沿ってカウンセラーや病院の医師の診察を受けることになる。女性の場合は乳がんなどで、男性の場合は前立せんがんが対象となる。

解析と治療のギャップ

これから相談を受ける医師がどのように対応するのかは見通せないが、病院で詳細な検査を実施し、定期的にスクリーン検査を受けることなどが予想される。このように23andMeは遺伝子解析結果を示すにとどまり、その後の医療措置はカウンセラーや医師に任された形となっている。消費者としては両者の間に大きなギャップを感じ、サービスが完結していないとも感じる。

出典: 23andMe

未完のサービスであるが

未完のサービスであるが消費者の間で遺伝子解析サービスの利用者が急増している。23andMeで遺伝子検査を受け、アルツハイマー病を発症するリスクが高いと診断された消費者は、介護保険を購入する動きが急拡大している。病気のリスクを把握し、それに応じてライフプランを修正する人が増えている。消費者は自分の将来の健康状態を知りたいという欲求が強く、問題を抱えながらも、個人向け遺伝子解析サービスが急成長している。

更新履歴:BRCAの表記を訂正

AIが人の死亡時期を予測する、医師より正確で終末期医療で使われる

Friday, March 2nd, 2018

Deep Learningで人がいつ死ぬかを正確に予測できるようになった。アルゴリズムに医療データを入力すると、医師より正確に患者の死亡時期を算出する。AIに余命を宣告されるのは違和感を覚えるが、病院ではこれが重要な情報となる。

出典: Stanford Medicine

スタンフォード大学の研究

スタンフォード大学の研究チームは入院患者の余命をDeep Learningで予測する研究成果を発表した。論文「Improving Palliative Care with Deep Learning」によると、アルゴリズムは患者の余命を93%の精度で予測する。この研究成果は終末期医療を上手く運営するために使われる。現在は医師が終末期医療が必要な患者を選び出すが、余命を長めに推定する傾向が強く、多くの患者がケアを受ける前に亡くなっている。

Palliative Care

スタンフォード大学大学病院 (上の写真) は終末期医療を提供している。これはPalliative Care (パリアティブ ケア) と呼ばれ、余命一年以内の患者を対象とし、治療を進めるとともに本人の意思を尊重し、苦痛や不安を和らげる処置も取られる。Palliative Careは患者とその家族の生活の質を向上させることを目的にしている。

ケアを受ける患者

大学病院はPalliative Careを運営するものの、この治療が必要な患者を上手く特定できないという問題を抱えている。このケアが必要な患者とは余命が3か月から12か月の患者と定義している。このケアを受けるには前準備で3か月かかり、また、12か月を超えてケアを継続するには医師やナースの数が足らない。

医師による余命の算定

このため、担当医師が余命が3か月から12か月の患者を特定し、Palliative Careに移管する仕組みとなっている。しかし、多くのケースで担当医師は患者の余命を長めに予測する。そのため、患者の多くはPalliative Careを受けることなく死亡する。医師は患者の電子カルテのデータを参照し、今までの経験から余命を推定する。人間としての定めなのか、余命の算定は長めになる場合が多い。

患者データとアルゴリズム

このような背景のもとでDeep Learningによる余命算定の研究が進められた。アルゴリズム開発で、スタンフォード大学病院の患者データベース「Stanford Translational Research Integrated Database Environment」が使われた。これは患者の電子カルテ情報を集約したもので、アルゴリズム教育と検証に使われた。患者医療データをアルゴリズムに入力すると、死亡時期を算定する。具体的には、Deep Learningモデルは、患者が3か月から12か月以内に死亡するかどうかを判定 (Binary Classification) する。

アルゴリズム教育

アルゴリズム教育のために221,284人の患者のデータが使われた。この中には3か月から12か月の間に亡くなった患者(15,713人)と、12か月を超えて生存した患者(205,571人)が含まれている。これらのデータを使ってDeep Learningアルゴリズムを教育し、その結果が検証・試験された。

出典: Nigam H. Shah et al.

ネットワーク構造

アルゴリズムはDeep Neural Networkで、入力層と中間層 (18段) と出力層から成る。入力層は13,654のディメンション (13,654種類のデータを入力) で、出力層はスカラーで3-12か月の間に死亡する・しないを判定する。ネットワーク構造はトライアルエラーの方式で多くのモデルが試された。これはHyper-Parameter検索と呼ばれ、ネットワークの基礎となる構造 (ネットワークの段数やアクティベーションファンクションの種類など) を決めていく。

アルゴリズムの評価

完成したアルゴリズムは様々な角度から評価された。対象となる患者を判定する精度 (AUC) は0.93で (上の写真)、100人の患者を選ぶと93人が正しいということになる。また、評価指標として「Precision Recall」を示している。アルゴリズムのPrecision (精度) が0.9の時、Recall (範囲) は0.34をマークした。アルゴリズムの精度が0.9のとき、全対象患者の0.34をカバーするという意味になる。アルゴリズムは精度が高く病院で使えることを示している。

アルゴリズムの判定メカニズム

この研究ではアルゴリズムの精度だけでなく、アルゴリズムが判定した根拠を解析する試みが行われた。複雑な構造のネットワークを直接解析するのは難しいので、入力するデータのパラメーターを変更することで、アルゴリズムが判定した根拠を導き出した。つまり、アルゴリズムのブラックボックスを開けて、その仕組みを垣間見たことになる。

医学的な根拠は

入力データのパラメータを変更することで、患者の生存率を判定する要因を導いた。入力データの種類は、病状だけでなく、治療措置や検査回数など幅広い情報を含む。その結果、アルゴリズムが死亡時期を判定するときに重視した項目は、膀胱腫瘍、前立腺腫瘍、病理検体摘出措置、放射線検査回数などとなる。病気の種類で余命が決まることは直感的に理解できるが、アルゴリズムは病理検体が抽出されることやMRI検査などの回数から死亡時期を算出した。これ以上の説明はないが、MRI検査を頻繁に受けることは、ガンが転移していることの傍証になるのかもしれない。

米国でPalliative Careが広がる

米国内で多くの病院がPalliative Careの導入を進めている。2008年には病院の53%がこのケアを提供していたが、2015年には67%に増加している。Palliative Careを提供する病院が増えているものの、必要な患者の7-8%しかこのケアを利用していないという統計もある。このギャップは病院側のリソース不足に加え、上述の通り、担当医師が対象となる患者を正しく判定できないという問題がある。このため、Deep Learningなどテクノロジーの果たす役割が期待されている。

Apple WatchとAIを組み合わせ病気を判定、心拍数をニューラルネットで解析し心臓疾患と糖尿病を検知

Friday, February 23rd, 2018

Apple Watchは健康管理のウエアラブルとして人気が高い。Apple Watchは心拍数や歩行数を計測でき、日々の運動量を知ることができる (下の写真、一日の心拍数の推移)。いま、これらのデータをAIで解析し、病気を検知する研究が進んでいる。心臓疾患や糖尿病を高精度で検知でき、Apple Watchの役割が見直されている。消費者グレードのウエアラブルでも、AIと組み合わせれば医療機器になることが分かってきた。

出典: Apple

心拍数から病気を判定

この研究はCardiogramとカリフォルニア大学サンフランシスコ校 (UCSF) が共同で実施している。Cardiogramはサンフランシスコに拠点を置くベンチャー企業で、Apple Watchで測定した身体データを解析し、健康管理のためのアプリを提供している。UCSFはスマホなどを使い心臓疾患を予知し、病気発症を予防する研究「Health eHeart Study」を展開している。両者が共同し、Apple Watchで計測したデータをAIで解析することで、不整脈を検知できることを証明した。更に、同じ手法で、糖尿病、高血圧症、不眠症を検知できることを公表した。

DeepHeartアルゴリズム

Apple Watchは搭載しているセンサーで心拍数や歩行数などを測定する。Cardiogramはこれを解析するニューラルネットワーク「DeepHeart」を開発した。Apple Watchで収集した身体データを入力すると、DeepHeartは不整脈の一種である心房細動 (Atrial Fibrillation) を検知する。臨床試験の結果、97%の精度で心房細動を検知できたとしている。

糖尿病などの検知

これに続き、DeepHeartを使って糖尿病や高血圧症などを検知する研究が進められた。研究結果は論文「DeepHeart: Semi-Supervised Sequence Learning for Cardiovascular Risk Prediction」として公表された。これによると、Apple Watchで収集するデータをDeepHeartで解析することで、糖尿病、高血圧症、不眠症を検知することに成功。この研究では、14,011 人の被験者の2億件のデータが使われた。更に、UCSFの協力を得て、大学病院でこれら被験者を検査し医療データを収集した。

アルゴリズムの精度

Apple Watchで計測したデータと医療データを使いDeepHeartアルゴリズム (下の写真) を教育した。この結果、DeepHeartは85%の精度で糖尿病を判定する。また、不眠症は83%の精度で、高血圧症は81%の精度で判定できる。従来から、心拍数とこれらの病気の関係について、機械学習を使った研究が進んでいるが、DeepHeartはこれらに比べ精度が大幅に改善された。

出典: Johnson Hsieh et al.

DeepHeartのネットワーク構造

DeepHeartはConvolution層 (上の写真、下から二段目、シグナルを解析) とLSTM層 (上の写真、下から三段目、時間に依存するデータを解析) を組み合わせた構造をとる。このネットワークにApple Watchで収集したデータを時間ごとに入力する (上の写真、最下段)と、病気の有無を判定する (上の写真、最上段)。具体的には、時間ごとの歩行数と心拍数を入力すると、アルゴリズムはそれぞれのタイムステップで心房細動、糖尿病、高血圧症、不眠症の症状があるかどうかを判定する。

AIのスイートスポット

医療分野はAIとの相性が良く、患者のデータをニューラルネットワークで解析することで、様々な知見を得ることができる。このため、医療分野でAIの導入が急進し、ここがAIのスイートスポットとなっている。

医療データが少ない

しかし、医療分野独特の問題点も抱えている。それは、医療分野ではアルゴリズム教育に使うデータが極めて少ないことだ。DeepHeartの研究では、1万人余りの被験者が大学病院で問診に回答する形でデータを提供した。つまり、DeepHeartは1万件という少ないデータで病気を検知することが求められた。これに対し、画像認識アルゴリズム (Google Inceptionなど) を開発する際は100万件を超える教育データがそろっている。医療分野では数少ないデータでアルゴリズムを教育する技法が求められる。

Semi-supervised Sequence Learning

このためDeepHeartの開発で「Semi-supervised Sequence Learning」という技法が用いられた。これはネットワークを「Sequence Autoencoder」としてプレ教育する技法である。 Sequence Autoencoder (下のダイアグラム) とは、Recurrent Network (時間に依存する処理、下のダイアグラムの箱の部分) で構成されるネットワークで、入力シークエンス (左半分) を読み込み、その結果をベクトル量としてパラメータに格納する。次に、学習したパラメータから、ネットワークは入力シークエンスを再現 (右半分) する。具体的には、言葉の並び (W, X, Y, Z, eos) をSequence Autoencoderに入力すると、ネットワークはその順序を学習し、それに従って言葉の並びを出力する。

出典: Andrew M. Dai et al.

DeepHeartをプレ教育する

研究では、DeepHeartをSequence Autoencoderとしてプレ教育し、獲得したパラメータをネットワークの初期値として使った。こうすることでの教育プロセスが効率化され、少ない医療データでDeepHeartを教育できる。医療データが1万件と少なくても、DeepHeartの判定精度を高めることができた。

医学的な根拠

そもそも心拍数が糖尿病や高血圧症や不眠症とどう関係するのか、医学の観点からの研究も進められてきた。心臓は神経細胞を通し、多くの臓器とつながっている。このため、HRV (Heart Rate Variability) と病気の間に関係があると指摘されている。HRVとは心拍リズムの乱れを示す指標である。人は落ち着いている時は心拍リズムは一定でなくHRVは高い。しかし、ストレスがかかると心拍数が上がり、心臓が規則正しく鼓動しHRVが低くなることが分かっている。

心拍リズムと糖尿病

このためHRVと病気の関係についての研究が進められてきた。HRVと糖尿病の関係は「Diabetes, glucose, insulin, and heart rate variability: the Atherosclerosis Risk in Communities (ARIC) study」として発表されている。この論文はHRVの低下と初期の糖尿病の間に関係があると結論づけている。Cardiogramはこの研究成果に基づきDeepHeartを開発した。

ロードマップ

DeepHeartはApple Watchで計測するデータを使い、不整脈、糖尿病、高血圧、不眠症を検知できることを証明した。Cardiogramは次のステップとして、これら疾病を検知した利用者に対し、治療法を提示することを計画している。アプリは病気の症状があることを検知すると、これら患者に対し、医療機関で証明された対処方法を提示す。アプリが病院の医師に代わり診断し、対処療法を示す構想を描いている。

出典: VentureClef

Apple WatchとAIの組み合わせ

Apple Watchは人気のウエアラブルであるが、売り上げ台数は当初の見込みを下回っている。理由はセンサーの精度が高くないことで、Apple Watchの健康管理機能は限定的との評価が広がっている。(上の写真、Apple Watchで測定した筆者の心拍数、一目でエラーと分かる箇所が多い。) しかし、Apple WatchにAIを組み合わせることで、病気を高精度で検知できることが示された。Apple Watchで糖尿病と診断されるのは怖いが、早期に病気の兆候を見つけ、病気を克服するという使い方もでてくる。AIを組み合わせることでApple Watchの役割が大きく変わり、医療デバイスとして再出発する気配を感じる。

中国で100万人のDNAを解析するプロジェクトが始まる、遺伝子と病気の関係をAIで解明

Friday, July 21st, 2017

中国は世界のDNAシークエンシング工場としてヒトや動物や植物の遺伝子配列を解き明かしてきた。いま中国は遺伝子配列を読み取るだけでなく、その結果をAIで解析しライフサイエンスの分野で世界をリードしようとしている。米国では既にIBMやGoogleが取り組んでいる研究テーマであるが中国はこれを大規模に展開する。

出典: iCarbonX

遺伝子データをAIで解析

その先端を走るのがShenzhen (中国・深圳) に拠点を置くベンチャー企業iCarbonXだ。馴染みが無い会社であるがiCarbonXは医療データを解析するAIプラットフォームを開発している。iCarbonXは中国において今後五年間で100万人の遺伝子データを収集する計画を明らかにした。収集した遺伝子データをAIで解析し病気や健康に関する様々な知見を得る。解析結果は専用アプリで消費者にフィードバックされ、健康な生活を送るためのアドバイスが示される。

個人データを大規模に低価格で収集

iCarbonXは2015年にJun Wang (上の写真) により創設された。WangはBGI (旧称Beijing Genomics Institute) のCEOの職を辞してiCarbonXを立ち上げた。BGIは世界最大規模のDNAシークエンシングセンターで遺伝子配列解明に寄与してきた。今ではライフサイエンスの先端技術を開発している。米国では既にIBMやGoogleが同様な研究を展開している。しかしiCarbonXは中国においては遺伝子情報を含む個人データを大規模に低価格で収集できると述べている。プライバシー保護に関する規制が緩やかなことがビジネスの優位点となる。

今年最も注目されているベンチャー企業

iCarbonXは今年最も注目されているベンチャー企業で累計で6億ドルの出資を受けている。企業時価総額は10億ドルを超え中国のエリートAI企業として評価されている。投資企業にTencentが含まれており2億ドルを出資している。Tencentは中国最大のソーシャルメディア企業でメッセージングサービス「WeChat」を運用している。TencentがiCarbonXに出資するのは奇異に感じるがその背景にはWeChatなどソーシャルメディアにログされている個人データを活用する狙いがある。個人のソーシャルデータを遺伝子データと組み合わせAIで解析することで分析精度が向上することが期待される。

遺伝子解析の限界

IBMを含む米国のAI企業は遺伝子解析の臨床試験を展開しているが期待していた成果が得られていない。遺伝子変異と病気発症の関係を研究しているが両者の間に強い相関関係を見つけることに苦慮している。つまり、病気を発症する遺伝子変異を突き止められないでいる。このためiCarbonXは従来の手法に加え被験者の生体検査を実施し精度の高い情報を得ることを計画している。

出典: iCarbonX

生体検査とは

具体的にはiCarbonXは被験者の生体検査として血液中のたんぱく質量の変化やメタボリズムを測定し、脳のイメージングデータを使う。またウエアラブルのバイオセンサーで血糖値をモニターする。更に、スマートトイレで尿と便に含まれるバイオマーカーを収集する。これら生体検査データと医療情報と遺伝子情報を組み合わせAIで解析することで健康管理に役立つ情報を抽出する。

専用アプリ「Meum」

iCarbonXのサービスは専用アプリ「Meum」から利用する (上の写真)。消費者はMeumに食事内容やエクササイズに関する情報を入力する。更に、身体情報やバイタルサインを入力する。AIはこれら入力情報と上述の遺伝子情報と生体情報を解析し、アプリは健康や病気に関連する情報を表示する。具体的には食事の内容、就寝時間、必要なエクササイズなど健康な生活を送るためのアドバイスを表示する。

ヘルスケア関連企業七社と提携

iCarbonXはヘルスケア関連企業七社と提携しこれら企業の技術を活用する (下の写真、米国企業を中心に構成されている)。これは「Digital Life Alliance」と呼ばれ医療データを遺伝子解析と結びつけ健康に関する新たな知見を得るための企業連合として機能する。具体的には提携企業は個人の健康や病気の状態を特定する指標を提供する。iCarbonXはこれら指標を活用してビッグデータからノイズを排除し高精度で有益な情報を検知できるシステムを開発する。

出典: iCarbonX

ライフサイエンス先進国に転身

Googleのライフサイエンス部門Verilyは健康な人体を定義する「Baseline Project」をスタートし1万人の参加者から個人の身体情報と医療情報を収集する。収集した情報と遺伝子情報をAIで解析し健康な人体を把握する。これに対しiCarbonXは100万人規模で実証実験を展開する。遺伝子配列などデータ量が格段に大きい情報を解析するためにはAIアルゴリズムの教育で大量のデータを必要とする。人口が多く遺伝子情報が使われることに対する抵抗感が柔らかい中国はライフサイエンスで大きく前進することが予想される。中国は世界のDNAシークエンシング工場からライフサイエンス先進国に転身しようとしている。

IBM Watsonの実力が問われている、 独自AIアーキテクチャはDeep Learningに勝てるのか

Friday, July 14th, 2017

米国でIBM Watsonの実力を疑問視する声が出ている。大学病院との共同プロジェクトが失敗に終わりWatsonの機能を再評価する機運が高まっている。システムインテグレーションの観点からはWatsonを教育するために大規模なデータを必要とする。アーキテクチャの観点からはWatsonはDeep LearningやGPUを使わないでIBM独自の手法でAIを実装しCPUで実行する。Deep Learningが高度に進化し少ないデータでシステムを教育できる中、Watsonは約束通りの性能を出せるのか市場の関心が集まっている。

出典: IBM

ライフサイエンスの分野で共同研究

IBMはWatson (上の写真) をライフサイエンスの分野で利用しガン治療で効果を上げると表明している。IBMはテキサス州立大学病院 (University of Texas MD Anderson Cancer Center) と共同でWatsonを使ったガン治療の研究を進めてきた。IBMは白血病を皮切りにガンを撲滅するMoon ShotプロジェクトでWatsonを展開している。Watsonが患者の医療データや医学文献を解析し医師に最適な治療法を示すことを目標としている。

プロジェクトは失敗

しかし2017年2月、テキサス州立大学病院はこのプロジェクトを中止すると発表した。大学はプロジェクト中止の理由は明らかにしていないが、4年間の研究開発で患者治療のためのツールを開発することができなかったと報じられている。プロジェクト管理の不備が原因とされるが、Watsonの技術的な問題もクローズアップされている。更に、IBMへの支払金額は3900万ドルで当初の予算を大幅に上回りシステム運用に費用がかかり過ぎることも要因とされている。

Watson教育のプロセスは複雑

Watsonの教育では大量の医療データを必要とする。このプロセスはDeep Learning (人間の脳を模した構造のネットワーク) の教育と同じで、答えが分かっているデータを入力しアルゴリズムを最適化する。しかし、WatsonのケースではDeep Learningと比べこのプロセスが格段に複雑になる。Deep Learningでは患部の写真を入力しアルゴリズムがガンであるかどうかを判定する。Watsonのケースでは患者のDNAを入力すると医療文献を参照し最適ながん治療方法を見つける (下の写真)。判定プロセスが格段に複雑になるだけでなく、そもそも遺伝子変異と病気の関係に関する教育データが存在しない。

出典: IBM

IBMは企業買収でデータを入手

このためIBMは新興企業を買収しWatson教育のための医療データを入手している。企業買収を繰り返しIBMは大規模な医療データベースを構築している。Explorysは医療データを保有し解析サービスをクラウドで提供しているベンチャー企業である。IBMはExplorysを買収し5000万人の患者データを入手し3150億件の医療データを得た。IBMはこれら医療データでWatsonを教育し患者治療や医療技術開発に役立てている。

Watsonのアーキテクチャ

Watsonを教育するプロセスが複雑な理由はそのアーキテクチャに起因する。Watsonの技法はAIの中でMachine Learningとして区分される。人間の脳を模したDeep Learningの手法とは大きく異なる。Watsonのこの技法は「DeepQA」と呼ばれ、これがクイズ番組Jeopardyで人間のチャンピオン二人を破る基礎技術となった。

DeepQAの構造

DeepQAは質問から答えを検出するシステムであるがGoogleのような検索エンジンとは構造が大きく異なる。DeepQAは質問の意味を解し、「Hypothesis」(仮説・解答候補) を生成し、仮説が正しいかどうかを評価する「Scoring」から構成される (下の写真)。仮説の生成やその評価には収集した大量のデータを使用する。このスレッドを大量に生成し大規模並列に稼働させる。一つの質問に対してDeepQAは100万の評価スコアーを生成する。ここから最終回答を選定するプロセスでMachine Learningが使われる。DeepQAは単純な検索ではなく、解答候補を評価して信頼度の高い解を導く手法に特徴がある。

出典: IBM

Deep Learningが高度に進化

Watsonは自然言語での複雑な質問を理解し、数多くの情報源を参照し、答えの候補を生成し、そこから正しい解を高精度で選ぶことができる。しかし、Watsonが開発されて以来Deep Learningが高度に進化している。画像認識、音声認識、音声生成、機械翻訳などに優れ、自動運転車やデジタルヘルスで活用されている。Deep Learningが普及することでWatsonの機能が相対的に地盤沈下している。

WatsonはDeep Learning機能を採用

このためIBMはDeep Learningを採用しWatsonの機能を強化している。IBMはクラウドBlueMixにDeep Learningによる画像認識と音声認識機能を追加した。またIBMはベンチャー企業AlchemyAPIを買収した。AlchemyAPIはDeep Learningベースのテキスト解析とイメージの解析を提供しておりWatsonはこれらの機能を搭載している。更に、IBMはPowerAI Platformを投入した。GPUを基盤とする処理システムでここでDeep Learningフレームワークを提供する。

Watsonの将来

WatsonはDeep Learning技法が登場する前に開発されたシステムであるが、IBMは最新技法をシステムに組み込み定常的に機能を強化している。また、ヘルスケア関連では企業買収を重ねWatsonの教育で活用している。テキサス州立大学病院のプロジェクトは失敗に終わったが、ガン診断や治療の研究で米国の主要病院と提携し共同研究を進めている。Watsonはガン治療で大きな効果を上げると期待されている。ただ、研究開発はIBMが示した当初のスケジュールから大きく遅れておりAIでガンを撲滅する技術の難しさを再認識させられる。