ある研究チームがコンピュータープログラムに学習をさせ、組織標本を載せたスライドガラスを読み取って肺がんに最も多い2タイプの病理診断をさせることに成功しました。精度は97%です。プログラムは更に、がん組織の画像を解析するだけでがん関連の遺伝子変異を見つけられるようになったといいます。

このコンピュータープログラムは機械学習と呼ばれるプロセスを通して細胞切片の画像を取り込み、正常な肺組織と肺がんに最も多い組織型(肺がんの40%を占める腺がん、及び肺がんの25~30%を占める扁平上皮がん)を見分ける能力を身に着けました。この二種類は細胞型が違うため全く異なる治療計画が必要となるのですが、ベテランの病理診断医でも判別が難しい場合もあります。

コンピュータープログラムに学習させるにあたって、機械学習を専門とする研究チームはグーグルが開発・公開した深層学習手法を利用しました。プログラムは人工知能(AI)を使い、学ぶ手順を人間が教えなくても特定の作業(この場合は肺がんの標本の分類)を上手にこなせるよう自ら学習します。

学習するための教材として使ったのはがんゲノム・アトラス(TCGA)が公開している1,600点以上の肺の病理組織標本です。ニューヨーク大学ランゴーン医療センターの研究者らが主導し、9月17日にNature Medicine誌に掲載されたこの論文は、コンピューターによる肺がん診断の精度が大きく向上したことを示しています(現在2番目に正確なコンピューター診断法の精度は83%です)。

データ・公開資料としての画像

TCGAはがんゲノム・プロジェクトで収集した遺伝子配列データを調べる研究者のために、資料の質を担保する手段として腫瘍標本の病理組織画像を公開していました。「組織標本の質が適切か、付されている名称が正しいかを確認するために(こうした画像が)必要だったのです」と話すのは米国国立がん研究所(NCI)でTCGAのディレクターを務めるジャンC.ゼンクルーセン博士です。想定外のメリットとして、今度は画像そのものが研究資料として活用されているのだと言います。

TCGAが公開している画像は大きく解像度も高いため、ニューヨーク大学の研究チームは各画像を格子状に数千もの「パッチ」(区画)に切り分け、標本の分類に役立つ外見上の特長をコンピューターが個別に解析できるようにしました。「(肺がんの)各亜型分類につき約500人分のデータがあったのですが、一画像あたり数千パッチになったので最終的には100万パッチ近くを使ってモデルに学習させることができました」とニューヨーク大学の機械学習と人工知能の専門家で、今回の論文を共導したナルゲス・ラザビアン博士は言います。

腺がん、扁平上皮がんと正常な肺の細胞を見分ける作業においてプログラムが身に着けた精度はベテランの病理診断医と同じくらいですが、分析にかかる時間は大きく短縮されます。病理診断医が数分かかるのに対し、プログラムはわずか数秒で結論を出すことができました。

プログラムは更に、研究に参加した病理診断医の3分の1以上がタイプ分けを誤った画像54件のうち、45件を正しく分類できたため、研究チームはセカンドオピニオンとしてAIを有効活用できるのではないかと期待しています。

ニューヨーク大学が保有する別の肺がん標本集団(冷凍保存されたものと新たに採取されたもの)でもプログラムを試し、全く異なる標本集団でも成果が得られるかを検証しました。

TCGAの標本はほぼ全てが腫瘍組織でした。対して検証に用いた集団では、血栓や壊死した組織など他の要素が含まれる標本も多く、プログラムにとって「分類作業の難易度が上がった」と研究チームは報告しています。

これを踏まえてチームは腫瘍中心(と病理診断医が判断した)組織標本のみを分析するようにプログラムを再構成しました。変更後の精度は平均して90%以上となり、研究チームはこの結果について「非常に心強い」とコメントしています。

治療と研究における人工知能の役割

このコンピュータープログラムのスピードと精度を活かして、研究チームは例えば手術中に採取した生体検査用の組織サンプルが病理診断に十分な質を確保できているか、外科医に追加サンプルの採取を要求すべきかを確認するツールとしても使えるのではないかと提案しています。

AIを使って迅速・正確に病理診断が下せることが示されたわけですが、この研究プロジェクトではAIが学習によって肺腺がんに最も多い6種類の遺伝子変異の有無を予測できることもわかりました。遺伝子によって差がありますが、精度は64%~86%でした。

「科学的に大きな可能性を感じます」とラザビアン博士は述べています。

現在、遺伝子の変異を確認する方法はDNAの配列を調べる遺伝子検査しかありません。これは長くて2週間かかることもあります。

「肺がんは病気が進行してから発見されることが多いので、どのような治療であれ2週間も開始を遅らせることは患者にとってよくありません」とラザビアン博士は言います。

医療現場ではひとまず治療を開始し、遺伝子検査の結果に応じて使用する薬を調整するのが一般的です。「私たちの研究でわかったのは、このプログラムを使えば最初から適切な治療を始められる可能性が高いということです」とラザビアン博士は説明しています。

このプログラムは中身の見えないいわゆる「ブラックボックス」です。その判断は複雑に絡み合った無数の小さなステップの積み重ねであり、簡単には要約できません。研究者はプログラムが画像の中の何に反応して遺伝子変異を予測するのか、明確に捉えることはできませんが、「肉眼では見えないパターンを表すレンズとして」利用価値があるとラザビアン博士は言います。

ラザビアン博士らはこのプログラムを使って遺伝子変異が細胞や組織の構造にどのような影響を及ぼすかを研究しています。このテーマに取り組むために自動化技術を応用し、画像を修正してどの視覚的要素がプログラムの変異感知能力を左右するのかを解明しようとしています。

NCIがん画像処理プログラムの副部長であるポーラ・ジェイコブス博士は「この研究が優れているのは、取り組む臨床課題を慎重に選んだ点」、プログラムに学習をさせたやり方、そして別の肺がん標本を使って結果を検証した点だと評価しています。

スタンフォード大学で遺伝学の主任を務めるマイケル・シュナイダー博士は診断の未来はAIにあると言います。「病理診断医に任せきりにするのではなく、機械学習を使う方向にシフトしていく必要があると思います」と述べています。「アルゴリズムが病理医にとって代わることはないでしょう。しかし分類作業をサポートし、コンピューターを使わなかった場合に病理診断医が犯しうるミスを減らすことができるはずです」

プロジェクトのために開発されたコンピューターコードは、他の研究者が他の診断アプリケーションの開発に使えるように公開されています。ニューヨーク大学のチームは既にこのコードに腎臓がん、乳がんをはじめ他のがんを学習させる試みを始めています。

原文:October 10, 2018, by NCI Staff
https://www.cancer.gov/news-events/cancer-currents-blog/2018/artificial-intelligence-lung-cancer-classification

米国国立がん研究所(NCI)のニュースと研究の最新情報
出典元:米国国立がん研究所(NCI)

本記事は情報提供を目的として、当サイトが翻訳したものです。
翻訳の記事内容や治療を推奨または保証するものではありません。

PAGE TOP