
CT画像から腹部臓器の異常を高精度に検出するAIを開発
診療で得られるCT読影所見文の有効活用
研究成果のポイント
概要
大阪大学大学院医学系研究科の大学院生 佐藤淳哉さん(人工知能画像診断学)、堀雅敏 特任教授(常勤)(人工知能画像診断学)、武田理宏 教授(医療情報学)、木戸尚治 招へい教授(人工知能画像診断学)、富山憲幸 教授(放射線医学)らの研究グループは、日常診療で放射線科医によって作成された読影所見文とCT画像から情報を自動抽出し、これを学習することで、腹部CT画像の異常所見を臓器ごとに検出する高精度AIを開発しました。これまで、画像診断支援AIの開発には医師による大量のアノテーションが必要であり、高精度なAIを実現するには開発コストが高くなるという課題がありました。
日本医学放射線学会は、医用画像を全国規模で収集した日本医用画像データベース(Japan Medical Image Database:J-MID)を構築しています。このデータベースには、CT画像および放射線科医によって診療時に作成された読影所見文がセットになって大量に集められています。研究グループは、このデータベースに含まれる読影所見文に注目し、自然言語処理技術を使って疾患に関する情報を文章から抽出しました。この情報を利用することで、放射線科医が手作業でアノテーションを行うことなく、大量の画像データを用いた学習が可能になり、腹部にある5つの臓器の異常を高精度に検出するAI開発を実現しました。診療で得られる情報の再利用が、画像診断支援AIの開発を加速させ、診断精度の向上や診断プロセスの効率化につながることが期待されます。本研究成果は、英国科学誌「eBioMedicine」に、11月29日(金)午前8時30分(日本時間)に公開されました。
図1. 腹部CT画像から臓器ごとに異常検出をおこなう診断支援システム
研究の背景
CT検査は、体内の状態を非侵襲的に評価できる検査であり、救急医療、がんの進行度診断、治療の経過観察などに広く使用されています。世界的にCT検査数が増加する一方で、診断を行う放射線科医は不足しており、負担の増加が診断精度の低下につながると懸念されています。AI技術が放射線科医の作業効率や診断精度の向上に役立つことは多くの研究で示されていますが、精度の高いAIを開発するには放射線科医によりアノテーションされた大量の学習データが必要です。医療画像のアノテーションには専門知識と多大な時間が必要なため、AIを活用した画像診断支援の普及が妨げられてきました。
研究の内容
本研究では、腹部CT画像と読影所見文を用いて、肝臓、胆嚢、膵臓、脾臓、腎臓の5臓器それぞれにおける異常を検出するシステムを開発しました(図1)。日本医学放射線学会は、医用画像を全国規模で収集した日本医用画像データベース(Japan Medical Image Database:J-MID)を構築しています。このデータベースには、CT画像および放射線科医によって診療時に作成された読影所見文がセットになって大量に集められています。研究グループは読影所見文に注目し、これをアノテーションの代替として活用できると考えました。まず、読影所見文から固有表現抽出や関係抽出といった自然言語処理技術を用いて特定の臓器における疾患の有無を高い精度で自動抽出しました(図2)。また、CT画像からは独自のデータセットで学習させた多臓器セグメンテーションモデルを用いて各臓器の領域を抽出しました。文章から抽出した疾患情報とCT画像から抽出した臓器領域の情報を活用して画像診断支援AIシステムを開発しました。このシステムでは、CT画像を入力すると、その中に異常が含まれる可能性を異常スコアとして出力することができます。
このシステムが出力した結果を、受信者動作特性曲線下面積(ROC-AUC)などの指標を用いて放射線科医の診断と比較しました。その結果、臓器ごとの異常所見の有無を予測し、5臓器平均で高い異常検出精度(ROC-AUC=0.886)を示すことができました。次に、放射線科医によるアノテーションデータで学習した従来システムと性能を比較しました。学習データ300例の場合は、本研究で構築したシステムの性能が劣るものの、学習データ数を増やすことで精度の向上がみられました。最終的には、いずれの臓器においても、本研究で構築したシステムが、従来システムを有意に上回る性能を示しました (図3)。
図2. 読影所見文から自然言語処理により疾患情報を抽出
図3. 読影所見文から抽出した大量のデータで学習することで異常検出性能が向上
本研究成果が社会に与える影響(本研究成果の意義)
本研究では、腹部CT画像と関連する読影所見文を用いて、アノテーションの代替となるデータセットを作成し、CT画像の異常検出を高精度に行う画像診断支援AIを開発しました。この手法により、放射線科医による手動のアノテーションが不要となり、効率的な学習プロセスを実現しました。この手法は腹部以外の臓器やCT以外の画像検査にも適用可能であり、画像診断支援AIの普及と診断プロセスの効率化に貢献する可能性を示しています。
特記事項
本研究成果は、11月29日(金)午前8時30分(日本時間)に英国科学誌「eBioMedicine」(オンライン)に掲載されました。
タイトル:“Annotation-free multi-organ anomaly detection in abdominal CT using free-text radiology reports: A multi-centre retrospective study”
著者名:Junya Sato1, 2, Kento Sugimoto3, Yuki Suzuki1, Tomohiro Wataya1, 2, Kosuke Kita1, Daiki Nishigaki1, 2, Miyuki Tomiyama1, 2, Yu Hiraoka1, 2, Masatoshi Hori1, Toshihiro Takeda3, Shoji Kido1*, and Noriyuki Tomiyama2(*責任著者)
所属:
1. 大阪大学大学院医学系研究科 共同研究講座 人工知能画像診断学
2. 大阪大学大学院医学系研究科 放射線統合医学講座 放射線医学
3. 大阪大学大学院医学系研究科 情報統合医学講座 医療情報学
DOI:https://doi.org/10.1016/j.ebiom.2024.105463
本研究は、JST次世代研究者挑戦的研究プログラム(JPMJSP2138)、HPCIシステム利用研究課題(課題番号:hp230031)の支援を受けて行われました。
参考URL
堀雅敏 特任教授(常勤) 研究室
http://www.ai-radiol.med.osaka-u.ac.jp/
用語説明
- 読影所見文
放射線科医がCTやMRIなどの医用画像を読影(診断)した結果を記述した報告書。国内の多くの施設で、放射線科医が自由に文章で記載する自由文記載形式が採用されている。
- アノテーション
解析対象のデータ1つ1つに対して、人間が正しい情報を付与するプロセス。本研究では、放射線科医師がCT画像を確認して異常所見の有無を記録する。
- 自然言語処理
人間が日常的に使う自然言語をコンピュータに処理させる技術で、機械翻訳、音声認識、対話システム、感情分析など、幅広い分野で活用が進んでいる。
- セグメンテーション
画像に含まれる情報を認識し、ピクセル単位で複数の領域に分割する技術。本研究では臓器がCT画像のどの部分に存在するかを認識する。
- 受信者動作特性曲線下面積(ROC-AUC)
分類モデルの性能評価に用いられる指標。横軸に偽陽性率、縦軸に真陽性率をプロットした際に得られる曲線の下の面積が1に近いほど、モデルの予測力が優れていることを示す。