放射線科医の診療コンサルト業務をAIが支援
― 患者プライバシーを保護しながら、クラウド型AIに匹敵する高性能な医療支援AIシステムを開発 ―
順天堂大学大学院医学研究科放射線医学の和田昭彦准教授らの研究グループは、患者プライバシーを保護しながら、クラウド型AIに匹敵する高性能な医師の診療支援AIシステムの開発に成功しました。放射線科医が日々対応している臨床医からの造影剤*¹に関する問い合わせ対応業務を支援するべく、検索拡張生成(RAG)技術*²を用いたローカル展開*³可能な大規模言語モデル(LLM)*⁴を開発し、従来8%あった不正確な応答生成(ハルシネーション*⁵)を除去(0%)することを実証しました。本システムはクラウド型AIより高速(2.6秒 vs 4.9-7.3秒)でありながら、患者データを外部に送信することなく高性能な医療支援を実現します。本成果により、医師の業務負担軽減と患者プライバシー保護を同時に達成する新たな医療AI導入の道筋が示されました。本論文はnpj Digital Medicine誌に2025年7月2日付で公開されました。
本研究成果のポイント
・RAG(検索拡張生成)技術により軽量ローカル型AIの医療応答の性能を向上
・ハルシネーションを除去(8%→0%)し、AIの応答がより正確に
・患者プライバシーを保護しながら高速・高性能な診療支援AIを実現
背景
医療現場では医師の業務負担軽減が急務となっており、AI技術による支援システムへの期待が高まっています。放射線科においては、造影剤*1使用の適応判断において、患者の腎機能、アレルギー歴、併用薬剤などを総合的に評価する必要があり、専門知識を要する複雑な判断が求められます。クラウド型の大規模言語モデル(ChatGPTなど)はこの分野でも高い性能を示しますが、患者の個人情報をインターネット経由で外部サーバーに送信する必要があり、医療現場での使用には重大なプライバシー上の懸念があります。一方、院内で使用可能なローカル型AIは患者情報を外部に送信しない利点がありますが、医療分野の学習データが不足しているために性能が不十分とされてきました。研究グループは、この「AI性能」と「プライバシー保護」のジレンマを解決するため、検索拡張生成(RAG)技術に着目し、医療現場で実用可能なプライバシー保護型高性能AIシステムの開発を目指しました。
内容
研究グループは、実際の医療現場での造影剤相談を模した模擬シナリオを100問作成して、応答内容の正確さについてクラウド型AI(GPT-4o mini、Gemini 2.0 Flash、Claude 3.5 Haiku)とローカル型AI(Llama 3.2-11B)およびこれにRAG技術を導入したRAG強化ローカル型AIを比較評価しました。
評価は、盲検化された放射線科医による順位付けと、3つのLLM審査員による精度、安全性、構造、トーン、適用性、応答速度の6項目での採点により実施されました。
主要な成果:(図1)
本研究によりRAG強化ローカル型AIの医療支援への導入に向けて3つの重要な成果が得られました。第一に、ローカル型AIで問題となるハルシネーションについて、ベースラインモデルでの8%から RAG導入後は0%へと完全除去を達成し(p = 0.012)、医療安全性の大幅向上を実証しました。
第二に、RAG強化によりローカル型AIの応答内容の正確性が改善し、RAG強化ローカル型AIは高性能クラウド型AIに近い応答内容を生成できるようになりました。放射線科医と、3つのLLM審査員によるスコア形式の採点では、高性能クラウド型AIには及ばないものの獲得ポイント差を大幅に縮めることに成功しました。第三に応答速度において、RAG強化はローカル型AIの応答時間を延長させたものの応答速度(2.6秒)は依然としてクラウド型AI(4.9-7.3秒)を上回ることを示しました。
ローカル型AIは、患者データの外部送信を一切行わず、院内システムでの完結した運用が可能であり、プライバシーを保護しながら高速で高性能な診療支援AIの開発が実現されました。
RAG技術により、ローカル型AIが外部の専門知識データベースを参照することで、医療分野特有の複雑な判断に必要な情報を適切に活用できるようになりました。これにより、これまで困難とされていた「高性能」と「プライバシー保護」の両立が実現しました。

図1:クラウド型AI(Gemini 2.0 Flash, Claude 3.5 Haiku, GPT-4o mini)とローカル型AI(Llama 3.2 11B; RAG強化型とベースモデル)のランキング
人間と3つのAIの応答性能の審査にて、ベースのLlama 3.2 11B(右端)と比較して、RAG強化型Llama 3.2 11B(右から2番目)では8%あったハルシネーションが除去され、応答内容が改善して、クラウド型のGPT4o-mini(中央)よりも高いランクに評価されるようになった。
今後の展開
本研究により、医療現場でのAI導入における根本的な課題である「性能とプライバシーのトレードオフ」の解決策が示されました。RAG技術を活用したローカル展開可能なAIシステムは、造影剤相談以外の医療業務にも応用可能であり、医師の業務負担軽減と医療の質向上に大きく貢献することが期待されます。
さらに、RAG技術の特性により、ローカル型AIの外部知識に最新情報や各医療機関に固有のルールを取り込むことで、最新医療の情報や技術の発達に対応できる応答内容・性能を持続的に改善させることが可能です。これにより、医療ガイドラインの更新や施設固有のプロトコルにも柔軟に対応できる、進化し続けるAI支援システムの実現が期待されます。
研究グループは今後、より大規模な臨床評価や他の医療分野への適用拡大を進める予定です。また、医療機関での実装に向けたシステム最適化や、医師との協働によるAI支援ワークフローの確立を目指します。
本技術の普及により、クラウド型AIの導入が困難な医療機関でも患者プライバシーを保護しながら、高性能のAI医療支援を受けられる環境の実現が期待されます。(図2)

図2:本研究が明らかにしたRAG技術による医療AIの安全性と実用性の両立
本作は、医療現場で進むAI導入における「性能」と「プライバシー」のトレードオフという課題を描いた4コマ漫画です。高性能なクラウドAIは患者情報の外部送信が必要でプライバシーリスクがあり、一方でローカルAIは安全でも知識が不足しがちという“ジレンマ”が存在します。そこで登場するのが、検索拡張生成(RAG)という技術です。RAGは外部知識を参照することでAIの回答精度を高めつつ、データは院内に保持できるため、安全性と性能を両立できます。実験ではハルシネーションをゼロに抑えつつ高速応答を実現し、患者と医師の信頼関係を損なうことなく、実用的なAI支援が可能であることが示されました。
用語解説
*1 造影剤: CT検査やMRI検査で使用される薬剤。血管や臓器をより鮮明に描出するために使用されるが、腎機能低下やアレルギー歴のある患者では容量調整や前処置などの特殊な対応が必要。
*2 検索拡張生成(RAG: Retrieval-Augmented Generation): AIが回答生成時に外部の知識データベースから関連情報を検索・参照する技術。専門分野での回答精度を大幅に向上させる。
*3 ローカル展開: クラウドサービスを使わず、病院内のコンピュータシステムでAIを動作させること。患者データが外部に送信されない。
*4 大規模言語モデル(LLM: Large Language Model): 大量のテキストデータで訓練された、人間のような自然な文章生成が可能なAIモデル。
*5 ハルシネーション: AIが事実と異なる情報を生成してしまう現象。医療分野では重大な安全性リスクとなる。
研究者のコメント
医療現場では「患者のプライバシーを守りたいが、最新AIの恩恵も受けたい」というジレンマが日常的に存在します。クラウドAIの高性能さを目の当たりにしながらも、患者データの外部送信の危険性で高性能AIを使用できない現場の葛藤の声を多く聞いてきました。
この研究で最もうれしかったのは、RAG技術により「二者択一」だった問題に「第三の選択肢」を提示できたことです。技術的な困難も多く、特にAIが理解しやすい医療専門知識の外部データベースを構築する部分では工夫と苦労がありました。しかし、患者さんの安全と医師の業務負担軽減という明確な目標があったからこそ、諦めずに取り組めました。
原著論文
本研究はnpj Digital Medicine誌のオンライン版で(2025年7月2日付)公開されました。
タイトル: Retrieval-Augmented Generation Elevates Local LLM Quality in Radiology Contrast Media Consultation
タイトル(日本語訳): 検索拡張生成技術による放射線科造影剤相談ローカルLLMの品質向上
著者: Akihiko Wada, Yuya Tanaka, Mitsuo Nishizawa, Akira Yamamoto, Toshiaki Akashi, Akifumi Hagiwara, Yayoi Hayakawa, Junko Kikuta, Keigo Shimoji, Katsuhiro Sano, Koji Kamagata, Atsushi Nakanishi, Shigeki Aoki
著者(日本語表記): 和田昭彦¹、田中雄也¹'²、西澤光生³'⁴、山本憲⁴、明石敏昭¹、萩原彰文¹、早川弥生¹、菊田潤子¹、下地啓五¹'⁴、佐野勝廣¹、鎌形康司¹、中西淳¹、青木茂樹¹'⁴
著者所属: ¹順天堂大学大学院医学研究科放射線医学、²東京大学大学院医学系研究科放射線医学講座、³順天堂大学医学部附属浦安病院放射線科、⁴順天堂大学大学院医学研究科健康データサイエンス学部
DOI: 10.1038/s41746-025-01802-z
本研究はJSPS科研費 JP25K02609, JP22K07674および順天堂大学大学院医学研究科AI Incubation Farm(aif)の助成を受けて実施されました。
なお、本研究にご協力いただいた皆様には深謝いたします。
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像