希少疾患をAIで高精度に診断できるDeepRareは難病治療の革命だ
医学において、希少疾患と呼ばれる病気は最も難解な課題の一つです。症状の多様性が高いだけに限らず、診断までのプロセスが長く、関連知識の分布も極めて限定的なため、世界的なテーマとなっています。
今回は、この難題の解決が期待できるAI、インテリジェント診断システム「DeepRare」について解説します。
世界が直面している難題、希少疾患とは?
アイス・バケツ・チャレンジを覚えていますか?ALS(筋萎縮性側索硬化症)研究の支援のため、著名人がバケツに入った氷水を頭からかぶる様子が、ソーシャルメディアで爆発的に拡がったのは、2014年でした。
また、毎年2月の最終日は、世界希少・難治性疾患の日(Rare Disease Day)として啓発活動が実施されています。希少疾患の認知や寄付の拡大、研究の促進には、さまざまな手法が試みられています。
希少疾患とは、文字通り極めて稀な疾患のことです。希少疾患を明確に定義する国際共通の基準はなく、国ごとの医療制度も違うものの、世界ではすでに3億5,000万人以上が希少疾患の影響を受けています。日本では、医薬品医療機器法第77条の2に基づき、患者数が5万人未満の病気と定義されています。これは、日本の人口で換算すると約0.04%未満です(稀少疾患と表記されることも)。
疾患の種類は7,000種を超え、その約80%が遺伝性疾患です。しかし、多くの患者は確定診断に至るまでに、平均で5年以上の時間を要し、7回以上の受診、3回以上の誤診を経験しています。誤診率も40~50%に達し、患者と家族に重い負担を与えています。
この希少疾患は、典型的な「少数サンプル・大空間」の課題です。医師は、膨大かつ断片的な情報と複雑な手掛かりだけを前に診断を迫られます(中国語の諺でいえば「大海撈針」、つまり海の底に落ちた一本の針をすくい上げるような不可能な状態)。従来型のAIモデルでは対応が難しく、臨床専門医の経験もスケール化できませんでした。
DeepRareの診断プロセス
この世界的な課題の克服に向けて、上海交通大学人工知能学院は、新華医院、上海人工知能研究所、ハーバード医科大学と共同で、世界初の希少疾患推論型インテリジェント診断システム「DeepRare」を発表しました。
DeepRareは、臨床医の診断思考プロセスである「質問→分析→検証→推論→判断」を模倣し、希少疾患の診断タスクを複数の専門的ステップに分解します。AIが各ステップを統合・推論することで、説明可能かつ能動的な診断を実現します。
このDeepRareは、自由記述テキスト、構造化されたヒト表現型オントロジー(HPO)用語、遺伝子変異(VCF)ファイルなど、多様なモダリティーの入力に対応しています。入力状況やデータ品質に応じて動的に適応し、「人・AI・知識」が一体となって協働する診断を可能にします。

DeepRareの診断プロセスは、主に次の二つのフェーズで構成されます。
- 情報収集フェーズ(図中のオレンジと緑):入力データに対し多段階で分析を実施。複数の機能モジュールが連携して主要症状、変異情報、症例背景を抽出する。さらに40種類以上の医学ツールやデータベースを活用して統合推論を実施し、初期診断と関連する糸口を生成する。
- 自己内省・検証フェーズ(図中の青):中央コントローラーが診断結果に対して多段階の自己反省と論証を実施。「仮説の提示→検証→修正」という因果チェーンを構築し、既存知識との整合を確認する。同時に、最新の臨床ガイドラインや研究文献、類似症例をリアルタイムに統合し、信頼性が高い診断提案を出力する。
DeepRareの卓越性能の実証
DeepRareは、アジア・北米・欧州にまたがる8つの実臨床データセットで包括的に評価されました。評価対象は、6,401例の希少疾患患者、2,919種類の疾患、14疾患カテゴリーに及びます。
評価の結果、以下のような顕著な性能を示しました。
- 平均Recall@1は57.18%で、既存の最良手法である Claude-3.7-Sonnet-thinking に対し23.79ポイントの向上
- Recall@5は80%超で、診断カバレッジを大幅に拡大
- 新華医院の実症例において、全エクソーム解析(WES)データを用いたテストで Recall@1は70.6%に達し、Exomiser(53.2%)を大幅に上回る
Recall@1は、モデルが提示した最初の1件の診断候補に、正しい疾患が含まれているかを評価する指標であり、診断の即時的な正確性を示します。
特に注目すべきは、テスト対象となった2,919種類の疾患のうち、1,013種類(34.7%)で100%の再現率を達成した点です。これは、DeepRareが複雑な疾患スペクトラムに広く適応可能であり、希少疾患診断における高い堅牢性・汎用性を実証しています。

さらに、7つの公共希少疾患データセットでの診断精度比較では、DeepRareは既存ベースラインを全てのデータセットで上回る結果となりました。以下は主要データセットでの比較結果です(詳細は原論文参照)。
- RareBench-MME:精度70%、50%の大幅向上
- RareBench-RAMEDIS:精度73%、31%向上
- MyGene2:精度76%、31%向上
また、新華医院のプライベート臨床コホートにおいても、診断精度は58%を達成し、次善手法に対して16ポイントの向上を記録しました。臨床現場でも、DeepRareの安定性と汎用性が確認されました。

推論の過程を見える形に
DeepRareの推論チェーンのトレーサビリティーと臨床での受容性を評価するため、研究チームはシステムが自動生成した180症例の診断プロセスを対象に、複数の専門家による検証を実施しました。システムは、各診断提案に対して構造化されたエビデンスチェーンを自動生成し、引用元と参照位置を明確に表示。引用範囲は、NatureやOMIM、OrphaNet、PubMedなど、国際的に権威ある知識ベースや学術誌を網羅しています。 希少疾患領域の専門医10名による独立検証の結果、推論エビデンスの参考性・正確性は平均95.4%に達しました。このエビデンス提示メカニズムにより、臨床現場での知識アクセス効率が大幅に向上され、診断意思決定の加速、モデルの信頼性・説明可能性の向上につながります。インテリジェント診断システムが実臨床へ円滑に導入されることが、大きく期待されます。

希少疾患患者に新たな光を届けるAI、DeepRare
研究成果の社会実装を加速するため、チームはDeepRareオンライン推論プラットフォームを公開しました。UIは中国語と英語を切り替えられ、シンプルな画面設計と直感的な操作性を実現しています。すでに複数の医療機関で試験運用が開始されていて、希少疾患の早期診断・精密診断・標準化管理を力強く支援しています。
▼DeepRare
https://raredx.cn
DeepRareが象徴するAI診断システムは、希少疾患診断のパラダイムを刷新しつつあります。能動的推論、動的な知識更新、証拠のトレーサビリティーを兼ね備えたシステムは、診断効率の向上のみならず、精密医療にAIを実装する上で新たなモデルケースとなります。
今後、DeepRareは研究領域への応用も期待されます。VUS(variant of unknown significance:疾患リスクとの関連が不明確な遺伝子配列の変異)の解釈を加速し、治療可能な希少疾患のスペクトラムを拡大するとともに、疾患知識の蓄積や診断プロセスの進化を促進します。
DeepRareと共に、世界中の希少疾患患者に新たな光を届ける―その一歩一歩が、新たな答えと希望へと、確実に近づく未来を拓きます。
参考文献
[2506.20430] Zhao, Weike, et al. An Agentic System for Rare Disease Diagnosis with Traceable Reasoning https://arxiv.org/abs/2506.20430 (2025).
リープリーパーでは、バイオテクノロジーとAIなどの最新情報を、研究職の視点から解説した記事をお届けします。ぜひ、ソーシャルメディアをフォローしてください。ご意見・ご感想も、コメントなどでお気軽に。

