DeepRare AI - sistem agentic pentru diagnosticul bolilor rare

Autor: Racheriu Dragoș 2280 vizite

Titlu original	An agentic system for rare disease diagnosis with traceable reasoning.
Jurnal	Nature
Autori	Zhao Weike, Wu Chaoyi, Fan Yanjie, Qiu Pengcheng, Zhang Xiaoman et al.
Data publicării	18 februarie 2026
Țara	China
PMID	41708847
DOI	https://doi.org/10.1038/s41586-025-10097-9
Specialitate	Medicină internă

📋 PubMed 📄 Text complet (PMC)

Prezentare

Un studiu publicat la 18 februarie 2026 în revista Nature descrie dezvoltarea unui sistem agentic bazat pe modele lingvistice de mari dimensiuni (LLM), denumit DeepRare, conceput pentru diagnosticul diferențial al bolilor rare. Cercetarea arată că integrarea fenotipurilor clinice, a termenilor din Human Phenotype Ontology (HPO) și a datelor de secvențiere a exomului complet (WES) într-o arhitectură multi-agent produce o creștere semnificativă a acurateței diagnostice, cu lanțuri de raționament verificabile.

Rezumat:

Din peste 6.400 de cazuri analizate DeepRare a reușit să:

În peste 57% din cazuri, diagnosticul corect a fost pus pe primul loc doar pe baza simptomelor (fenotipuri HPO).
Când s-au adăugat date genetice, acuratețea a crescut la 69%.
A depășit clar metodele informatice utilizate în prezent.
Într-un test comparativ, sistemul a avut rezultate mai bune decât medici cu experiență în boli rare (diagnosticul corect în primele 5 opțiuni: 78,5% vs 65,6%).
95% dintre explicațiile oferite au fost validate ca fiind corecte de către specialiști.

Context

Bolile rare, definite ca afecțiuni cu prevalență <1/2.000 persoane, afectează peste 300 milioane de oameni la nivel global. Sunt descrise peste 7.000 de entități distincte, aproximativ 80% având etiologie genetică.

Pacienții parcurg frecvent un „diagnostic odyssey” cu durată medie >5 ani, caracterizat prin:

trimiteri repetate,
diagnostice eronate,
intervenții inutile,
întârzierea tratamentului adecvat.

Provocările dezvoltării sistemelor de inteligență artificială în acest domeniu includ:

heterogenitate clinică multisistemică,
număr redus de cazuri pentru fiecare boală,
actualizare continuă a cunoștințelor (260–280 boli genetice noi/an),
necesitatea trasabilității și interpretabilității clinice.

Despre studiul actual

Design și arhitectură

DeepRare este un sistem agentic pe trei niveluri:

Host central LLM (DeepSeek-V3 implicit) cu memorie internă.
Servere de agenți specializați:
- extractor fenotip,
- normalizator boală,
- căutare cunoștințe,
- căutare cazuri similare,
- analiză fenotipică,
- analiză genotipică.
Surse externe:
- baze de date genetice,
- literatură științifică,
- registre de cazuri,
- resurse medicale validate.

Integrează >40 instrumente specializate și baze de date precum OMIM, Orphanet, HPO, PubMed.

Un element esențial este bucla de auto-reflecție, prin care sistemul reevaluează ipotezele și caută dovezi suplimentare pentru a reduce:

supra-diagnosticarea,
halucinațiile LLM.

Seturi de date și evaluare

Au fost analizate 6.401 cazuri clinice din:

7 seturi publice,
2 seturi interne (Xinhua Hospital, Hunan Hospital).

Acestea au acoperit:

2.919 boli rare
14 specialități medicale
populații din Asia, Europa și America de Nord.

Subset genetic:

168 cazuri WES (Xinhua)
162 cazuri WES (Hunan)

Metrici utilizate:

Recall@1
Recall@3
Recall@5

Corelație evaluare LLM vs medici:

coeficient Pearson = 0,8689
concordanță în 88% din 240 cazuri analizate.

Rezultate

Performanță pe fenotipuri (HPO)

Recall@1 mediu: 57,18%
Recall@3: 65,25%

Depășește următoarea metodă (Claude-3.7-Sonnet-thinking) cu:

+23,79% la Recall@1
+18,65% la Recall@3

Comparativ cu metode clasice (PhenoBrain, PubCaseFinder), LLM-urile și sistemul agentic au demonstrat superioritate consistentă.

Performanță multi-modală (HPO + genetic)

Xinhua Hospital:

Recall@1 HPO-only: 39,9%
Recall@1 HPO + genetic: 69,1%

Hunan Hospital:

Recall@1 HPO-only: 33,3%
Recall@1 HPO + genetic: 63,6%

Comparativ cu Exomiser:

69,1% vs 55,9% (Xinhua)
63,6% vs 58,0% (Hunan)

Integrarea datelor genetice a crescut acuratețea cu ~30 puncte procentuale.

Performanță vs medici

163 cazuri clinice reale:

DeepRare Recall@5: 78,5%
Medici (≥10 ani experiență): 65,6%

Recall@1:

DeepRare: 64,4%
Medici: 54,6%

Este una dintre primele demonstrații documentate în care un sistem computațional depășește experți în diagnosticul fenotipic al bolilor rare.

Validarea lanțului de raționament

180 cazuri evaluate de 10 medici:

Acuratețe medie a referințelor: 95,4%
Erori majore de raționament factual: doar 2,5%
Erori de legare a dovezilor: 2,5%

Principalele tipuri de eșec:

Eroare de ponderare fenotipică (41%)
Diagnostic de mimic fenotipic (38,5%)
Diagnostic etiologic asociat (15,5%)

Implicații clinice

DeepRare oferă:

prioritizare diagnostică multi-modală,
lanțuri explicative verificabile,
integrare dinamică a literaturii actualizate,
potențial de reducere a timpului de diagnostic,
suport pentru medici non-specialiști.

Arhitectura agentică s-a dovedit robustă la schimbarea modelului LLM central, sugerând generalizabilitate.

Limitări

Integrare incompletă a tuturor surselor rare disponibile.
Căutarea fenotipurilor realizată agregat, nu adaptativ.
Lipsa unui modul de screening validat pentru medici nespecializați.
Lipsa dataseturilor pentru validarea interacțiunii pacient–sistem.

Detalii studiu

Finanțator

National Key R&D Programme of China

Abstract (original)

Rare diseases affect more than 300 million people worldwide, yet timely and accurate diagnosis remains an urgent challenge. Patients often endure a prolonged 'diagnostic odyssey' exceeding 5 years, marked by repeated referrals, misdiagnoses and unnecessary interventions, leading to delayed treatment and substantial emotional and economic burden. Here we present DeepRare-a multi-agent system for rare disease differential diagnosis decision support powered by large language models, integrating more than 40 specialized tools and up-to-date knowledge sources. DeepRare processes heterogeneous clinical inputs, including free-text descriptions, structured human phenotype ontology terms and genetic testing results to generate ranked diagnostic hypotheses with transparent reasoning linked to verifiable medical evidence. Evaluated across nine datasets from literature, case reports and clinical centres across Asia, North America and Europe spanning 14 medical specialties, DeepRare demonstrates exceptional performance on 2,919 diseases. In human-phenotype-ontology-based tasks, it achieves an average Recall@1 of 57.18%, outperforming the next best method by 23.79%; in multi-modal tests, it reaches 69.1% compared with Exomiser's 55.9% on 168 cases. Expert review achieved 95.4% agreement on its reasoning chains, confirming their validity and traceability.

Cuvinte cheie

bolile rare citogenetica epigenetica Genetica inteligenta artificiala in medicina medicina de precizie

Referințe

Zhao W, Wu C, Fan Y, et al. (2025). An agentic system for rare disease diagnosis with traceable reasoning. Nature. DOI: 10.1038/s41586-025-10097-9. https://www.nature.com/articles/s41586-025-10097-9

Alege-ți medicul și fă o programare!
Peste 13000 de cabinete medicale își prezintă serviciile pe ROmedic.