DeepRare AI - sistem agentic pentru diagnosticul bolilor rare

Un studiu publicat la 18 februarie 2026 în revista Nature descrie dezvoltarea unui sistem agentic bazat pe modele lingvistice de mari dimensiuni (LLM), denumit DeepRare, conceput pentru diagnosticul diferențial al bolilor rare. Cercetarea arată că integrarea fenotipurilor clinice, a termenilor din Human Phenotype Ontology (HPO) și a datelor de secvențiere a exomului complet (WES) într-o arhitectură multi-agent produce o creștere semnificativă a acurateței diagnostice, cu lanțuri de raționament verificabile.
Rezumat:
Din peste 6.400 de cazuri analizate DeepRare a reușit să:
-
În peste 57% din cazuri, diagnosticul corect a fost pus pe primul loc doar pe baza simptomelor (fenotipuri HPO).
-
Când s-au adăugat date genetice, acuratețea a crescut la 69%.
-
A depășit clar metodele informatice utilizate în prezent.
-
Într-un test comparativ, sistemul a avut rezultate mai bune decât medici cu experiență în boli rare (diagnosticul corect în primele 5 opțiuni: 78,5% vs 65,6%).
-
95% dintre explicațiile oferite au fost validate ca fiind corecte de către specialiști.
Context
Bolile rare, definite ca afecțiuni cu prevalență <1/2.000 persoane, afectează peste 300 milioane de oameni la nivel global. Sunt descrise peste 7.000 de entități distincte, aproximativ 80% având etiologie genetică.
Pacienții parcurg frecvent un „diagnostic odyssey” cu durată medie >5 ani, caracterizat prin:
-
trimiteri repetate,
-
diagnostice eronate,
-
intervenții inutile,
-
întârzierea tratamentului adecvat.
Provocările dezvoltării sistemelor de inteligență artificială în acest domeniu includ:
-
heterogenitate clinică multisistemică,
-
număr redus de cazuri pentru fiecare boală,
-
actualizare continuă a cunoștințelor (260–280 boli genetice noi/an),
-
necesitatea trasabilității și interpretabilității clinice.
Despre studiul actual
Design și arhitectură
DeepRare este un sistem agentic pe trei niveluri:
-
Host central LLM (DeepSeek-V3 implicit) cu memorie internă.
-
Servere de agenți specializați:
-
extractor fenotip,
-
normalizator boală,
-
căutare cunoștințe,
-
căutare cazuri similare,
-
analiză fenotipică,
-
analiză genotipică.
-
-
Surse externe:
-
baze de date genetice,
-
literatură științifică,
-
registre de cazuri,
-
resurse medicale validate.
-
Integrează >40 instrumente specializate și baze de date precum OMIM, Orphanet, HPO, PubMed.
Un element esențial este bucla de auto-reflecție, prin care sistemul reevaluează ipotezele și caută dovezi suplimentare pentru a reduce:
-
supra-diagnosticarea,
-
halucinațiile LLM.
Seturi de date și evaluare
Au fost analizate 6.401 cazuri clinice din:
-
7 seturi publice,
-
2 seturi interne (Xinhua Hospital, Hunan Hospital).
Acestea au acoperit:
-
2.919 boli rare
-
14 specialități medicale
-
populații din Asia, Europa și America de Nord.
Subset genetic:
-
168 cazuri WES (Xinhua)
-
162 cazuri WES (Hunan)
Metrici utilizate:
-
Recall@1
-
Recall@3
-
Recall@5
Corelație evaluare LLM vs medici:
-
coeficient Pearson = 0,8689
-
concordanță în 88% din 240 cazuri analizate.
Rezultate
Performanță pe fenotipuri (HPO)
-
Recall@1 mediu: 57,18%
-
Recall@3: 65,25%
Depășește următoarea metodă (Claude-3.7-Sonnet-thinking) cu:
-
+23,79% la Recall@1
-
+18,65% la Recall@3
Comparativ cu metode clasice (PhenoBrain, PubCaseFinder), LLM-urile și sistemul agentic au demonstrat superioritate consistentă.
Performanță multi-modală (HPO + genetic)
Xinhua Hospital:
-
Recall@1 HPO-only: 39,9%
-
Recall@1 HPO + genetic: 69,1%
Hunan Hospital:
-
Recall@1 HPO-only: 33,3%
-
Recall@1 HPO + genetic: 63,6%
Comparativ cu Exomiser:
-
69,1% vs 55,9% (Xinhua)
-
63,6% vs 58,0% (Hunan)
Integrarea datelor genetice a crescut acuratețea cu ~30 puncte procentuale.
Performanță vs medici
163 cazuri clinice reale:
-
DeepRare Recall@5: 78,5%
-
Medici (≥10 ani experiență): 65,6%
Recall@1:
-
DeepRare: 64,4%
-
Medici: 54,6%
Este una dintre primele demonstrații documentate în care un sistem computațional depășește experți în diagnosticul fenotipic al bolilor rare.
Validarea lanțului de raționament
180 cazuri evaluate de 10 medici:
-
Acuratețe medie a referințelor: 95,4%
-
Erori majore de raționament factual: doar 2,5%
-
Erori de legare a dovezilor: 2,5%
Principalele tipuri de eșec:
-
Eroare de ponderare fenotipică (41%)
-
Diagnostic de mimic fenotipic (38,5%)
-
Diagnostic etiologic asociat (15,5%)
Implicații clinice
DeepRare oferă:
-
prioritizare diagnostică multi-modală,
-
lanțuri explicative verificabile,
-
integrare dinamică a literaturii actualizate,
-
potențial de reducere a timpului de diagnostic,
-
suport pentru medici non-specialiști.
Arhitectura agentică s-a dovedit robustă la schimbarea modelului LLM central, sugerând generalizabilitate.
Limitări
-
Integrare incompletă a tuturor surselor rare disponibile.
-
Căutarea fenotipurilor realizată agregat, nu adaptativ.
-
Lipsa unui modul de screening validat pentru medici nespecializați.
-
Lipsa dataseturilor pentru validarea interacțiunii pacient–sistem.
Copyright ROmedic: Articolul se află sub protecția drepturilor de autor. Reproducerea, chiar și parțială, este interzisă!
- Solul - o potențială sursă de noi antibiotice
- Cercetătorii dezvoltă o aplicație care detectează hipertensiunea folosind doar smartphone-ul
- În ce mod ar putea fi NFT-urile utilizate în industria sănătății?
- Volumul glandelor suprarenale ca biomarker imagistic al stresului cronic: aportul inteligenței artificiale
- Implant silicon sani
- Pentru cei cu anxietate si atacuri de panica FOARTE IMPORTANT
- GRUP SUPORT PENTRU TOC 2014
- Histerectomie totala cu anexectomie bilaterala
- Grup de suport pentru TOC-CAP 15
- Roaccutane - pro sau contra
- Care este starea dupa operatie de tiroida?
- Helicobacter pylori
- Medicamente antidepresive?
- Capsula de slabit - mit, realitate sau experiente pe oameni