DeepRare AI - sistem agentic pentru diagnosticul bolilor rare

©

Autor:

DeepRare AI - sistem agentic pentru diagnosticul bolilor rare

Un studiu publicat la 18 februarie 2026 în revista Nature descrie dezvoltarea unui sistem agentic bazat pe modele lingvistice de mari dimensiuni (LLM), denumit DeepRare, conceput pentru diagnosticul diferențial al bolilor rare. Cercetarea arată că integrarea fenotipurilor clinice, a termenilor din Human Phenotype Ontology (HPO) și a datelor de secvențiere a exomului complet (WES) într-o arhitectură multi-agent produce o creștere semnificativă a acurateței diagnostice, cu lanțuri de raționament verificabile.

 

Rezumat:

Din peste 6.400 de cazuri analizate DeepRare a reușit să:

  • În peste 57% din cazuri, diagnosticul corect a fost pus pe primul loc doar pe baza simptomelor (fenotipuri HPO).

  • Când s-au adăugat date genetice, acuratețea a crescut la 69%.

  • A depășit clar metodele informatice utilizate în prezent.

  • Într-un test comparativ, sistemul a avut rezultate mai bune decât medici cu experiență în boli rare (diagnosticul corect în primele 5 opțiuni: 78,5% vs 65,6%).

  • 95% dintre explicațiile oferite au fost validate ca fiind corecte de către specialiști.

Context

Bolile rare, definite ca afecțiuni cu prevalență <1/2.000 persoane, afectează peste 300 milioane de oameni la nivel global. Sunt descrise peste 7.000 de entități distincte, aproximativ 80% având etiologie genetică.

Pacienții parcurg frecvent un „diagnostic odyssey” cu durată medie >5 ani, caracterizat prin:

  • trimiteri repetate,

  • diagnostice eronate,

  • intervenții inutile,

  • întârzierea tratamentului adecvat.

Provocările dezvoltării sistemelor de inteligență artificială în acest domeniu includ:

  • heterogenitate clinică multisistemică,

  • număr redus de cazuri pentru fiecare boală,

  • actualizare continuă a cunoștințelor (260–280 boli genetice noi/an),

  • necesitatea trasabilității și interpretabilității clinice.

Despre studiul actual

Design și arhitectură

DeepRare este un sistem agentic pe trei niveluri:

  • Host central LLM (DeepSeek-V3 implicit) cu memorie internă.

  • Servere de agenți specializați:

    • extractor fenotip,

    • normalizator boală,

    • căutare cunoștințe,

    • căutare cazuri similare,

    • analiză fenotipică,

    • analiză genotipică.

  • Surse externe:

    • baze de date genetice,

    • literatură științifică,

    • registre de cazuri,

    • resurse medicale validate.

Integrează >40 instrumente specializate și baze de date precum OMIM, Orphanet, HPO, PubMed.

Un element esențial este bucla de auto-reflecție, prin care sistemul reevaluează ipotezele și caută dovezi suplimentare pentru a reduce:

  • supra-diagnosticarea,

  • halucinațiile LLM.

Seturi de date și evaluare

Au fost analizate 6.401 cazuri clinice din:

  • 7 seturi publice,

  • 2 seturi interne (Xinhua Hospital, Hunan Hospital).

Acestea au acoperit:

  • 2.919 boli rare

  • 14 specialități medicale

  • populații din Asia, Europa și America de Nord.

Subset genetic:

  • 168 cazuri WES (Xinhua)

  • 162 cazuri WES (Hunan)

Metrici utilizate:

  • Recall@1

  • Recall@3

  • Recall@5

Corelație evaluare LLM vs medici:

  • coeficient Pearson = 0,8689

  • concordanță în 88% din 240 cazuri analizate.

Rezultate

Performanță pe fenotipuri (HPO)

  • Recall@1 mediu: 57,18%

  • Recall@3: 65,25%

Depășește următoarea metodă (Claude-3.7-Sonnet-thinking) cu:

  • +23,79% la Recall@1

  • +18,65% la Recall@3

Comparativ cu metode clasice (PhenoBrain, PubCaseFinder), LLM-urile și sistemul agentic au demonstrat superioritate consistentă.

Performanță multi-modală (HPO + genetic)

Xinhua Hospital:

  • Recall@1 HPO-only: 39,9%

  • Recall@1 HPO + genetic: 69,1%

Hunan Hospital:

  • Recall@1 HPO-only: 33,3%

  • Recall@1 HPO + genetic: 63,6%

Comparativ cu Exomiser:

  • 69,1% vs 55,9% (Xinhua)

  • 63,6% vs 58,0% (Hunan)

Integrarea datelor genetice a crescut acuratețea cu ~30 puncte procentuale.

Performanță vs medici

163 cazuri clinice reale:

  • DeepRare Recall@5: 78,5%

  • Medici (≥10 ani experiență): 65,6%

Recall@1:

  • DeepRare: 64,4%

  • Medici: 54,6%

Este una dintre primele demonstrații documentate în care un sistem computațional depășește experți în diagnosticul fenotipic al bolilor rare.

Validarea lanțului de raționament

180 cazuri evaluate de 10 medici:

  • Acuratețe medie a referințelor: 95,4%

  • Erori majore de raționament factual: doar 2,5%

  • Erori de legare a dovezilor: 2,5%

Principalele tipuri de eșec:

  • Eroare de ponderare fenotipică (41%)

  • Diagnostic de mimic fenotipic (38,5%)

  • Diagnostic etiologic asociat (15,5%)

Implicații clinice

DeepRare oferă:

  • prioritizare diagnostică multi-modală,

  • lanțuri explicative verificabile,

  • integrare dinamică a literaturii actualizate,

  • potențial de reducere a timpului de diagnostic,

  • suport pentru medici non-specialiști.

Arhitectura agentică s-a dovedit robustă la schimbarea modelului LLM central, sugerând generalizabilitate.

Limitări

  • Integrare incompletă a tuturor surselor rare disponibile.

  • Căutarea fenotipurilor realizată agregat, nu adaptativ.

  • Lipsa unui modul de screening validat pentru medici nespecializați.

  • Lipsa dataseturilor pentru validarea interacțiunii pacient–sistem.


Data actualizare: 20-02-2026 | creare: 20-02-2026 | Vizite: 261
Bibliografie
Zhao W, Wu C, Fan Y, et al. (2025). An agentic system for rare disease diagnosis with traceable reasoning. Nature. DOI: 10.1038/s41586-025-10097-9. https://www.nature.com/articles/s41586-025-10097-9
©

Copyright ROmedic: Articolul se află sub protecția drepturilor de autor. Reproducerea, chiar și parțială, este interzisă!

Alte articole din aceeași secțiune:

Din Ghidul de sănătate v-ar putea interesa și:
  • Algoritm dezvoltat de Google care detectează riscul cardiovascular din analiza ochilor
  • Algoritmul care redă modul în care creierul percepe fețele
  • Software inteligent pentru diagnosticarea cancerului de prostată
  •