Modelul Delphi-2M: inteligența artificială prezice riscul și progresia a 1256 de boli

©

Autor:

Modelul Delphi-2M: inteligența artificială prezice riscul și progresia a 1256 de boli

În februarie 2025, revista Nature a publicat un studiu realizat de o echipă internațională de cercetători care a dezvoltat un model bazat pe inteligență artificială pentru a prezice progresia unui număr impresionant de 1.256 de boli distincte definite la nivelul 3 al clasificării ICD-10. Modelul, denumit Delphi-2M, utilizează tehnici de tip transformer inspirate din modelele lingvistice pentru a simula traiectorii de sănătate pe parcursul a două decenii, pornind de la istoricul medical și factorii de stil de viață ai pacienților.

Context

Progresia bolilor umane este un proces extrem de complex, marcat de alternanțe între perioade de sănătate, episoade acute și instalarea unor boli cronice, deseori grupate în clustere de comorbidități. Acestea sunt influențate de genetică, stil de viață și factori socio-economici. În contextul îmbătrânirii populației, unde povara bolilor cardiovasculare, oncologice, metabolice și neurodegenerative este în creștere, modelele predictive tradiționale axate pe câte o singură boală nu mai sunt suficiente.

De aceea, dezvoltarea unor instrumente capabile să surprindă întreaga rețea de interacțiuni dintre peste o mie de afecțiuni reprezintă o provocare esențială pentru personalizarea îngrijirilor medicale, planificarea resurselor și elaborarea politicilor de sănătate publică. Modelele transformer, inspirate din rețelele neuronale utilizate în procesarea limbajului natural, sunt considerate deosebit de promițătoare pentru acest tip de sarcină, deoarece pot învăța dependențele secvențiale dintre evenimente medicale.

Despre studiul actual

Cercetătorii au dezvoltat Delphi-2M, un model transformer cu 2,2 milioane de parametri, adaptat pentru a lucra cu date medicale în loc de cuvinte. În loc de fraze, acesta procesează coduri ICD-10, informații despre sex, indice de masă corporală, fumat, consum de alcool și evenimente de tip "fără diagnostic".

Datele de antrenament au provenit din UK Biobank, incluzând:

  • 402.799 participanți pentru antrenament,

  • 100.639 pentru validare,

  • 471.057 pentru testare longitudinală.

Generalizabilitatea a fost verificată și pe un eșantion independent de 1,93 milioane de persoane din registrele medicale daneze.

Arhitectura modelului a inclus mai multe inovații:

  • înlocuirea positional encoding cu o reprezentare continuă a vârstei,

  • predicția timpului până la următorul eveniment,

  • mascarea atenției pentru a evita influențele artificiale între diagnostice înregistrate la aceeași vârstă.

Modelul putea astfel să:

  • estimeze riscul pentru peste 1.000 de boli,

  • prezică momentul apariției unui diagnostic,

  • simuleze traiectorii complete de sănătate pe termen lung.

Rezultate

Evaluările au arătat că Delphi-2M are o acuratețe comparabilă cu modelele dedicate fiecărei boli în parte:

  • pentru un orizont de 10 ani, media AUC a scăzut de la 0,76 la aproximativ 0,70, dar a rămas superioară modelelor simple bazate pe vârstă și sex,

  • pentru predicția mortalității, a atins AUC de 0,97, un nivel foarte ridicat,

  • predicțiile pentru incidența bolilor la vârstele de 70 și 75 de ani au corespuns aproape perfect cu datele reale.

Modelul s-a dovedit util și pentru profilarea personalizată a riscului, reușind să distingă clar între subgrupuri definite prin stil de viață sau antecedente medicale. În plus, Delphi-2M a generat date sintetice care au reprodus fidel distribuțiile reale ale bolilor fără a copia date individuale. Antrenarea unui model exclusiv pe aceste date sintetice a dus la o scădere de doar 3 puncte în AUC, ceea ce confirmă potențialul pentru cercetare sigură din punct de vedere al confidențialității.

Analiza embedding-urilor a arătat că modelul recunoaște clustere de boli în concordanță cu capitolele ICD-10, precum și impactul disproporționat al anumitor diagnostice (de exemplu, cancerul pancreatic asupra mortalității).

Validarea externă în cohorta daneză a confirmat generalizabilitatea (AUC mediu ≈ 0,67), cu o scădere moderată a performanței față de UK Biobank.

Concluzii

Delphi-2M reprezintă primul model generativ de mari dimensiuni capabil să anticipeze evoluția unui spectru atât de larg de boli pe termen lung. Comparativ cu modelele centrate pe biomarkeri unici sau pe o singură boală, acesta oferă o viziune integrată asupra multimorbidității și a interacțiunilor temporale dintre boli.

Totuși, autorii au subliniat mai multe limite:

  • biasurile din UK Biobank (efectul de voluntar sănătos, distribuție socio-economică neuniformă, lipsa unor date complete),

  • diferențe de performanță între grupuri de ancestrie și nivel socio-economic,

  • imposibilitatea de a stabili relații cauzale, modelul captând doar asocieri statistice.

În pofida acestor limite, studiul demonstrează că modelele transformer pot deveni instrumente-cheie pentru predicția riscului individualizat, planificarea resurselor medicale și dezvoltarea de politici de sănătate publică. Pe termen lung, autorii propun integrarea de date multimodale (imagistică, genomică, proteomică) pentru a spori utilitatea clinică și a sprijini deciziile medicale personalizate.


Data actualizare: 19-09-2025 | creare: 19-09-2025 | Vizite: 168
Bibliografie
Learning the natural history of human disease with generative transformers. Shmatko, A., Jung, A.W., Gaurav, K., Brunak, S., Mortensen, L.H., Birney, E., Fitzgerald, T., Gerstung, M. Nature (2025). DOI: 10.1038/s41586-025-09529-3, https://www.nature.com/articles/s41586-025-09529-3

Sursă imagine: https://www.freepik.com/free-ai-image/images-that-simulate-x-rays-with-neon-colors_204433064.htm
©

Copyright ROmedic: Articolul se află sub protecția drepturilor de autor. Reproducerea, chiar și parțială, este interzisă!


Din Ghidul de sănătate v-ar putea interesa și:
  • Algoritm dezvoltat de Google care detectează riscul cardiovascular din analiza ochilor
  • Algoritmul care redă modul în care creierul percepe fețele
  • Software inteligent pentru diagnosticarea cancerului de prostată
  •