DOLPHIN AI descoperă sute de markeri invizibili de cancer
Autor: Airinei Camelia

Secvențierea ARN la nivel unicelular (single-cell RNA sequencing, scRNA-seq) a revoluționat transcriptomica, oferind posibilitatea de a analiza expresia genică la rezoluția fiecărei celule. Această tehnologie a dus la descoperiri importante în biologie, imunologie și cercetarea cancerului, însă majoritatea analizelor s-au concentrat pe agregarea datelor la nivel de genă. Această abordare simplifică peisajul transcriptomic și pierde informații esențiale legate de expresia la nivel de exon și de evenimentele de splicing alternativ.
Pentru a depăși aceste limitări, cercetătorii de la Universitatea McGill au dezvoltat DOLPHIN, un cadru bazat pe învățare profundă care integrează citirile la nivel de exon și joncțiune pentru a construi reprezentări mai detaliate ale celulelor. Studiul a fost validat pe multiple seturi de date scRNA-seq, incluzând atât tehnologii full-length, cât și platforme de tip 10X Genomics.
Analiza convențională scRNA-seq se bazează pe tabele de număr de gene, utilizate pentru sarcini precum clusterizarea celulară, analiza diferențială și inferența traiectoriilor. Totuși, acest nivel de agregare omite detalii critice, precum modelele de expresie la nivel de exon și evenimentele de splicing alternativ. Acestea sunt esențiale pentru caracterizarea corectă a stărilor celulare și pentru înțelegerea reglementării moleculare.
Diverse instrumente computaționale (SCANPY, seurat, scVI, scBERT, Outrigger, BRIE2, SCASL) au fost propuse pentru a analiza datele scRNA-seq, însă performanța lor scade semnificativ pe platformele cu acoperire redusă (precum 10X Genomics), unde citirile de joncțiune sunt rare și incomplete. În plus, majoritatea metodelor ignoră citirile din corpul exonilor, reducând sensibilitatea în detectarea evenimentelor complexe de splicing.
Despre studiu
DOLPHIN (Deep learning framework for exon-level scRNA-seq analysis) adresează aceste limitări prin construirea unei diagrame pentru fiecare genă, în care nodurile reprezintă exoni, iar muchiile reprezintă conexiunile dintre exoni pe baza citirilor de joncțiune. Modelul se bazează pe un autoencoder cu grafic variațional (VGAE) și pe rețele de atenție grafică (GAT), care permit captarea dependențelor dintre exoni și construirea unor reprezentări latente ale celulelor.
Cadrul propus are trei pași principali:
- Construirea graficelor de exon pe baza citirilor de exon și de joncțiune.
- Învățarea de reprezentări celulare prin VGAE și GAT, care păstrează informații despre utilizarea exonilor și evenimentele de splicing.
- Agregarea citirilor de joncțiune din celule similare pentru a crește sensibilitatea în detectarea splicingului alternativ.
După agregare, valorile PSI (percent-spliced-in) sunt calculate folosind funcționalitățile Expedition–Outrigger, permițând cuantificarea robustă a evenimentelor de splicing în populații celulare diverse.
Rezultate
Îmbunătățirea reprezentării celulelor
Pe mai multe seturi de date scRNA-seq (PBMC, colon, rect), DOLPHIN a demonstrat performanțe superioare față de metodele bazate pe numărul de gene. Evaluările prin Adjusted Rand Index și Normalized Mutual Information au arătat scoruri semnificativ mai mari, indicând o delimitare mai clară a tipurilor celulare și o reducere a efectelor de lot. În cazul dataset-ului PBMC, DOLPHIN a obținut un scor ARI median cu 0,11 mai mare decât metodele convenționale (P = 1,98 × 10⁻⁴).
Detectarea diferențială la nivel de exon
Într-un set de date de adenocarcinom ductal pancreatic, DOLPHIN a identificat 896 gene diferențial exprimate la nivel de exon (EDEGs) care nu au fost detectate prin metodele convenționale la nivel de genă. Aceste gene au arătat o asociere semnificativă cu căile de cancer pancreatic, incluzând gene importante precum SMAD4, ERCC1, TGFBR2 și ATM, implicate în progresia tumorală și răspunsul la tratament.
Analizele de supraviețuire pe cohorta TCGA au confirmat relevanța clinică a acestor EDEGs, separând pacienții în grupuri cu risc crescut sau scăzut, cu un P = 2,22 × 10⁻³⁹.
Detectarea splicingului alternativ
DOLPHIN a demonstrat o creștere substanțială a sensibilității în detectarea evenimentelor de splicing alternativ, cum ar fi exon skipping și exoni mutual exclusivi. În dataset-ul PBMC, numărul median de evenimente de exon skipping detectate per celulă a crescut de la 183 la 1215, iar cel al evenimentelor de tip MXE de la 4 la 22. În plus, valorile PSI calculate de DOLPHIN au prezentat o corelație mai mare cu date pseudo-bulk, indicând o precizie sporită în cuantificarea splicingului.
Benchmarking și comparații
În comparație cu instrumente consacrate (SCANPY, scVI, scDeepCluster, scQuint, SCASL), DOLPHIN a obținut scoruri mai mari la toți indicatorii de calitate a clusterizării (ARI, NMI, CS, AMI, FMI). Îmbunătățirile au fost consistente pe toate platformele (full-length și 10X), confirmând robustețea și generalizabilitatea metodei.
Concluzii
DOLPHIN introduce o schimbare de paradigmă în analiza scRNA-seq prin trecerea de la nivelul de genă la nivelul de exon. Prin integrarea citirilor de exon și de joncțiune într-un cadru de învățare profundă, DOLPHIN:
- îmbunătățește clusterizarea celulară și reduce efectele de lot,
- detectează gene diferențial exprimate la nivel de exon cu relevanță clinică,
- crește sensibilitatea și precizia în detectarea splicingului alternativ,
- permite identificarea markerilor celulari subtili și a mecanismelor patologice ascunse.
Aceste rezultate plasează DOLPHIN ca un instrument puternic și versatil pentru studiul heterogenității celulare, reglementării transcripționale și mecanismelor bolilor, cu aplicații directe în descoperirea de biomarkeri și ținte terapeutice.
Copyright ROmedic: Articolul se află sub protecția drepturilor de autor. Reproducerea, chiar și parțială, este interzisă!
- CA 125 ??
- Marcherul tumoral peste valorile normale
- Markeri tumorali
- Marker tumoral.
- Bună ziua, mi-a iesit 13, 01 U/ml si HE4 27, 37 pmol/L..siI roma a iesit 1, 9 este grav ?
- Marker Ca15-3
- Marcherii tumorali, pancreas degenerat lipomatos