Ceasul dopaminei, sau cum anticipează creierul momentul recompensei

Ceasul dopaminei, sau cum anticipează creierul momentul recompensei

©

Autor:

Ceasul dopaminei, sau cum anticipează creierul momentul recompensei
Un studiu publicat în Nature, realizat de o echipă de cercetători de la Universitatea din Geneva (UNIGE), Universitatea Harvard È™i Universitatea McGill, dezvăluie un mecanism surprinzător prin care creierul nu doar anticipează recompensele, ci È™i momentul exact în care acestea vor apărea. La baza acestei descoperiri se află integrarea inovatoare dintre neuroÅŸtiinţă ÅŸi inteligenÅ£a artificială.
Zona tegmentală ventrală (ZTV), o regiune mică din profunzimea creierului, joacă un rol central în sistemul de recompensă È™i motivaÈ›ie. Această structură este principala sursă de dopamină – neuromodulatorul responsabil pentru anticiparea È™i procesarea recompenselor. Studiile din anii 1990 au arătat că ZTV nu răspunde doar la recompensă în sine, ci mai ales la predicÈ›ia acesteia, declanÈ™ând eliberarea de dopamină atunci când apare un indiciu asociat cu o recompensă aÈ™teptată.

Acest mecanism se bazează pe învățarea prin întărire (reinforcement learning), un proces de adaptare comportamentală în care organismele îÈ™i ajustează acÈ›iunile în funcÈ›ie de consecinÈ›ele pozitive sau negative ale acestora. AcelaÈ™i principiu este la baza algoritmilor de inteligență artificială care învață prin feedback, cum ar fi AlphaGo, celebrul sistem AI care a învins campionul mondial la jocul Go.

Despre studiu

Studiul realizat de echipa condusă de prof. Alexandre Pouget de la UNIGE, în colaborare cu prof. Naoshige Uchida (Harvard) È™i dr. Paul Masset (McGill), a avut ca obiectiv investigarea complexității codificării temporale a recompenselor în neuronii dopaminergici ai ZTV. Cercetătorii au dorit să afle dacă neuronii acestei regiuni codifică nu doar faptul că o recompensă este aÈ™teptată, ci È™i când exact se va produce aceasta.

Pentru a explora acest aspect, echipa a utilizat un algoritm matematic inspirat din inteligenÈ›a artificială, capabil să integreze mai multe scale temporale de învățare. Acest model de învățare prin întărire pe multiple scale temporale a fost testat pe date neurofiziologice colectate de la È™oareci implicaÈ›i în două sarcini comportamentale distincte, fiecare presupunând aÈ™teptarea unei recompense la un anumit interval de timp.

Cercetătorii au măsurat activitatea neuronilor dopaminergici din ZTV È™i au analizat modul în care aceÈ™tia codifică eroarea de predicÈ›ie a recompensei (reward prediction error), adică diferenÈ›a dintre recompensa aÈ™teptată È™i cea obÈ›inută.

Rezultate

Rezultatele studiului indică o funcÈ›ie mult mai sofisticată a ZTV decât se credea anterior:
  • Neuronii ZTV codifică în mod diferenÈ›iat momentele viitoare ale recompensei, nu doar probabilitatea acestora.
  • Fiecare neuron are o constantă proprie de discountare temporală, adică o preferință individuală pentru recompense mai apropiate sau mai îndepărtate în timp.
  • Această diversitate a timpilor de codificare permite o reprezentare granulară a evoluÈ›iei temporale a recompenselor viitoare, ceea ce oferă un avantaj adaptativ esenÈ›ial.
  • Modelul propus de cercetători explică atât răspunsurile rapide (transient responses) ale neuronilor la indicii anticipatori, cât È™i fluctuaÈ›iile lente cunoscute sub numele de „rampe dopaminergice”.

De asemenea, o descoperire notabilă a fost faptul că constanta de discountare este specifică fiecărui neuron, aceasta rămânând stabilă între sarcini comportamentale diferite. Aceasta susÈ›ine ideea că fiecare neuron dopaminergic posedă o "cale temporală internă" proprie.

Concluzii

Acest studiu redefineÈ™te înÈ›elegerea funcÈ›iei ZTV, demonstrând că sistemul dopaminergic al creierului nu doar anticipează recompensele, ci le plasează cu precizie în timp, pe un „ceas intern” al motivaÈ›iei. Această reprezentare temporală fină permite organismului să ia decizii adaptative, în funcÈ›ie de cât de rapid sau întârziat este beneficiul anticipat.

Integrarea inteligenÈ›ei artificiale a fost esenÈ›ială în această descoperire, ilustrând beneficiile unui dialog bidirecÈ›ional între domenii: neuroÈ™tiinÈ›a inspiră AI, iar AI devine instrument de explorare a creierului. Mai mult, această abordare deschide noi direcÈ›ii pentru proiectarea unor algoritmi de învățare artificială care să imite mai fidel procesele cognitive umane, cu aplicabilitate în robotică, psihologie computaÈ›ională È™i medicină.

Data actualizare: 12-06-2025 | creare: 12-06-2025 | Vizite: 189
Bibliografie
Paul Masset, Pablo Tano, HyungGoo R. Kim, Athar N. Malik, Alexandre Pouget, Naoshige Uchida. Multi-timescale reinforcement learning in the brain. Nature, 2025; DOI: 10.1038/s41586-025-08929-9

Image by kues1 on Freepik
©

Copyright ROmedic: Articolul se află sub protecția drepturilor de autor. Reproducerea, chiar și parțială, este interzisă!


Din Biblioteca medicală vă mai recomandăm:
Din Ghidul de sănătate v-ar putea interesa și:
  • De ce este dificil să ne È›inem de planul de a face sport?
  • Dopamina, responsabilă pentru mâncatul dezorganizat È™i riscul de obezitate
  • Șoarecii pot învăța să manipuleze impulsurile unui neutrotransmițător
  • Forumul ROmedic - întrebări È™i răspunsuri medicale:
    Pe forum găsiți peste 500.000 de întrebări și răspunsuri despre boli sau alte subiecte medicale. Aveți o întrebare? Primiți răspunsuri gratuite de la medici.
      intră pe forum