İnsan beyninin öğrenme mekanizması, bugüne kadar çoğunlukla ödül-ceza sistemi ile açıklanıyordu. Ödüle ulaşmanın tercih edilen bir davranışın tekrar edilmesini sağlaması, öğrenmenin temel ilkesi olarak kabul ediliyordu. Ancak Nature dergisinde yayımlanan yeni bir araştırma, beynin yalnızca ödül değil, tekrar üzerinden de öğrendiğini gösterdi. Farelerle yapılan deneylerde, beynin striatum bölgesinde tespit edilen özel bir dopamin sinyali sayesinde, bireyin yaptığı hareketlerin sonucuna değil, tahmin edilebilirliğine bağlı olarak pekiştirildiği ortaya çıktı.
Araştırmacılar, bu sinyali "eylem tahmin hatası" (action prediction error - APE) olarak adlandırıyor. APE, bireyin hangi hareketi yapacağının öngörülüp öngörülememesine bağlı olarak değişiyor. Eğer bir hareket daha önce de yapılmışsa ve artık beklenen bir davranış haline gelmişse, bu sinyal zayıflıyor. Yani hareket, dışsal bir ödül olmasa da “alışkanlık” haline geliyor. Bu sistemin, beynin klasik ödül-tabanlı öğrenme mekanizmasından bağımsız çalıştığı da ilk kez deneysel olarak kanıtlandı.
Alışkanlıkları kalıcı hale getiren ne?
Daha önceki teoriler, öğrenmenin tamamıyla "ödül tahmin hatası" (reward prediction error - RPE) yoluyla gerçekleştiğini savunuyordu. Bu sistemde dopamin, bir ödül beklenip de alınmadığında ya da beklentinin ötesinde bir ödül geldiğinde salınıyor ve davranışlar buna göre şekilleniyordu. Ancak günlük hayatta tekrar ettiğimiz birçok davranış, herhangi bir ödül olmadan da sürdürülüyor. İşte bu çelişki, yeni keşfedilen APE sistemiyle açıklanıyor.
Araştırmaya göre, beynin striatum kuyruk bölgesi (tail of striatum - TS), tekrarlanan hareketleri bir öğrenme sinyali olarak kodluyor. Bu da alışkanlıkların neden bu kadar güçlü ve uzun süreli olduğunu açıklıyor. Deneylerde TS bölgesindeki dopamin salınımı, hayvanın hareketi ne kadar tahmin edilebilir hale gelirse o kadar azalıyor. Ödül ise bu süreçte devreye girmiyor.
Araştırmacılar, bu iki sistemin beynin farklı bölgelerinde ayrı ayrı çalıştığını ve farklı türde öğrenmelerin oluşmasında iş birliği yaptığını gösterdi. RPE, yeni ve ödül içeren davranışların öğrenilmesini sağlarken; APE, bu davranışların zamanla alışkanlığa dönüşmesine ve kalıcı hale gelmesine katkıda bulunuyor.
Bu keşif, yalnızca temel bilim açısından değil, Parkinson, obsesif-kompulsif bozukluk ya da bağımlılık gibi nörolojik hastalıkların anlaşılması açısından da önemli bir adım olabilir. Özellikle ödüle duyarlı olmayan ama tekrar eden davranışların nörobiyolojik temellerini çözmek, bu tür hastalıkların tedavisinde yeni yaklaşımların önünü açabilir.
İlginizi çekebilir: Dopamin nedir, ne işe yarar?
Yeni keşfin nöroplastisite ile bağlantısı ne?
Nöroplastisite, beynin yeni deneyimlere, öğrenmeye ve çevresel değişimlere uyum sağlama yeteneği olarak tanımlanıyor. Sinir hücreleri arasındaki bağlantılar zamanla güçlenebilir, zayıflayabilir ya da tamamen yeniden şekillenebilir. Bu esneklik, çocuklukta olduğu kadar yetişkinlikte de beynin öğrenme kapasitesini ve alışkanlıkların nasıl yerleştiğini belirler.
Ancak nöroplastisite, öğrenmenin "sonuçlarıyla" ilgili bir kavram. Yani bir davranış tekrarlandığında sinaptik yolların nasıl değiştiğini ve hangi bağlantıların güçlendiğini açıklıyor. Bu yeni araştırmanın farkı ise, bu değişiklikleri başlatan "öğrenme sinyallerinin" doğasını net biçimde ayırması. Araştırmacılar, dopaminin yalnızca ödül gibi değerli uyarıcılara değil, tekrar eden hareketlere de tepki verdiğini ve bunu alışkanlıkları pekiştiren bağımsız bir sinyal olarak kullandığını ortaya koydu.
Bu bulgular, nöroplastisitenin temelini oluşturan "hangi davranış hangi sinyalle pekişir?" sorusuna doğrudan yanıt veriyor. Beyin, yalnızca neyin değerli olduğunu değil, neyin tekrarladığını da öğreniyor. Ödüle dayalı öğrenme (RPE) ve tekrara dayalı öğrenme (APE) olarak adlandırılan iki sistemin, farklı beyin bölgelerinde çalıştığı ve zamanla davranış kontrolünü birbirlerine devrettiği görülüyor.
Bu açıdan bakıldığında, APE sinyali nöroplastisitenin alışkanlıklarla ilişkili biçimde nasıl çalıştığını anlamamıza yardımcı oluyor. Alışkanlık haline gelen davranışların neden bu kadar inatçı ve kalıcı olduğunu artık yalnızca bağlantıların güçlenmesiyle değil, bu bağlantıların hangi sinyalle pekiştirildiğiyle de açıklayabiliyoruz.
Tekrara dayalı öğrenme keşfi bize ne katıyor?
Öğrenmenin yalnızca ödüle bağlı olmadığını, tekrarın kendisinin de beyni şekillendirebildiğini artık biliyoruz. Bu, alışkanlıkları kırmak kadar yeni alışkanlıklar edinmenin de düşündüğümüzden daha güçlü bir nörobiyolojik temeli olduğunu gösteriyor. Peki bu bilgiyi kendi yararımıza nasıl kullanışlı hale getirebiliriz?
- İyi alışkanlıklar inşa etmek için ödül beklemeye gerek yok. Yeterince tekrar edilen bir davranış, bir noktadan sonra dışsal ödüle ihtiyaç duymadan kendi kendini pekiştirebilir. Her sabah kısa bir yürüyüş, düzenli nefes egzersizi ya da ekran süresini sınırlamak gibi alışkanlıklar ilk başta zor gelse de, devam ettikçe beyin onları “öğrenilmiş davranış” olarak kaydeder.
- Kötü alışkanlıkların kalıcılığı tesadüf değil. Sürekli tekrar edilen, ödül içermeyen ama otomatik hale gelen davranışlar (örneğin sosyal medyada gezinmek, gece geç saatlere kadar uyanık kalmak) da APE yoluyla pekişebilir. Bu yüzden bu alışkanlıkları kırmak için onları yalnızca “bırakmak” yetmez; yerlerine yeni ve tekrar edilebilir davranışlar koymak gerekir.
- Ödül gelmiyor diye vazgeçme. Spor yapmaya başladınız ama hemen bir sonuç görmüyorsunuz, ya da yeni bir beceri öğrenirken zorlanıyorsunuz. Bu noktada dışsal bir ödül yoksa bile, sadece tekrar ederek beynini yeniden şekillendirdiğini bilmek motivasyonu artırabilir.
- Kendini yargılamadan sistem kur. Bu keşif, davranışlarımızın yalnızca irade değil, nöral pekiştirme sistemleriyle şekillendiğini gösteriyor. Yani “neden yapamıyorum?” yerine, “bunu her gün küçük bir adımla tekrar edebilir miyim?” diye sormak daha faydalı olabilir.
Davranışları sürdürmenin gücü ortada. Her tekrar, beynin içine kazınan bir iz bırakır. O izi hangi yöne çizeceğimiz ise büyük ölçüde bizim elimizde.
Referanslar
“Dopaminergic action prediction errors serve as a value-free teaching signal”. Şuradan alındı: https://www.nature.com/articles/s41586-025-09008-9 (14.05.2025).
YORUMLAR