《自然-神經科學》：高數你考過了嗎？學霸多巴胺神經元拿了A

2021-11-23由神經現實發表于歷史

從前有一棵樹叫高數，上面掛了很多人，你有沒有（險些）掛在上面？《機率論和數理統計》這一本薄薄的教程，改變了無數個原本可以通宵打遊戲、煲劇的大學夜晚。筆者現在還記得大學時坊間流傳的段子：“二項式在密度函樹下展開標準分佈，布里包了兩個釵釵，分別是標準釵和方釵。”

最近，一群來自匹茲堡大學和卡耐基梅隆大學的研究人員發現，我們大腦裡的多巴胺神經元，其實是一群能自學成才的學霸。透過記錄恆河猴多巴胺神經元的放電情況，他們發現這些神經元竟然能讀懂統計學概念上的分佈特徵：

這些學霸猴只需要很短時間的學習，就能分辨出每一種情況下的獎勵頻率是均勻分佈，還是正態分佈的，然後做出最大化獎勵的選擇

。

研究人員給猴設計了一個“

被動觀看任

務

”（passive viewing task），讓猴子在兩種不同的視覺提示（cue）中做選擇。這兩種提示分別對應兩種不同機率分佈的糖水獎勵，一種為均勻分佈，一種為正態分佈。在均勻分佈的情況下，猴子喝到0。2ml，0。4ml，0。6ml糖水的機率都是1/3；而在對稱正態分佈下，喝到0。2ml糖水的機率是2/15，0。4ml的機率是11/15，0。6ml的機率是2/15。為了喝到最多的糖水，它們必須從每一次試驗中強化學習，掌握每一個提示背後的分佈秘密。

- Rothenhoefer et al。，Nat Neurosci。-

猴子的表現著實令人震驚。雖然第一次試驗時是隨機選擇其中一個視覺提示，但很快它們就學會了選擇糖水更多的那一個。研究者透過標準的強化學習模型（standard reinforcement learning model）計算發現，

不論是正態分佈模組，還是均勻分佈模組，學霸猴們都有一條剛開始不斷上升

（active learning phase）

、到後期慢慢接近平臺期的學習曲線

（asymptotic phase）。有意思的是，學霸猴學會正態分佈模組的時間比學會均勻分佈模組的更短，表現也更好。不僅如此，如果在正態分佈模組的早期學習階段，猴子遇到機率很小的糖水獎勵時，它的瞳孔大小也會隨之變化，表明此時的學霸猴更警醒，喚醒水平更高。

那麼多巴胺神經元在學習中的表現如何呢？研究人員在任務中同時記錄了多巴胺神經元的動作電位。他們發現，如果對學霸猴來說，兩種選擇得到的糖水期望價值相同的時候（即期望效用相同），多巴胺神經元的放電水平在兩種分佈下的反應強度也是相似的。但如果正態分佈中出現了小機率的0。6ml的糖水獎勵時，多巴胺神經元的放電水平則會變得高於在均勻分佈中出現同樣多糖水時的放電水平。相反的，如果正態分佈中出現了小機率的0。2ml的糖水獎勵，多巴胺神經元的放電水平就會低於均勻分佈中同樣是0。2ml糖水時的放電水平。也就是說，

多巴胺神經元的反應在正態分佈中的正反兩個方向都被放大了

：糖水出乎意料多的時候，細胞反應更強，出乎意料少的時候，細胞反應更弱。

- Rothenhoefer et al。，Nat Neurosci。-

這個研究告訴我們，多巴胺神經元有很強的數學天分，它們

對不同模組的機率分佈十分敏感，而不是簡單地考慮過去經驗中出現的平均值來做決策

——它的高數成績拿了A，絕對是實至名歸。

TAG：糖水多巴胺神經元正態分佈均勻分佈

《自然-神經科學》：高數你考過了嗎？學霸多巴胺神經元拿了A

相關推薦