Listen

Description

你大脑里运行的,或许正是 AlphaGo 的源代码。

长期以来,多巴胺被误解为“快乐分子”。但最新的计算神经科学揭示了其更冷峻的本质:它是一套被称为**“时序差分学习”(Temporal Difference Learning)**的底层算法。多巴胺不负责奖赏结果,它只负责编码“差分”——即这一秒的预期与下一秒预期之间的误差。

本期节目,我们将跟随 Read Montague 博士的视角,拆解这套运行了数亿年的生物演算法。

参考来源:

#多巴胺 #神经科学 #AI算法 #AlphaGo #ReadMontague #计算神经科学 #差分学习 #心理学 #硬核科普