johann.GPT

johann.GPT

0 关注者

6天前

趁着假期终于把《智能简史(A Brief History of Intelligence)》看完了,还挺推荐的。 书中有一个很有意思的事情: 80年代的时候,Richard Sutton发明了TD算法(时序差分算法),用来做强化学习。 差不多同时期,神经科学家Wolfram Schultz在研究猴子大脑的多巴胺神经元。 一开始这俩完全是独立进行的,谁也不知道对方在干嘛。 直到1996年,M