首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

不要只是强化学习

文摘 2024-08-13 17:39 四川

今天，我想和大家分享一个发人深省的观点，提醒我们有时需要跳出本能的强化学习（reinforcement learning）模式，停下来思考整个系统的概率模型和背后的规律。

在之前提到的大鼠实验中，研究者为大鼠选择奖励点之前提供了声音刺激，提示水可能出现的位置。这些提示的前后变化概率遵循马尔可夫模型：即80%的概率重复同一边，20%的概率转换到另一边。研究者希望探究大鼠是否能够掌握这些提示所暗含的时间规律或概率模型。

然而，实验结果出乎意料。与没有提示的情况相比，提供提示并未显著提高大鼠选择正确位置的概率。这表明，大鼠并未充分利用这些提示，而是继续依赖原有的强化学习策略来做出选择。

掌握复杂模型和规律是更高级的认知功能的体现。我们人类同样经常依赖强化学习的本能反应，许多人工智能模型也是基于这一原理。然而，要实现更高水平的智能，我们需要超越这种简单的学习模式，主动探索更复杂的认知功能和深层次的规律。

这就是我今天想与大家分享的一个有趣的思考，希望能引发您对更高级认知的探索兴趣。

ref：Isolating perceptual biases caused by trial history during auditory categorization

http://mp.weixin.qq.com/s?__biz=Mzg4MTY3ODk1Ng==&mid=2247485117&idx=2&sn=ddce71c0330b71afb8c6548af611578c

聊聊脑科学

最新文章

单神经元：从编码到解码

简单细胞的感受野

视觉信息的初级编码

从物理世界到视觉皮层

感觉神经元放电的简单模型

放电频率细究

对最小二乘法的简单理解

Spike-Triggered Average：在神经元放电之前

老舍的作文课

成功才是成功之母的实验证据

不要只是强化学习

我们只能看到我们想看到的

持续的慢性压力伤身体

减少选项，提高效率

喝咖啡的正确姿势（番外）

触觉：认知世界的起点

说得多了，自己才能信

关于感冒，你至少应该知道这些

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉