听到父母教育孩子“做完试卷要检查”我就来气。 大家都是应试过来的人,哪个做题家不知道检查基本没用,全靠做题时的准确率? (我的观点是,学霸不“检查”,学渣才检查。学霸一定在试卷上验算+做标记,不做标记的肯定100%做对) 以前我只是反对,在观点层面反驳但通常无效,最近我总结提炼出了一个新概念和落地实践。🤣 context: 和家里小学生用 notion 合作搭建“学习os”,包括路线图、概念库、资料库和错题库等。都是 database,相当趁手。每次考试前都会做一些真题。和小学生讨论错题时有感,随手记录。 最近总结了一个做题的目标:(解题时的)元认知准确率(图 1)。 方法:解题元认知 所有解题,结果分为 4 类:确定+✅,确定 but ❌,不确定+❌,不确定 but ✅; 好的、体现学习者具备元认知的情况:确定+✅,不确定+❌;前者完全不用管,后者加入错题库; 不确定 but ✅:本质就是蒙的,靠解题技巧或运气可以得分,但本质上是不会,下次遇到还会错。所以,即使孩子做对,我也作为错题处理,加入错题库; 最需要重要的、体现学习者不具备元认知的情况:确定 but ❌。这是最需要重视的!孩子需要和 ChatGPT 讨论完错题,然后在错题库中书面总结原因。 所以,除了卷面得分,更重要的是学习者做题的“元认知准确率”(图 2)。 以小学生昨天做的一套真题为例(图 3), 虽然得分是36/50,但是按照元认知层面准确率是 40/50。应该给出大大的 positive reward。👏
if 你关注 ai,then 推荐观看这部 deepmind 纪录片。 尤其适合家庭观看,顺便聊一聊 ai、游戏、思考等话题。每天吃饭看一点,三次就能看完。 这部纪录片去年就电影节放映了,但昨天google 把全片在youtube 上免费放出来了。 非常有趣的是纪录片的名字:《思考游戏》(the thinking game)。 可以说,最让人敬佩的,不是 demis 得了诺贝尔奖,不是 demis 的智商,而是那种“把世界当成一场思考游戏”的眼光。 ====== 如果把整个人类文明看成一场漫长的“思考游戏”,这部片子讲的,就是一群人如何把这场“思考游戏”本身拆开、重写规则的故事。 对他们来说,棋盘、街机游戏、星际争霸、蛋白质折叠,甚至整座虚拟世界,都只是训练一种东西的道具:通用智能。 Demis 的人生像一条被同一问题穿线的轨迹:少年国际象棋天才,在教堂里熬到第十个小时,突然意识到,也许把几百个顶尖大脑锁在一间大厅里只为分出输赢,是在浪费心智;于是转向游戏设计,用主题公园里的“呕吐连锁反应”去逼真模拟人类行为;再到剑桥研究大脑,从神经科学里偷师,最后拉上 Shane,干脆在伦敦创立 DeepMind,明目张胆地说:我们要做 artificial general intelligence。 他们选择了一条看起来很“不务正业”的路径:先让系统学会在 Atari 里打 Pong、挖 Breakout 的侧翼隧道,再去下围棋、打星际。强化学习、奖励信号、环境与智能体的闭环,在这些游戏里被一次次打磨:系统一开始连挡球都不会,只知道分数越高越好,最后却能在围棋上下出连职业棋手都无法想象的招法,能在星际里练出堪比职业选手的多线操作。这里有一种残酷的坦诚:你不告诉机器规则,只给目标,它会自己找到通向高分的“人类从没想过”的路径。 但真正让这条路线显出重量的,是当他们把同样的思维搬到现实科学问题上。蛋白质折叠这个自 20 世纪 60 年代就存在的难题,几十年里无数聪明人试过,都卡在实验慢、数据少上。第一次参加 CASP 比赛,他们的 AlphaFold 确实赢了同行,却只是在“一个没人解好的问题上解得稍微好一点”。团队后来回看那一届,很坦白:我们知道自己还很烂,这只是最高的梯子,但月亮还在很远的地方。 转折来自第二次“总攻”:重写数据管线,把物理与生物学的结构知识真正喂进模型,让系统不再只是模仿,而是内化约束。最终在 CASP14 上,他们的结构精度几乎等于按下按钮得到实验级结果,主持人说,经过半个世纪,这个问题可以宣布被解决了。接下来的一步更激进:既然可以在一个月里预测全已知物种的蛋白质,那就别等别人排队提交序列,直接把全地球的蛋白质都“折完”,免费公布,让它成为人类生物学的基础设施。 技术从来不是中性的玩具。AlphaGo 之后的“Sputnik moment”、AI 军备竞赛的隐喻、与曼哈顿计划的对照、对 autonomous weapon 的明确拒绝,以及对 move fast and break things 的公开反感,都在提醒一个事实:当你试图造出一种比人类更强的认知系统时,你不是在做一个新 app,而是可能在改写历史的分界线。连 DeepMind 自己的人都开始担心:也许我们将来要做的,不是说服世界我们已经造出了智能,而是解释我们还没到那一步。 这部片子最有价值的地方不在于追星 DeepMind,而在于它把几个关键问题扔在桌面上:什么叫“通用”的学习能力?在一个只看奖励的系统里,价值是如何被编码、被放大的?科学探索和工程冲刺之间,节奏如何拿捏,才不会“死在时间轴上”?当智能被外包给机器,人类该把注意力放在哪里——是新的问题意识、新的制度与治理,还是对自身价值观的重新书写? 也许真正值得我们模仿的,不是某个算法或产品,而是那种“把世界当成一场思考游戏”的眼光:敢于承认自己暂时还很烂,敢于在失败里调整节奏,也敢于在成功时把成果毫无保留地推向全人类。