时政
财经
科技
登录
#数学能力
关注
艾森 Essen
2周前
法国一项最新研究揭示,女孩在数学学习上落后的现象,可能比我们想象的更早出现。研究追踪了260万名儿童的数学表现,发现入学之初,男女生的数学能力差异并不明显。但仅仅四个月后,差距开始显现,一年后,顶尖的5%学生中,男生数量是女生的两倍。这种趋势在公立和私立学校都存在,且在2018至2021年间保持稳定。 研究表明,这种差距并非源于能力差异,而是与焦虑有关。在有时间压力和竞争性的数学教学与测试环境下,女生往往表现不佳。可能是因为从小就被灌输了对数学的恐惧。此外,社会上普遍存在的“男生天生更擅长数学”的刻板印象,也会影响教师和女生自身的信心,从而加剧这一问题。尤其是在高收入家庭,家长可能更多地参与孩子的学习,也更容易将这些观点传递给孩子。
#法国研究
#性别差异
#数学教育
#焦虑影响
#数学能力
分享
评论 0
0
大喵(8年前端讲师,能教你学会编程)
3周前
下回再遇到有人说,数学不好就理解不了加密算法/人工智能/机器学习,你就问他,你自己理解不,你认识有人理解不,会写不,写过不。 一问一个不吱声。 所以学编程跟数学有什么关系?
#数学能力
#编程
#加密算法
#人工智能
#机器学习
分享
评论 0
0
karminski-牙医
1个月前
给大家解析一下 DeepSeek-R1-0528 的官方放出的评测数据。目前 DeepSeek-R1-0528 毫无疑问是开源模型第一了, Qwen3-235B-A22B 在热座上仅座了一个月[苦涩]. 先看图1,我们可以看到编程能力和数学能力都有巨大的提升,基本都是10%左右的提升。这是一个相当猛的结果。而大家这两天放出的测试也能看到这个新版本R1直逼 OpenAI-o3 或者 Gemini-2.5-Pro 的水平. (注意我把 CodeForces 测试分数等比缩小了100x,要不然坐标轴放不下了. 不影响展示提升比例) 具体来讲, Aider-Polyglot 测试从 53 提升到了 71 分, 这个分数比 claude-opus-4 都要高, 仅次于 Gemini-2.5-Pro, claude-opus-4-thinking, o4-mini-high 这三个都是72分。 数学能力的 AIME24'25 测试均提升了10分+, 这里猜测会不会之前放出的 DeepSeek-Prover-V2 会不会也能在训练中起到不小作用 然后看通用能力, MMLU 提升有限, MMLU 是个什么测试呢? 它是个涵盖了多个学科的问答选择题, 问题类似——锅包肉用什么肉? A. 猪肉, B. 羊肉, C.牛肉, D. 鸡肉 (当然实际问题是专业性问题, 比我这个难很多). 目前基础版本的 MMLU 早就被刷爆了(接近满分), 而这次两个 MMLU 的修改版测试没有什么提升, 但这并不是模型训练出现了问题, 而是也快到这两个测试的天花板了, 导致没什么区分度. 这里的区分度可以理解为十以内加减法没有办法作为高考数学题. GPQA 也类似, 但现在也有要被刷爆的趋势了. SimpleQA (这个是OpenAI的测试集) 和 Humanity's Last Exam 这两个目前还没被刷爆, 当然这两个也特别难, 我截图了 Humanity's Last Exam 的例题 (图2) 大家可以看看, 作为一个人类, 我非常有自信这个测试的 2500 道题目全都打 0 分哈哈哈哈. 最后说下总结, 我之前是略对 DeepSeek 这么久没更新有点焦虑的, 但现在来看完全没必要, 甚至只是更新了 R1 就能达到这种水平, 都不用把 R2 掏出来. 这就让大家对 R2 期待更高. 我是真心希望 R2 能有些多模态能力的. 另外题外话, 未来大模型的测试会充满困难, 甚至做出一套完善的测试题目的速度都没大模型发布得快, 现在的头部训练水平会导致新的测试和语料放出后不过几个月就会淘汰. 在我们达到 transformer 模型的理论极限之前, 想要实现AGI, 训练语料的瓶颈可能会更快达到. 所以 R2 的突破会不会是强化学习模式上的新突破, 它的自主学习会更强, 人类的监督只能用来保证模型安全. 否则人类干预完全就是训练的负因素. 让我们拭目以待. #deepseek
深度学习模型升级引发AI能力大跃进,行业迎新变革· 20 条信息
#DeepSeek-R1-0528
#开源模型
#Qwen3-235B-A22B
#编程能力
#数学能力
#OpenAI-o3
#Gemini
分享
评论 0
0
只配抬杠
3个月前
——统计数据表明,在高收入国家,无法“在审查和评估陈述的有效性时运用数学推理”的成年人比例,已上升到平均25%,在美国更是达到了35%。
#高收入国家
#数学能力
#成人教育
#数据分析
#美国
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞