Gorden Sun2025-06-03 23:12:52PlayDiffusion:可局部编辑的音频模型 基于扩散模型,可以实现局部编辑一段音频里的部分内容,类似图片的inpaint一样。例如,原音频是“The answer is out there, Neo. Go grab it!”,可以把其中的Neo改成其他人名,而不修改其他部分的音频。不支持中文。 Github: 在线体验:
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞2025-06-03 09:42:53什么是 Grokking?(原意来自俚语:通过神入作用而理解) “Grokking”是 OpenAI 在 2022 年提出的LLM的一个重要现象,指的是: 当模型在训练初期靠死记硬背(memorization)取得低训练损失,但测试误差很高;然后在极长时间训练后,模型突然学会了泛化结构,测试集准确率急剧上升。 这种现象最初在小模型上观察到,如:一个小 transformer 学习一个 mod
karminski-牙医2025-06-03 07:01:17看到个热别好的文章:ChatGPT 的记忆是如何工作的 文章对 ChatGPT 的记忆系统进行了逆向分析,它有双层记忆架构: 1. 保存记忆系统:当用户手动控制的时候就可以进行保存("Remember that I...") 2. 聊天历史系统:包含当前会话历史,对话历史(2周内的直接引用),用户洞察(AI自动提取的该用户的对话特征) 其中用户洞察系统贡献了80%+的性能提升和体验,核心原理是
夜谈2025-06-01 16:11:48ai的又一小步 全ai论文被顶级学术会议接受! 论文题为《Tempest:通过树搜索实现大型语言模型的多轮自动越狱》,已被 ACL 2025 主会录用 ACL 2025 即计算语言学协会 2025 年年会。它是自然语言处理(NLP)和计算语言学领域最具权威和影响力的国际学术会议之一。