Gorden Sun

Gorden Sun

0 关注者

4个月前

Ultra-FineWeb:中英双语开源数据集 OpenBMB开源的数据集,包括1T英文token和120B中文token,是训练MiniCPM4的数据集。 数据地址:

#开源数据集 #中英文 #OpenBMB #MiniCPM4

相关新闻

placeholder

Latte

5天前

刚发现一个 Nano-Banana 精选案例库,收录了 110+ 个实战案例,做 AI 图像的朋友们可以省去无数试错时间。 它不只是简单的效果展示,每个案例都附带完整的输入图 + 输出图 + 提示词,可以直接上手复现。 覆盖的场景非常全: 人物编辑:换装、换发型、换妆造、表情迁移 创意合成:照片变手办、线稿上色、草图变实景 实用修复:老照片修复、去水印、图片增强 设计辅助:产品包装、材质转换、

placeholder

比特Coffee

1个月前

说这种话就是不负责任,分不清局势! 中英帕鲁也好,这两者从来不是“敌对”关系,它们是绝对的盟友!帕鲁的热度起来,对中英文都好! 如果你真想帕鲁好,中英文都不重要!你应该想办法让多人知道帕鲁,加入帕鲁!抢外面的热度! 中文我从200K开始建设,英文我从1.5M开始建设,从头到尾一个没卖!

placeholder

nicekate

1个月前

OpenBMB 推出 VoxCPM-0.5B,试了下,中文语音生成 还不错,读数字也准确,他们给出的性能图里有多个不同语音模型的表现,推荐看下 注: Seed-TTS-eval 用哪些指标? - WER(Word Error Rate,↓越低越好):把合成语音用 ASR 转回文本,与目标文本比对得到词错率;英文用 Whisper-large-v3,中文用 Paraformer-zh 做 ASR

© 2025 news.news. All rights reserved. 0.05249 秒. v1.0.46
我的评论