Cell 细胞

Cell 细胞

0 关注者

3个月前

我发现中文语料,还是得靠国内大模型🤦

#中文语料 #国内大模型 #数据依赖 #情感:失望 #语料获取

相关新闻

placeholder

TraderS | 缺德道人

1个月前

美联储极其依赖数据。在 12 月会议上,他们将面临: 1. 没有 10 月的失业率。 2. 没有 11 月的完整非农报告(除非发生奇迹赶在会议期间发布,但即使发布也缺乏前瞻指引的时间)。 3. 通胀数据(CPI)也因关门受到干扰,部分 10 月数据可能永远丢失。 在这种高度不确定性下,央行的本能反应通常是“按兵不动”,以避免在看不清路况时过度操作。

placeholder

偶像派作手

3个月前

鲍威尔昨晚最鹰派的一句话。同时鲍威尔表示点阵图所示的降息路径预测并非承诺,之后的会议还是会根据数据,逐次会议做出决策。

placeholder

阿橡

3个月前

GPT 使用的中文语料被成人赌博内容污染 在 GPT 模型语料库中,超过 23% 的长中文词元或者是成人内容或者是网络赌博,以 GPT-4o 为例,与日本 AV 女星波多野结衣相关的网页比例占到了训练语料库的 0.5%。

placeholder

勃勃OC

4个月前

据《The Information》报道,OpenAI高管表示,如果无法获得谷歌($GOOGL)的数据,他们几乎不可能凭借自身实现同等水平的搜索准确率。

placeholder

Yachen Liu

5个月前

「奔溃」……中文语料质量真是 😅😅

© 2025 news.news. All rights reserved. 0.0356 秒. v1.0.46
我的评论