李老师不是你老师
6天前
-
NewsGuard 测评,DeepSeek 的聊天机器人在提供新闻和信息方面的准确率仅为 17%,在包括ChatGPT、Gemini在内的11个模型中排名第10。 根据媒体可信度评级服务机构 NewsGuard 周三发布的报告,DeepSeek 的聊天机器人在回答新闻相关提示时,30% 的时间重复虚假声明,53% 的时间给出模糊或无用的答案,导致失败率高达 83%。其他机器人在这个测评中平均失败
NewsGuard 测评,DeepSeek 的聊天机器人在提供新闻和信息方面的准确率仅为 17%,在包括ChatGPT、Gemini在内的11个模型中排名第10。 根据媒体可信度评级服务机构 NewsGuard 周三发布的报告,DeepSeek 的聊天机器人在回答新闻相关提示时,30% 的时间重复虚假声明,53% 的时间给出模糊或无用的答案,导致失败率高达 83%。其他机器人在这个测评中平均失败率为62%。 NewsGuard 表示,它对 DeepSeek 采用了与评估西方同行相同的 300 条提示,其中包括 30 条基于网上传播的 10 条虚假声明的提示。