时政
财经
科技
虚拟货币
其他
登录
RichChat
关注
统计数据
5
文章
0
粉丝
0
获赞
5
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
RichChat
2个月前
“我几乎完全不同意!” 黄仁勋炮轰Anthropic CEO 老黄全盘反驳Dario Amodei的发言的逻辑很清晰: "首先,他认为人工智能太可怕了,只有他们才应该研究,"黄仁勋在巴黎Viva Technology的新闻发布会上这样评价Amodei。"其次,[他认为]人工智能的开发成本太高,其他人都不该涉足……第三,人工智能极其强大,会导致所有人失业,这就是为什么他们应该成为唯一一家开发人工智能的公司。" "我认为人工智能是一项非常重要的技术;我们应该安全、负责任地开发和推进它,"黄仁勋接着说道。"如果你想要确保事情安全、负责任地完成,就应该公开进行……而不是在暗地里开发后再告诉我这是安全的。" 尽管Anthropic迅速澄清,表示其CEO从未声称“只有他们”能构建安全的AI,并倡导建立国家级的透明度标准。这种澄清虽然听起来合情合理,但其内核依然是一种“看门人”的精英主义思维。它实际上预设了一个前提:AI的未来应该由一小部分拥有先进技术和“正确价值观”的公司来定义和守护。这种模式虽然可能在短期内规避某些风险,但长期来看,可能会导致技术权力的过度集中,扼杀开源社区的创新活力,并让AI的发展方向被少数商业利益所左右。 这场由技术巨头分歧引发的争论,最终揭示了两种截然不同的技术哲学和未来愿景。从我个人观点来看,黄仁勋代表的开放、乐观和民主化路径,显然比阿莫代的悲观和精英化倾向更具说服力和现实意义。
#黄仁勋
#Anthropic
#人工智能
#Viva Technology
#Dario Amodei
分享
评论 0
0
RichChat
2个月前
OpenAI副总裁在最近的访谈中谈到为什么ChatGPT的订阅费设置在20和200美金,简单总结的话是“拍脑袋”...
#OpenAI
#ChatGPT
#订阅费
#副总裁访谈
#价格策略
分享
评论 0
0
RichChat
5个月前
乐观推测只要大方向明确了,在国内的AI+教育的落地发展会比海外更快些?
#AI
#教育
#AI落地
#海外发展
#国内发展
分享
评论 0
0
RichChat
5个月前
来自Google prompt engineering比赛冠军的经验总结 最近Google举办的提示词工程比赛中,瑞典选手Joakim Jardenberg在300多名选手中脱颖而出。 总结一下他提到的经验 - 首先是学习方法论,Jardenberg采用了一个简单但有效的迭代方法: 1. 将AI应用到所有可能的任务中; 2. 同时使用多个AI系统相互验证; 3. 保持开放和好奇心态,不预设边界; 4. 关注实际应用场景而非理论限制; 可以类比学习一门新语言 - 你需要不断练习,在不同场景下使用,并且和不同的母语者交流。通过与多个AI系统互动,我们逐渐掌握了与AI对话的"语感"。 他对prompt的具体建议也和我之前写过的建议很类似,核心观点是要把AI看作一个初级但有潜力的同事,而不是简单的软件工具。就像带新人一样 - 你需要给出清晰的指导,同时也要给他们思考和创新的空间。 一些关键点: - AI和人一样需要明确的上下文和及时的反馈; - 不要过度约束,给AI发挥空间; - 用自然语言交流,避免过于形式化的提示词模板; - 持续跟踪AI能力的演进,及时调整交互策略; 从实践角度看,这些建议本质上是在建立一个良好的合作关系。就像和新同事建立信任一样,了解对方的特点和能力,才能更好地协作。
#Google比赛
#Prompt Engineering
#提示词工程
#Joakim Jardenberg
#AI迭代方法
分享
评论 0
0
RichChat
5个月前
刚看到还有人在做一个专门测试大模型“幻觉”的排行榜,这是今年2月11号更新的榜单,排名第一的是Google Gemini-2.0-Flash-001。 不用在图上找文采比较好的DeepSeek R1和Sonnet 3.5了,按照这里的统计都属于上不了榜的水平。。。 榜单的打分逻辑很简单:训练了一个专门检测幻觉的模型,然后用1000篇短文档测试市面上的各大LLM。每个LLM都被要求严格按照文档内容做总结,温度设为0以保证输出的确定性。记录三个关键指标:事实一致性率、幻觉率和回答率。 为什么选择总结任务?- 因为在普通问答中研究者很难判断回答是否属于幻觉。但在总结任务中,由于有明确的参考标准 - 原文本身。这让评估变得客观且可量化。也算是模拟了真实世界中RAG系统的应用场景。
#大模型
#幻觉排行榜
#Google Gemini-2.0
#DeepSeek R1
#Sonnet 3.5
#幻觉检测
#LLM测试
分享
评论 0
0
1
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞