时政
财经
科技
虚拟货币
其他
登录
#AI测试
关注
sitin
4周前
有同学在问我怎么进行 AI 编程。我一般是先跟 Claude 沟通,把这个需求定下来。之后生成一个文档,生成完文档之后,让另外一个 Claude 去执行里面的内容。 执行完之后,我一般会用 PlayWright 来让整个 AI 帮我测试。这样就能保证一些基础问题不会出现。否则的话,AI 开发完了之后,可能会出现一些基础的页面问题、组件缺失问题等等,这样也会浪费时间。
AI编程工具激战:Claude Code、Gemini Cli崛起· 900 条信息
#AI编程
#Claude
#Playwright
#AI测试
#自动化测试
分享
评论 0
0
歸藏(guizang.ai)
3个月前
看了一下机器之心的高考数学 AI 模型测试。 国内模型在过去一年的推理能力进步很真的挺大的,基本全部都能考上 130 多分。 豆包、DeepSeek的选择题和解答题得分都非常高,基本上超过了大多数人的水平。而且豆包在 APP 端和 API 端的分数都很高。 Gemini 确实强,在所有客观题的测试中排第一。 从 o3 的基准测试来看即使没有像国产模型的高考数学数据,也不应该这么低,API 都这么低的分真有你的 Open AI。 所有模型在几何题上都有问题。说明现在所谓的多模态还远不够,模型没有真正理解空间关系。
AI高考数学测试:O3意外落后,Gemini夺冠引发热议· 34 条信息
#高考
#人工智能
#数学
#AI测试
#机器之心
#豆包
#DeepSeek
#Gemini
#推理能力
#模型测试
分享
评论 0
0
响马
6个月前
如果你用 ai 编程却不让 ai 写测试用例,那你就不是 ai 的主人,而是 ai 的奴隶。你只是 ai 的测试员。
#AI编程
#测试用例
#AI测试
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞