九原客2025-01-28 14:49:24国内大模型玩家小评: 智谱:技术很不错,专攻ToB、ToG,但是新公司想踩透ToB的弯弯绕,得先吃点亏。 讯飞:垃圾模型,但是讯飞在国资委很有影响力,应该还能拿单。 阿里:Qwen 持续开源领先,ToB 躲在后面让集成商中标干苦力活。 腾讯:反正外面没人用,开源了捧个人场。 字节:豆包主要还是服务自家 ToC 场景,API 赚不到钱也没什么人用。 百度:专心做ToC 场景吧,然后做做ToB的单子#智谱#讯飞#阿里
宝玉2025-01-24 15:23:20字节的 AI 自动化测试框架,自然语言就可以测试 Web UI,比如像这样的测试代码: await ai('在搜索框中输入 "Headphones",然后回车'); 当然需要多模态的模型,支持的模型包括: - gpt-4o - claude-3-opus-20240229 - gemini-1.5-pro - qwen-vl-max-latest - doubao-vision-pro-32k #字节#人工智能#自动化测试
宝玉2025-01-23 10:59:04 字节的可以直接操作图形界面的原生 GUI 智能体模型UI-TARS,类似于 Claude 的 Computer Use,可以只靠截取的界面图片就能理解并操作软件。 就像我们人类直接看手机或电脑屏幕一样,利用眼睛去“认”,再动手指去“点”。UI-TARS学会了从图片中辨别按钮、输入框、下拉菜单等各种元素,也能知道“这个图标大概率是搜索按钮”“这个区域是文本框”等信息。 UI-TARS具备四个#字节#GUI智能体#UI-TARS
宝玉2025-01-20 03:28:53字节新出了个 Cursor 的竞品 Trae ,可以用 claude3.5,限时免费 测试了一下不错,它的 Builder 相当于 Cursor 的 Composer 和 Agent 合体,建议默认使用 Builder。 #字节#Cursor#Trae