时政
财经
科技
虚拟货币
其他
登录
#Agents
关注
Guangzheng Li
1周前
Google Gemini 的 StoryBook 功能用了 20+ 个 Agents,其中 6 个是专门为故事书功能设计的核心 Agents: 1. Writer - 负责创作故事内容 2. Storyboarder - 分镜和插图说明 3. NewStorybook - 核心 Agent 4. IllustratorSingleCall - 插画导演 5. Animator - 动画导演 6. Photos - Google Photos 集成
Google Gemini 2.5发布引发AI模型性价比热议· 97 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 327 条信息
#Google Gemini
#StoryBook功能
#Agents
#故事创作
#插画
分享
评论 0
0
henu王凯
2个月前
我今儿查找AI教父Yoshua Bengio的相关资料,查到Yoshua Bengio对Agents发表看法:AI agents could be the most dangerous path. 然后我查了下他对Agents相关的主要推测:威胁方面就不说了,其中对Agents一项预测是:按照目前的研究速度,AI 模型能够解决的任务持续时间每七个月翻一番。
#AI
#YoshuaBengio
#Agents
#人工智能
#发展预测
分享
评论 0
0
𝗖𝘆𝗱𝗶𝗮𝗿
5个月前
Manus 爆火之后,我们做了一套框架来验证这件事儿的可行性,就像我们 CTO 说的,技术是没有护城河的。我一直觉得,只要在 AI 这个赛道,应用层不是难事儿。 这套框架基本原理就是:CoT + DoT + Model + Agnets + Artifacts 完成,其实我一直在思考,Sonnet3.7 ReFlect 这么强,到底要不要做用户侧 CoT! ○ 用户提问(通过 Query扩写拓展) ○ 条件思考(通过 CoT 激活反问机制) ○ 调用模型(通过 Sonnet3.7 发散推理) ○ 思维图序(通过 DoT ≈ DAG + ReFlect 不断循环节点反思,直到对单节点结果满意) ○ 调用代理(激活 Computer/Browser Use 针对 DoT 处理) ○ 产出内容(根据 DoT 产生的最终结果生成报告) ○ 动态页面(通过 产生的多模态报告,调用 Artifacts 来生成可视化页面) 以上是 Juchats Team 的一些思考!
#Manus
#ai赛道
#技术护城河
#应用层
#CoT
#DoT
#model
#Agents
#Artifacts
#Sonnet3.7 ReFlect
#用户侧
分享
评论 0
0
Francesco
7个月前
A curated list of resources for AI agents that can control computers and mobile devices, including research papers, projects, and tools
#AI
#Agents
#Control
#computers
#mobile devices
#research papers
#projects
#tools
分享
评论 0
0
九原客
7个月前
Things we learned about LLMs in 2024 中我深有同感的: 1. GPT-4的垄断地位被打破。 2. LLM 价格指数式下降。 3. Prompt驱动的应用已经可以商业化。 4. Agents 还没有出现(出现的只是Prompt驱动的Workflow)。 5. 以o1为代表的推理模型开始出现。 6. 合成数据效果很好,事实上目前大部分模型的SFT数据都是合成的,预训练数据也经过了精心过滤。 7. 社会上不同的人群对大模型的认知差距十分巨大,可能会带来新的数字鸿沟。 8. 长上下文很重要,激发了很多可能性。(没有长上下文,cursor 是不会出现的,只有代码补全)
#GPT-4
#垄断地位
#价格下降
#Prompt驱动
#商业化
#Agents
#推理模型
#合成数据
#SFT数据
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞