时政
财经
科技
登录
AIGCLINK
关注
统计数据
36
文章
0
粉丝
0
获赞
5
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
AIGCLINK
16小时前
续任新一年的微软MVP,未来继续一起为AI行业做build
分享
评论 0
0
AIGCLINK
23小时前
GROK 4一文看全版: 两个型号:Grok 4和Grok 4 Heavy 推理模型 比Grok 2训练算力增加了100倍 256K上下文,略大于o3和Sonnet 4 Grok 4Humanity's Last Exam得分为25.4%,Gemini 2.5 Pro为21.6%;使用工具后的Grok 4 Heavy得分44.4%,远超Gemini 2.5 Pro的26.9% 在ARC AGI 2基准上为15.9%,快达到了Claude Opus 4的两倍 升级了语音模式: 语气更流畅自然、延迟低,响应速度更快 API新增内置搜索工具 定价: 百万token输入3 美元,百万token输出15 美元,跟Sonnet 4相同,略高于o3和Gemini 2.5 Pro 但上下文窗口超过128k后,价格会翻倍 #GROK4 #Grok4Heavy
分享
评论 0
0
AIGCLINK
1天前
博客: HF:
分享
评论 0
0
AIGCLINK
1天前
腾讯竟上线了微信支付MCP,意味着智能体可以挣钱了! 通过微信支付MCP工具生成付款二维码,就可以在智能体中实现,用户扫码,验证付款,提供服务的完整服务流程了 微信支付MCP目前可在腾讯元器智能体平台使用 微信支付MCP的三个功能: 1、生成支付二维码 2、生成预下单ID 3、查询订单支付状态 腾讯给了一套【微信支付MCP】使用场景模板,可以在智能体中设置“赞赏”或“打赏”,然后解锁下一步回答 目前可以使用体验版体验,正式版需要申请,地址见下条 #微信支付MCP #腾讯MCP #MCP
分享
评论 0
0
AIGCLINK
2天前
体验地址: 课堂场景
分享
评论 0
0
AIGCLINK
2天前
Cluely类AI工具彻底火了,又出来一个Proactor,下沉到场景,让AI能力从被动走向主动 Proactor类似一个贴心伙伴,它可以自我感知、思考,并采取行动 比如说,有人想骗你,Proactor就可以核实信息指出错误 可以在课堂上自动获取实时笔记、总结、扩展相关知识 同样适用于对话场景,甚至还可以“劝架” #Cluely #Proactor #AI助手
分享
评论 0
0
AIGCLINK
2天前
superclaude:0门槛编程的上下文工程开源框架,也是继context-engineering-intro之后,第二个上下文工程开源框架,实现了智能体AI Agent、computer use等研发门槛降到0,现在开始可以停止订阅cursor了,基本上可以替代了。 重要的是:为vibe coding的工程化提供了路径,每个公司都可管理vibe coding研发过程,使用/build --featrue增加新的功能给原有的代码库,分析、迭代、测试、部署、质检、文档书写等全部搞定,相当于一个强大的研发团队。 github: #上下文工程 #contextengineering #superclaude #claudecode
AI编程工具激战:Claude Code、Gemini Cli崛起· 206 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 290 条信息
分享
评论 0
0
AIGCLINK
3天前
context-engineering:上下文工程替代vibe coding成为新的AI潮流,提示词工程师逐步退出历史舞台,可转为上下文工程师。 视频主要讲解了上下文工程的实操案例,加上claude code可以替代一切agent,完全不需要写代码就可以造公司复杂的智能体agent了,这次基本上每个公司都可以设置一个上下文工程师的岗位了,可以行动起来了。 github: #上下文工程 #contextengineering #上下文工程师
AI编程工具激战:Claude Code、Gemini Cli崛起· 206 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 290 条信息
分享
评论 0
0
AIGCLINK
5天前
这两天大家都在刷【上下文工程】这个词,看了下整体的思路跟智能体框架的思路基本一致,但是造这个词,更大的价值:算是给搞提示词工程的朋友有个转型的路径和血统正统吧,毕竟提示词工程已经走入要消亡的边缘了。 估计后面随着时间推移,弄不好上下文工程也会替代agent成为更正统的从业者使用行业词,毕竟这个更ai native,也符合当下Claude code、gemini cli、通用智能体等各种主流智能体的实现工程思路,vibe coding更像是实现过程,上下文工程更像代表某个职业😄。 #vibecoder #agent #上下文工程
AI编程工具激战:Claude Code、Gemini Cli崛起· 206 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 290 条信息
分享
评论 0
0
AIGCLINK
6天前
Opencode:Claude Code开源替代来了,可本地化部署和配置,每个公司都可以定制自己的claude code github: #opencode #claudecode #ai程序员
AI编程工具激战:Claude Code、Gemini Cli崛起· 206 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 290 条信息
分享
评论 0
0
AIGCLINK
1周前
kyutai_labs把它的TTS开源了:Kyutai TTS,支持文本流式传输、低延迟 使用L40S GPU,同时处理32个请求,延迟为 350毫秒 除了生成音频,Kyutai TTS 还会输出单词的确切时间戳 英语和法语的WER分别为2.82和3.29,说话者相似度为77.1%和78.7% 能处理长文章,目前支持英语和法语 #TTS #KyutaiTTS
分享
评论 0
0
AIGCLINK
1周前
DXT:正式开启MCP生态的APP Store模式,dxt明确了MCP一键安装规范,将MCP服务转化为一键安装的扩展应用,相当于google浏览器的扩展应用,正式开启MCP零门槛使用的新时代。 dxt可将mcp服务转换为可安装的mcp应用,生成mcp扩展应用相当于chrom的扩展应用,只不过是mcp浏览器替代了传统浏览器,后期也会衍生出mcp扩展应用市场,使用mcp的门槛一下降到0了,每个人都可像安装chrom插件一样在mcp客户端安装mcp扩展,点点点即可 github: (视频错误说明:dtx——dxt) #dxt #mcp生态 #mcp服务 #mcp商店
分享
评论 0
0
AIGCLINK
2周前
牛,浙江省肿瘤医院与阿里等研发了一款可用于大规模早期胃癌筛查的模型:GRAPE,该模型在一位肺癌随访患者中提前6个月检测出了胃癌 模型使用常规的非增强CT影像进行胃癌筛查,通过分析CT片子,来识别出疑似胃癌的高危人群 实验测试,GRAPE尤其在检测早期胃癌方面表现比放射科医生好,放射科医生使用GRAPE的辅助后,诊断准确性有了显著提高 研究人员使用GRAPE分析了两家医院的真实CT数据,其能有效识别胃癌高危人群,并能在无症状患者中检测出胃癌,敏感性和特异性比较高 #AI医疗 #AI胃癌诊断模型 #GRAPE
分享
评论 0
0
AIGCLINK
2周前
从coze space到Minimax Agent下场,意味着大模型公司都在争抢通用Agent方向,很早之前就提过Manus这个方向是所有模型公司都会干的方向,通用不是一个好的增量赛道。
分享
评论 0
0
AIGCLINK
1个月前
火山的Force大会展区走了一圈,体感如下: 1.火山生态还是主要以to c场景为主,深水区to b场景任重道远 2.火山公布自己的token消耗量日均16.4万亿,这个消耗量按照4元/百万token计算,大概日消耗6560万,占中国总销量四分之一的话,那么国内的to c场景消耗大概在2.62亿,这个规模比想象中小太多,to c任重道远 3.国内的to c繁荣必须搬走三座大山:大厂的抄袭、3月以上过长的周期算法备案、资本对to c从业者的现金流包容 4.只有to c繁荣才能将消耗量提升10倍,否则规模太小了 #火山引擎 #豆包
#火山Force大会
#to C场景
#to B场景
#token消耗量
#国内市场
#抄袭问题
分享
评论 0
0
AIGCLINK
1个月前
一款多智能体交易系统:TradingAgents,它模拟真实的交易团队,通过分析、讨论和决策,来决定是否买卖股票 它有分析师、研究员、交易员、风险管理员几个智能体,综合财务数据、市场情绪、新闻报道等多个信息,智能体间进行动态讨论,进而做出全面合理的决策 比如,有的智能体认为股票值得买入,有的认为有风险,它们会通过辩论来达成一个最佳决策 可以自定义策略,你可以根据自己的交易风格和目标,调整智能体的行为,或者添加新智能体和功能模块 支持实时获取最新市场数据和缓存数据 系统基于LangGraph构建,它实验时使用的o1-preview和 gpt-4o作为深度思考和快速思考的模型 #AI交易系统 #TradingAgents #AI股票助手
#多智能体系统
#股票交易
#人工智能
#金融科技
#交易策略
#市场分析
分享
评论 0
0
AIGCLINK
1个月前
今天听了大半天的智源大会具身智能和机器人头部公司的各种观点,也算是代表国内具身智能领域的绝对能力了,体感是很失望,大家还停留在单点突破上,场景和全局考虑突破门都还没进入: 1、数据层面:具身数据数据收集还没有解决数据缺少的问题,主要的三大类数据:互联网视频数据、物理仿真数据、真机数据收集(其中又分了第一视角、第二视角、第三视角数据),但数据量最大的互联网第三视角数据的利用率非常非常低,如何能够利用好互联网数据是具身智能领域gpt时刻来临的关键。 2、硬件机器人标准不统一:就像自动驾驶行业一样,各家有各家的标准,所以每个部件都不统一,对于收集关节、运动数据等造成极大的浪费和泛化障碍,这块需要一个类似于cuda之类的操作系统来同一行业,就像之前分享的ros系统,而这个ros必须要由头部公司来主导,比如未来小米造机器人等。 3、VLA+ROS的联动几乎没有走这个路线的,有一家北京人形机器人创新研究中心的唐老师路线有些突破,想做平台,思路是对的,但vla没有突破之前,短期内很难有平台中间件突破,就像语言模型时代大模型催生了中间件平台产生。 4、不过北京人形机器人创新研究中心唐老师提出的vlm/vla——>世界模型——>奖励模型rm的闭环,值得学习:通过vlm/vla来规划机器人任务、然后通过世界模型仿真机器人指令执行得到结果反馈,让rm模型来做评测选择最合适的路径,这倒是一个值得学习的思路。 5、全球目前比较紧缺的是vla模型,vla模型的发生紧缺的是数据,数据来源最大、利用率最低的是第三视角的互联网数据,如何解决这个问题是有人要寻找一种算法路径来学习互联网视频数据——>具身智能机器人数据的转化,这样才能完成gpt时刻的到来。 #智源大会 #vla模型 #具身机器人
#智源大会
#具身智能
#机器人
#数据收集
#人工智能
#国内行业
#技术发展
分享
评论 0
0
AIGCLINK
1个月前
很有意思的一个项目,科研论文转换代码:Paper2Code Paper2Code可以读取机器学习领域的PDF/LaTeX格式的科研论文,然后自动帮你写出代码,且能自我质量评估 假如你想实现一篇论文里的算法,但懒得自己写代码,就用它帮你把论文里的内容写出代码 Paper2Code采用多智能体设计,工作流分成三部分,它先阅读论文,理解算法的整体结构和流程;然后分析论文中的关键细节,比如公式、变量、参数等等;最后根据分析结果,自动生成代码 实验评估,PaperCoder从机器学习论文中生成代码的质量高、接近作者实现水平,优于其他基线模型 #论文转代码 #Paper2Code
#科研工具
#自动编程
#论文转代码
#机器学习
#智能体设计
分享
评论 0
0
AIGCLINK
1个月前
近期交流了很多具身智能公司和机器人公司,包括机器人数据训练场等,对整体的产业链各方面做了整体的了解,得到一些体感和结论供大家参考: 1、具身智能领域还没有迎来gpt时刻,还处于局部优化阶段,大多数团队都是专注于电机、手臂、曲度、手抓能力等局部优化,全部优化团队非常缺少。 2、国内的大多数具身一线公司还没有进入VLA模型阶段,部分公司在尝试世界模型,但都集中在局部场景,精细度可以做到很高但场景泛化能力有限 3、比如群核科技在细分场景做的非常靠前,而且给出的3d设计可以直接用,像展位设计、装修设计、工厂3d建模生产排班等均可自动化,但还是偏向于局部场景。 4、VLA模型在国外有多家有一定的进展,Google的gemini robotic、figure01的模型等,多家在vla模型上都在尝试,国内也就智源在这个方向上有一些建树,其他家貌似还没有开始。 5、从我个人的观察和判断,未来还是需要多模态大模型公司实现从2d多模态到3d多模态突破,从而实现vla模型的突破,但是当下还没有看到哪家模型公司有苗头。 6、这里也呼吁国内的模型公司和团队要关注VLA模型这个方向,这个方向是抢占具身智能未来的关键一环,未来具身智能的三个关键要素:VLA模型+内化指令集的跨平台ROS+具身机器人材料部件。 #具身智能 #vla模型 #gemini
#具身智能
#机器人公司
#机器人数据训练场
#产业链
#gpt时刻
#VLA模型
#世界模型
#电机
#手臂
#曲度
#手抓能力
#局部优化
#整体优化
分享
评论 0
0
AIGCLINK
1个月前
今天跟圈里朋友聊,SH的1万台h200据说在落地中,不是1万张卡是1万台,感觉大概率会干崩h200价格和市场,真心是太激进了,所有做h200集群的朋友可能要慎重慎重再慎重。 拿国内头部的模型公司来说,训练所用到的h200集群也就是256-512台之间,单次训练时常大概在3个月左右,就算所有模型公司全上貌似也用不了这么多。一下子上来这么多机器,除了硬塞给各个高校、科研单位之类的,场景实在有限,没想到这么快h200集群就面临这么大的供给量。
#SH
#H200
#市场
#价格
#集群
#模型公司
#科研单位
分享
评论 0
0
AIGCLINK
1个月前
谷歌基于Gemini 2.5搞了个开源的Deep Research系统示例:gemini-fullstack-langgraph-quickstar,可以动态进行网络搜索、反思搜索结果,最终生成包含引用来源的答案 它会迭代式的进行研究和反思,直到收集足够的信息 支持低、中、高不同的搜索力度,来控制搜索广度和深度 动态生成查询,通过Gemini原生的Google搜索工具进行网络研究,进行反思推理 #DeepResearch #深度研究助手 #AI研究助手
谷歌Deep Research:AI操作系统雏形?· 10 条信息
#谷歌
#Gemini 2.5
#Deep Research
#网络搜索
#AI研究
#搜索引擎
分享
评论 0
0
AIGCLINK
1个月前
解决AI记忆能力的一款轻量级工具:Memvid,它把文本数据编码为视频,可以实现亚秒级的快速语义搜索 它把信息存储在视频里,省空间、速度快、方便携带,并且不用联网 支持语义搜索,内置聊天功能 可以直接导入和索引PDF文档,这样就可以把一些书籍、论文等资料快速构建成 AI 记忆库了 #AI记忆 #Memvid
#AI记忆
#Memvid
分享
评论 0
0
AIGCLINK
1个月前
谷歌基于Gemma 3的一款多模态医疗模型:MedGemma,可以根据医学影像和病历描述生成诊断报告 它在胸部X光片、皮肤病图像、眼科图像、病理切片等大量医疗数据上进行了预训练和微调 可以看图说话,给一张X光片,让它用文字描述图像内容;让它回答关于医学的问题;或给它一些医学影像和相关病历信息,让它生成一份诊断报告 两个版本, 4B 多模态版,支持图像和文本 27B 纯文本版 性能都优于其基础模型 应用场景可以用于医学图像分类;视觉问答,看X光片、看看皮肤照片、看眼底照片、看病理切片;报告生成等等;可做为开发医疗AI应用的起点 #AI医疗模型 #AI医疗助手 #MedGemma
#谷歌
#Gemma 3
#多模态医疗模型
#诊断报告生成
#医学影像
#病历
分享
评论 0
0
AIGCLINK
3个月前
这两天闹的沸沸扬扬的朱啸虎唱衰具身智能的言论部分认同: 1. 当前具身智能领域大都还在走传统的路线,犹如2023年之前AI1.0时代的NLP和CV路线,后来transformer出现后将原先语言和视觉路线干废。具身智能也需要经历一次这样的临界点,当前还处于1.0时代,未来VLA模型成熟后,必然会将门槛极大的降低下来,泛化性能增强。 2.当前国内的大多数具身智能公司,很多都是用国外开源的路线二开改来的没啥太强的门槛,泛化能力很差,包括头部几家机器人公司也是如此,这种路线不会持久,犹如元宇宙时代的数字人公司的性质。 3.VLA模型临界点过了之后,ROS和VLA模型协同后,那么整个具身智能领域会进入2.0新的阶段,就像数字人公司在大模型公司加持后,产生了更强的价值。 4.当前市面上的,具身智能公司有场景的公司微乎其微,因为泛化能力不行,针对场景的落地成本极高,大都需要定制,只有VlA成熟后,才能实现场景落地大爆发。 5.VLA模型上gemini和figure公司都弄了自己的VLA模型,国内智元说自己有,技术路线和商业路线不清晰,泡沫说实话太高,这点我认可朱啸虎。 6.至于大家会反驳宇树科技营收好,貌似很多人或者公司买就是为了拍视频装逼pr吧,不是实用性的消费,不进消费场景实际解决问题注定走不远。 #vla #具身智能
#朱啸虎
#具身智能
#AI1.0
#NLP
#CV
#transformer
#VLA模型
#泛化性能
#国内公司
#开源
分享
评论 0
0
AIGCLINK
3个月前
MCP 3D建模的一个用例 可以让Claude直接与Blender对话的MCP:blender-mcp,通过文字提示即可创建3D场景 #MCP #BlenderMCP #AI3D建模
#MCP
#BlenderMCP
#AI3D建模
分享
评论 0
0
1
2
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞