时政
财经
科技
虚拟货币
其他
登录
#字节
关注
初码
2周前
字节应该加购H20服务器了,推理速度越来越慢,太缺推理机了
#字节
#H20服务器
#推理速度慢
#推理机
#算力
分享
评论 0
0
赵纯想
2周前
字节已经把nano🍌秒了。Doubao-Seedream-4.0
#字节
#Doubao-Seedream-4.0
#nano
#收购
#科技
分享
评论 0
0
向阳乔木
3周前
字节新的文生图模型太强了! 复制任意内容,不超过800字就行。 发给即梦或豆包,选图片4.0模型。 提示词很简单,只需要加中横线分割,输入: “用美漫风格生成” “用火柴人风格生成” “用旧报纸风格生成” “用四格漫画风格生成”
#字节
#文生图模型
#AI
#美漫风格
#图像生成
分享
评论 0
0
Gorden Sun
1个月前
有个做AI的同学说:他们老板的画饼速度,都赶不上大厂的开源速度。 DeepSeek之后,阿里、腾讯、字节的开源又快又好又强。
DeepSeek数据泄露:德国下架,信任崩盘· 271 条信息
中国DeepSeek引发美国科技股暴跌事件· 136 条信息
#AI
#画饼
#大厂
#开源
#DeepSeek
#阿里
#腾讯
#字节
分享
评论 0
0
CatFly
1个月前
各位兄弟姐妹们好,想跟大家分享一个近况。8 月 22 日是我在掘金的最后一天,这段旅程也暂告一段落。接下来,我将加入到新的方向,开启新的探索。 2019 年 8 月 23 日是我入职字节的第一天,六年后的同一天,我将以全新的身份和角色迎接新的挑战。这是我深思熟虑后的决定。非常感谢一路以来各位朋友给予的支持和帮助,让我在这里收获了成长、经验,更收获了珍贵的友情。 我不是一个特别优秀的人,但很幸运能遇到大家这样真诚又优秀的伙伴。来到字节的这些年,我始终在“敢为极致”的价值中不断前行、持续进步。但我也希望自己能去追寻更多“生命力”的可能性。离开并不是告别,而是另一种开始。 这里想引用电影《冈仁波齐》中的一句话与大家共勉:“这个世界上没有什么生活方式是完全正确的,神山圣湖并不是终点。接受平凡的自我,但不放弃理想和信仰,热爱生活,我们都在路上,也许路的尽头是什么,从来都不重要。”
#掘金
#字节
#离职
#新挑战
#感恩
分享
评论 0
0
Gorden Sun
1个月前
M3-Agent-Control:Agent专用模型 字节悄悄放出了一个专门用于Agent的模型,基于Qwen 3 32B训练。 模型:
#M3-Agent-Control
#Agent模型
#字节
#Qwen 3 32B
#模型
分享
评论 0
0
Dinah Zhang
1个月前
蚂蚁和字节约着线上开会,最终选择了腾讯会议
#蚂蚁
#字节
#腾讯会议
#线上会议
#合作
分享
评论 0
0
Y11
1个月前
今年的大厂校招都比往年提前了2-3个月,字节的26届校招开始了. 已经收录,明天就可以有精选岗位出来了.
#高招就业季#:志愿填报与就业攻坚· 243 条信息
教育部推出471.8万岗位,助力高校毕业生就业危机!· 123 条信息
#大厂校招
#提前
#字节
#26届校招
#精选岗位
分享
评论 0
0
NanYi
2个月前
啊?用扣子搞个智能体,都还没调试好,就额度不够了?!说好的字节财大气粗呢?!
#智能体
#扣子
#字节
#额度不足
#调试
分享
评论 0
0
凤凰网-凤凰网综合
2个月前
捐款捐物抢险!小米、字节、中国移动、苹果等多家企业支援灾区
6省区市紧急获1.5亿救灾资金,防灾救灾刻不容缓!· 34 条信息
#小米
#字节
#中国移动
#苹果
#捐款
#救灾
分享
评论 0
0
Y11
2个月前
最近coze搞了好多AI + 智能硬件方向的扶持和活动, 结合着最近coze开源来看(估计觉得没啥好卷的,引入社区资源维护) 感觉2025年接下来将会是端侧大模型的全面爆发,我预估字节接下来在端侧AI方面估计会大力出新的奇迹。
#Coze
#端侧大模型
#字节
#AI
#智能硬件
分享
评论 0
0
Jintao Zhang 张晋涛
2个月前
字节把扣子开源了,虽然也不算是个多大的事儿,不过我比较好奇接下来他们要怎么讲故事了 🤣
#字节
#开源
#扣子
#技术
#中性
分享
评论 0
0
阿橡
2个月前
字节推出中英同传新模型:模拟音色 延迟近专业同传译员水平 该模型实现了平均2-3秒的语音到语音延迟,具备实时模仿不同说话人音色以保留身份特征的能力,并支持对上下文、文化背景及包括绕口令、诗词、美食文化在内的复杂表达的理解与互译。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 524 条信息
#字节
#中英同传
#AI模型
#语音翻译
#低延迟
分享
评论 0
0
AIGCLINK
2个月前
Trae solo:字节发布首个AI上下文工程师,为每个开发人员提供10 倍的生产力、将 PM 转变为产品构建者、让设计师无需编写代码即可进行构建,超越manus和lovable blog: #trae #字节 #solo #manus #lovable
#字节
#AI
#上下文工程师
#产品构建者
#无代码构建
分享
评论 0
0
yihong0618
2个月前
代码意外的非常非常干净,应该是这段时间我看过的最干净的 AI 代码库了,和 frost 讨论了下字节确实这段时间在认真做事啊。
AI编程工具激战:Claude Code、Gemini Cli崛起· 906 条信息
#AI代码库
#干净
#字节
#认真做事
#积极
分享
评论 0
0
EC Elliot
3个月前
字节的多模态模型 - BAGEl - 开源免费 对比优势 • 多模态理解、生成和编辑能力在主流榜单上整体领先,超越 Qwen2.5-VL、InternVL-2.5、SD3 等开源模型 • 图像生成质量高,细节丰富,媲美 SD3 • 图像编辑、风格迁移、自由视觉操作等功能更强 • 支持多轮对话、复杂推理和世界建模,综合能力突出 线上直接体验 官网 Github
#多模态模型
#BAGEl
#字节
#Qwen2.5-VL
#InternVL-2.5
#SD3
#图像生成
#图像编辑
#风格迁移
#自由视觉操作
#多轮对话
#复杂推理
#世界建模
#开源模型
分享
评论 0
0
熠辉 Indie
3个月前
今天晚上和一个阿里的前同事吃饭,他现在人在字节。我给他说我现在主要在教人用 Cursor 编程。令我震惊的来了,作为研发,他居然从未听说过 Cursor,完全不知道是什么🤣🤣🤣我多少有点不可思议.....
#阿里
#字节
#Cursor
#编程
#研发
分享
评论 0
0
歸藏(guizang.ai)
3个月前
字节发布了 Seedance 1.0 Pro 视频生成模型。就是即梦里面的视频3.0 pro 模型 提前测试了一下,发现这次字节的视频模型真的站起来了!! 在提示词理解、画面细节、物理表现一致性理解等方面都无可挑剔 通过火山引擎调用,5 秒 1080P 视频 API 价格仅为 3.67 元 下面有详细的测试👇
#字节
#Seedance 1.0 Pro
#视频生成模型
#即梦
#火山引擎
#视频API
#1080P
分享
评论 0
0
Cell 细胞
3个月前
腾讯、字节的员工也可以不睡觉啊,创业者怎么办,还能变魔法让一天多出一些时间吗?
#腾讯
#字节
#员工
#创业
#时间管理
分享
评论 0
0
Kai
4个月前
字节开始打价格战了 首月 3 刀,月付 10 刀,包年相当于每月 7.5 刀,支持 Claude-4-Sonnet 、Gemini-2.5-Pro 每月 600 次快速请求,无限次的普通队列请求 支持支付宝付款,可以尝试一把
#字节
#价格战
#订阅服务
#claude-4-sonnet
#Gemini-2.5-Pro
#优惠活动
#互联网
#AI服务
分享
评论 0
0
九原客
8个月前
国内大模型玩家小评: 智谱:技术很不错,专攻ToB、ToG,但是新公司想踩透ToB的弯弯绕,得先吃点亏。 讯飞:垃圾模型,但是讯飞在国资委很有影响力,应该还能拿单。 阿里:Qwen 持续开源领先,ToB 躲在后面让集成商中标干苦力活。 腾讯:反正外面没人用,开源了捧个人场。 字节:豆包主要还是服务自家 ToC 场景,API 赚不到钱也没什么人用。 百度:专心做ToC 场景吧,然后做做ToB的单子,闷声不被骂。 华为:专心做昇腾生态,卖昇腾服务器,前途广大。 Kimi:被豆包干死。
#智谱
#讯飞
#阿里
#腾讯
#字节
#百度
#大模型
#ToC场景
#ToB市场
#开源技术
分享
评论 0
0
宝玉
8个月前
字节的 AI 自动化测试框架,自然语言就可以测试 Web UI,比如像这样的测试代码: await ai('在搜索框中输入 "Headphones",然后回车'); 当然需要多模态的模型,支持的模型包括: - gpt-4o - claude-3-opus-20240229 - gemini-1.5-pro - qwen-vl-max-latest - doubao-vision-pro-32k 最新的 Gemini 2.0 Flash 不知道支持不支持 项目网页: Repo:
#字节
#人工智能
#自动化测试
#多模态
#Web UI
#自然语言处理
#AI 模型
分享
评论 0
0
宝玉
8个月前
字节的可以直接操作图形界面的原生 GUI 智能体模型UI-TARS,类似于 Claude 的 Computer Use,可以只靠截取的界面图片就能理解并操作软件。 就像我们人类直接看手机或电脑屏幕一样,利用眼睛去“认”,再动手指去“点”。UI-TARS学会了从图片中辨别按钮、输入框、下拉菜单等各种元素,也能知道“这个图标大概率是搜索按钮”“这个区域是文本框”等信息。 UI-TARS具备四个关键能力,来模拟人类使用电脑或手机的过程: 1. 感知(Perception):从截图中识别出界面有哪些元素、它们的文字、图标、位置等。 2. 行动(Action):能够发出点击、滚动、输入文字、拖拽等具体操作指令。 3. 推理(Reasoning):类似于人类的“思考”过程,尤其是比较复杂或多步骤的任务,需要先策划好要怎么做,再一步步执行。如果中途出错,还要思考如何纠正或绕过困难。 4. 记忆(Memory):对过去的操作和获得的信息进行“记忆”,好让下一步决策更准确。 过去很多尝试,往往是把各种工具模块拼在一起——比如:先用某个模型识别界面元素,再把文字描述交给另一个大语言模型推理,然后再用一个脚本执行操作。这些拼装好的框架对特定场景有效,但迁移性差。UI-TARS 的思路是直接使用一个“大模型”进行端到端学习,把对界面截图的理解、对任务目标的分析以及生成下一步点击指令的过程整合在一起,大大提升了灵活性与稳健性。 UI-TARS 不仅有直接的“直觉式”反应(称为System-1思维),还纳入了更深度的“System-2思维”,或者说“慢思考”。它会在做出点击等动作前,先进行多步推理,比如: “先打开浏览器 -> 输入网址 -> 搜索再点击下载链接 -> 安装软件 -> 打开软件” 如果中途失败或走错,它会像人一样反思错误、再尝试新的方案,避免一直卡在同一个问题上。 至于效果,论文上说在某些测试上超过了 Claude 和 GPT-4o,但估计还是得看实际使用场景,所以还是建议有兴趣的自己试试看。 开源项目地址: Huagging face:
#字节
#GUI智能体
#UI-TARS
#软件操作
#智能界面
#计算机视觉
分享
评论 0
0
宝玉
8个月前
字节新出了个 Cursor 的竞品 Trae ,可以用 claude3.5,限时免费 测试了一下不错,它的 Builder 相当于 Cursor 的 Composer 和 Agent 合体,建议默认使用 Builder。
#字节
#Cursor
#Trae
#claude3.5
#Builder
#Composer
#agent
#限时免费
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞