时政
财经
科技
登录
#思维链
关注
Tom Huang
1个月前
这个也太酷了!支持本地部署,字节跳动刚刚宣布发布了一款 7B 的多模态模型⚡️ 支持思维链思考和生成图片,并且支持支持自然语言编辑能力,在开启 CoT 的基础上,性能超越 Gemini-2-exp 的生图能力 开源地址 👉
#字节跳动
#7B多模态模型
#思维链
#图像生成
#CoT
#Gemini-2-exp
#开源
分享
评论 0
0
环球网-环球时报
4个月前
马斯克称将发布“地球上最聪明AI”,最大特点是引入“思维链”推理能力
比原计划推迟了数月之后,美国亿万富豪埃隆·马斯克宣布,旗下的人工智能初创公司xAI将于美国当地时间2月17日晚上发布最新版Grok 3聊天机器人,他将Grok 3描述为“地球上最聪明的人工智能(AI)”,这也引起外界对Grok 3的高度关注。
马斯克加州发布Grok 3聊天机器人事件· 15 条信息
#马斯克
#AI
#思维链
#推理能力
#科技创新
分享
评论 0
0
orange.ai
4个月前
深度角色扮演模型 DeepSex 使用思维链和强化学习技术增强模型角色扮演,小说生成能,提升模型的创作能力。 四阶段进化架构: 增量预训练:注入0.4T Token 小说,使用16k上下文训练,增强文本连贯性 Tifa-SFT:融合全球Top4角色扮演模型Tifa的10万条高质量数据 CoT恢复训练:采用Deepseek-32B/671B数据重建推理能力 RL强化:保留发散性思维标签的同时优化生成质量 工程创新: 16k超长上下文训练 随机截断训练增强鲁棒性 8×H20 GPU全量微调 启示与后续: 我们在测试中发现,满血R1在角色扮演中输出内容比较发散,随机,导致此模型有相同倾向,对于角色扮演的影响还在研究中 输入内容相近的话语会导致向量重叠,然后重复输出,如“继续”,“还有”等无明显指向性话语 思维内容与正文关联性学习了满血R1的特点,发散比较严重,可能会有割裂感 针对以上问题,我们正在编写新的RL算法,初步计划剔除部分满血R1的内容,同时通过强化学习解决重复
#深度角色扮演
#DeepSex
#思维链
#强化学习
#模型创作
#小说生成
#预训练
#角色扮演模型
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞