时政
财经
科技
虚拟货币
其他
登录
#数据训练
关注
0xWizard
3天前
人和 ai 的差异没那么大。 人的心法/逻辑/思考方式,就是 LLM 大语言模型底层;平时的“事上练”/经验/盈亏/读书,就是数据训练。 所谓进步和升级,无非就是一边升级模型底层,一边不断喂数据。 这样当 prompt 提示词适当的时候,就能给出更令人满意/更聪明/更接近正确的答案。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 95 条信息
#AI
#LLM
#大语言模型
#数据训练
#模型升级
分享
评论 0
0
Fiona ❤️& ✌️
3周前
为什么机器人看起来笨笨的?结合最近看的奇幻电视剧,“妖变人没有那么简单”,“钢铁变人“也是如此。 机器人最重要的两部分,头脑和身体。简单说他的笨笨,是在替代做人这件事情上,他的头脑差一点,身体也差一点。本文先说上半部分,头脑🧠。 头脑如何变聪明,需要天量的数据训练。机器人的语言模型既有VLM(视觉-语言模型)又有LLM(大语言模型)。 为什么机器人需要 VLM?因为语言模型没有眼睛,只能“听懂”但看不到世界。比如你说“帮我拿起桌上左边的水杯”,机器人必须“看见”才能行动。单靠视觉模型也不够,视觉模型能识别物体,但不会理解人类语言和意图。 VLM = 融合大脑和眼睛 人类指令(语言)+ 环境感知(视觉) → 统一转化成动作计划。 我们现在所习惯的自动驾驶事实上也是VLM。只是自动驾驶需要学习的数据少的多。毕竟人形机器人模仿人,他的应用场景多样性和复杂度都是下一个维度。 而在VLM训练上,机器人所需的数据量和实际的数据量仍有巨大的差距。现在产生这些数据的方式主要是“动作捕捉”和“VR远程操作”。这种数据采集方式成本极高+效率低,贡献的数据量也不够。 同时这些来自特殊采集方式的数据往往缺少“泛化性”。机器人训练常常在干净、可控的环境:桌子上放几个常见物体(瓶子、杯子、积木)。但现实里:杯子可能是半透明的、反光的、被纸巾挡住一半。家里/工厂环境有各种干扰(杂物、噪音、人走来走去)。训练数据缺少这种“长尾情况”,所以一旦环境变化,机器人就“笨”了。
#机器人
#VLM
#数据训练
#泛化性
#人工智能
分享
评论 0
0
Cell 细胞
1个月前
我突然想到,图 2 的训练数据除了来自地图街景外, 还可能来自 社交媒体 定位打卡 的动态。 我们的数据被广泛用于训练, 但是我们没有拿到一分钱。 当然,我们可以提供廉价的 Token 获益, 但是,这局限在了你不是麻瓜。
#社交媒体定位打卡
#数据训练
#廉价Token
#麻瓜
#数据价值
分享
评论 0
0
比特傻
3个月前
今天行情一般,傻哥已经和群友聊起了两性关系了。 傻哥突然有个创业想法 就是用agent,陪聊 陪中年女人聊天,满足她们的感情需求 要代替用户嘴炮的那种 把用户历史和女人聊天的记录全部拿去训练 生成独立agent 然后和社交工具打通 这样可以高并发 并且省去中间无聊的过程,解放天下男性 这时群友提醒我,这不就是 #0xdream 在做的事情么? 傻哥一看,#0xdream 是基于 MCP 构建的 AI 基础设施协议 AI agent+沉浸式AI伴侣+MCP的基础设施 傻哥一看,0xdream是 Star Japan Studio开发的, 官方宣称已经有了4700万用户,并且年收入16M 如此质地,在bsc的AI项目中不多见; $Jager 这个项目,自从傻哥在五一假期发掘至今 历经坎坷波折 拥有20万地址数, $Jager 还是坐稳了bsc分红一哥的位置 这几天看价格也终于稳住了。 两个预售,直接说结论: $Sahara 今天还是陆陆续续有人在冲 群友预测这次估计会超募10倍 单号利润在200刀 另外一个项目 $plasma 的公募,热度低得多 $plasma 是今晚9点开始公募的 群友测算也有大概40%左右的收益率 但 $plasma 的锁仓很恶心 本金锁仓40天比较久+XPL锁定40天解锁 这个双锁会吓退很多人, 愿意吃锁仓风险的上车。
#创业
#两性关系
#智能聊天
#高并发
#社交工具
#数据训练
#科技创新
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞