时政
财经
科技
虚拟货币
其他
登录
小互
关注
统计数据
144
文章
0
粉丝
0
获赞
249
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
小互
3周前
Google 于近期发布也发布了虚拟试穿产品Doppl 对比下 Doppl只是单纯的试穿 而Gensmo会更考虑结合各种场景和现实使用 纹理和贴合度都很到位。此外,它还融入了上下文场景。 更加注重时尚和实用性
#Google
#虚拟试穿
#Doppl
#Gensmo
#时尚实用性
分享
评论 0
0
小互
3周前
他们索引了全球上亿的时尚单品,为用户定制了超过一千万套个性化穿搭方案。 详细评测和介绍:
#时尚单品
#个性化穿搭
#定制
#穿搭方案
分享
评论 0
0
小互
3周前
Gensmo 一个全新的 AI 时尚购物Agent 实现了时尚领域中 AI 的全链路落地 可以帮你从潮流发现到AI试穿体验再到一键下单购买,全程一步搞定 只需自拍一张自己的照片,几分钟打造你的数字分身,5秒就能试穿任意服装的上身效果 而且看上就能直接购买,无需跳转多个平台, 全部直链海外品牌官网或独立站。 内置了几百万全球商品库任你选,明星街拍、潮流博主同款一秒种草。 简单来说,就是把复杂的“穿衣打扮”变得像刷抖音一样简单——几分钟可以尝试上百种的试穿方案和搭配,喜欢就可以直接购买,不用来回的邮寄试穿,浪费时间。
#AI时尚购物
#数字分身
#AI试穿
#一键购买
分享
评论 0
0
小互
3周前
平台整合全球数百万件商品,帮助用户探索数以万计最新的潮流造型、明星同款和街拍风格,快速定义心仪单品,并且能够为你「搭配」其它或立即找到相似款。 最让我意外的是它的搜索栏是支持中文输入的 这里我让它给我推荐一些运动服装,喜欢可以直接购买
#潮流造型
#明星同款
#街拍风格
#中文搜索
#运动服装
分享
评论 0
0
小互
3周前
只需一张自拍,几分钟内即可创建高精度的3D虚拟形象 还可以根据自身情况调整合适的年龄身材 然后就可以试穿商品库里面的任何衣服
#3D虚拟形象
#自拍
#试穿
#个性化定制
分享
评论 0
0
小互
4周前
ChatGPT Agent 使用多个内置工具协调执行任务: 自动选择最合适的工具 可在多个工具之间切换 保持上下文一致,不丢失信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 325 条信息
#ChatGPT
#agent
#自动化工具
#任务执行
#上下文保持
分享
评论 0
0
小互
1个月前
牛P了 Vidu 的 Reference-to-Video 功能 支持一次性上传最多 7 张参考图片 并结合一段文字提示,生成具有高度一致性、风格统一、视觉保真度高的视频内容 参考图可以是人物、场景、道具等任意内容 下面是我的测试介绍... 利用 Vidu Q1 模型的多模态对齐机制 能实现结构保持、纹理迁移、风格还原同步完成 模型还会根据参考图和 Prompt 自动进行智能镜头推演,构建“视觉叙事”结构,如推镜头、平移、场景切换等 这是目前行业内首个支持多图引用、并具有角色/场景一致性的开放式视频生成工具。 下面是教程
分享
评论 0
0
小互
1个月前
我的 XiaoHu AI会员 一直没有宣传 全靠守株待兔、姜太公钓鱼和自来水...🙃 这次几位大佬赞助了一些福利,借机宣传下 现在开通XiaoHu AI会员 赠送以下福利 约等于白送💀 需要的冲冲冲...🫡
分享
评论 0
0
小互
1个月前
特斯拉发布了首次实现从工厂到客户的完全自动驾驶交付视频 全程17英里,自动驾驶约 30 分钟 穿越停车场、高速公路和城市,抵达新车主家中...
特斯拉无人驾驶:交付突破与监管挑战· 42 条信息
分享
评论 0
0
小互
1个月前
Google 正式推出新一代开源轻量级多模态大模型:Gemma 3n 是目前最先进的移动端和边缘设备模型 它支持图像、音频、视频和文本输入输出 有5B / 8B 两个参数,可在2GB / 3GB 显存下运行 8B版本在 lmarena测试中突破了 1300 分,成为首个参数低于 100 亿且达到此基准的模型。 文本处理支持 140+ 种语言; 多模态理解支持 35 种语言; 在数学、编程和推理方面有显著增强
Google Gemini 2.5发布引发AI模型性价比热议· 96 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 325 条信息
分享
评论 0
0
小互
1个月前
Heygen 展示了其全新的AI视频 Agent 导入你的素材 可以轻松一键制作各种广告、抖音短视频、短片、产品演示视频 它能够在几分钟内制作完整的视频内容,通过分析素材、规划故事、选择镜头并自己编写脚本,生成现成的、可发布的视频。
AI视频井喷:Midjourney领跑,多模态混战· 81 条信息
分享
评论 0
0
小互
1个月前
艹 其他厂商望尘莫及 加速新能源厂商大洗牌
中国新能源车:狂飙突进与隐忧并存· 77 条信息
DeepSeek数据泄露:德国下架,信任崩盘· 163 条信息
分享
评论 0
0
小互
1个月前
小米AI眼镜 👓 经典方框设计,专为亚洲脸型优化,轻至40g 第一人称相机,沉浸式拍摄,支持视频、直播 随身AI入口,一句话完成百科问答、扫码支付等 还可作为开放式耳机,全天佩戴舒适聆听 电质变色特别版,四档随心调 1999元起,现已开售
分享
评论 0
0
小互
1个月前
扎格伯格巨资从OpenAI挖走三位顶尖研究员 甚至在内部成立了专门的挖人小组 奥特曼此前爆料Meta开出高达1亿美元的签约奖金来挖人 根据多家媒体报道,Meta成功从OpenAI挖走三位顶尖研究员——卢卡斯·贝耶尔(Lucas Beyer)、亚历山大·科列斯尼科夫(Alexander Kolesnikov)和翟晓华(Xiaohua Zhai),以加强其“超级智能”(superintelligence)项目。 这三位研究员此前在OpenAI位于瑞士苏黎世的办公室工作,并于2024年晚些时候共同设立了该办公室。他们在加入OpenAI之前,曾在谷歌DeepMind共事,拥有深厚的合作基础和技术专长。 据《华尔街日报》报道,扎克伯格亲自参与了全球顶尖AI人才的招聘工作,通过电子邮件和WhatsApp直接联系目标研究员,甚至在内部设立了名为“招聘派对🎉”的聊天群来协调招聘目标。他还曾在加州帕洛阿尔托和太浩湖的家中举办晚宴,邀请潜在的AI人才。 三位研究员的背景 卢卡斯·贝耶尔(Lucas Beyer):在谷歌工作六年半,专注于支持多模态AI的机器学习系统,研究领域包括可扩展的AI模型,能够整合文本、图像等多种数据模态。他在谷歌DeepMind期间参与了多项尖端视觉模型的开发。 亚历山大·科列斯尼科夫(Alexander Kolesnikov):同样在谷歌工作六年半,担任高级研究员,专注于视觉AI技术。他在2018年至2024年间领导了多项视觉模型的训练,包括2019、2020和2021年ImageNet上的最先进(SOTA)模型。他还是Vision Transformer(ViT)论文的共同第一作者,该论文提出了视觉Transformer模型,引用量高达4.9万次。 翟晓华(Xiaohua Zhai):一位华人研究员,本科毕业于南京大学,2014年获得北京大学计算机科学博士学位。在谷歌DeepMind担任高级研究科学家和经理,领导苏黎世的多模态研究团队,专注于多模态数据(如WebLI)、开放权重模型(如SigLIP、PaliGemma)以及文化多样性研究。他也是ViT论文的共同第一作者。 这三位研究员在谷歌DeepMind合作期间,共同开发了包括Vision Transformer(ViT)、SigLIP、PaliGemma等在内的多个前沿视觉模型,为计算机视觉和多模态AI领域做出了重要贡献。他们在2024年12月从谷歌DeepMind跳槽至OpenAI,并在苏黎世设立了OpenAI的欧洲办公室,专注于多模态AI研究。 OpenAI的反应与行业影响 OpenAI发言人证实了三位研究员的离职,但未提供进一步细节。OpenAI首席执行官萨姆·奥特曼(Sam Altman)在6月17日的一档播客节目中透露,Meta曾向OpenAI员工提供高达1亿美元的签约奖金,以吸引其顶尖人才。奥特曼表示,尽管Meta的报价极具诱惑力,但OpenAI的核心团队成员尚未接受这些 offer。
分享
评论 0
0
小互
1个月前
一份判决书揭秘了Anthropic训练模型细节 五位作家起诉 Anthropic,指控其在训练 Claude 模型过程中使用了数百万本未授权图书(电子书和纸质书)。 2021-2022 Anthropic了下载 Books3(含近 20 万本图书)、LibGen(超 500 万本)、PiLiMi(200 万本)等盗版资源 用于构建“内部研究图书馆” (未直接用于训练全量数据,但内容被用于评估、采样和过滤)。 2024年起: Anthropic转向合法方式:大规模购买实体书籍并扫描 聘请前 Google 图书项目高管 Tom Turvey,设法规避法律阻力。 从零售商、批发商处以数百万美元购买纸质图书(包括二手书)。 服务商负责拆书、扫描、OCR 建立数字副本,构建高质量文本语料库。 法院判决: ✅ 被裁定为“合理使用”的部分: 扫描纸质图书(合法购买)供内部使用,用于模型训练。 法院认为这种做法具有“转化性”(transformative use),构成合理使用(fair use)。 图书未被向外部公开,模型输出也不是原书复制。 ❌ 仍将进入审判的争议部分: 下载使用盗版电子书的行为(如Books3、LibGen、PiLiMi) 法官确认 Anthropic 明知使用盗版数据并长期保留。 虽然后期承诺不再使用,但已造成版权侵害。 有趣的是法院对“合理使用”的核心论点: 法官认为:就像人类“读书→理解→写作”,不能要求每次回忆书中思想都支付版权费用。 “人们阅读、记忆、再创作已有文学结构,从中发展新的思想与写作风格。不能因引用或受启发就处处收费。” 法官强调模型学习与人类阅读记忆之间的相似性,指出模型不是“复制”,而是“吸收与转化”。😂
分享
评论 0
0
小互
1个月前
Google 下一代客户服务智能助手演示 有点炸裂啊 好丝滑 这是Google Cloud Next 25 大会上的一个演示片段,之前被忽视了,展示了Google 最新的客户服务套件的能力。 AI可以看到用户的购物车信息,以及可以申请调用用户的摄像头来协助,还能和主管申请折扣优惠😂
分享
评论 0
0
小互
1个月前
之前薅的Perplexit Pro年度会员 今天陆续有人收到通知被干掉了😂 Perplexit 有点小气了 嘿嘿 不过我刚看了,我的还在🥲
分享
评论 0
0
小互
1个月前
很多人利用AI做自媒体依然跑偏 他们以为把内容进行AI精简总结或者做个漂亮的可视化就是用户想要的。 自媒体的核心任然是筛选和翻译工作,不会因为AI而改变什么,只会提高筛选和翻译的效率而已。 翻译工作就是把好东西找出来加工成人们爱看、能看懂、能领会的方式。 这其中有很多人性的东西(包括被很多人鄙夷的)和一些传播技巧。 当然也要一点天赋!
分享
评论 0
0
小互
1个月前
卧槽 一个未来实时交互界面可能性的展示 Gemini 2.5 Flash-Lite 能够根据前一屏幕的内容 在你点击一个按钮的瞬间 自动生成下一屏幕的 UI 代码和相关内容 也就是说,Gemini 2.5 能够在极短的时间内,根据前一界面的上下文,瞬间预测并编码写出你点击后新的用户界面和内容。 而且你每次点进去可能都不一样,完全基于之前的内容进行生成。 这是不是一种未来UI界面的雏形? 可以根据上下文或者你的需求实时生成交互界面,并展示内容。 例如,用户通过与界面的互动或语音输入,就能实时调整和定制UI,而无需依赖传统的静态设计工具。 不仅仅是生成UI,AI还可以根据用户想要的内容智能的调整界面元素展示内容,可以随心所欲的进行各种交互动作。 类似一种实时的交互操作系统,没有固定的界面。
分享
评论 0
0
小互
1个月前
Perplexity 也推出了定时任务功能 鉴于Perplexity拥有SEC等许多一手金融数据 用来炒股和做金融分析是个很不错的选择 我之前白嫖的Pro年费会员还在,没有给我撸掉 你们的Pro会员还在吗?
Perplexity年度会员免费领取活动引发热潮· 8 条信息
分享
评论 0
0
小互
1个月前
HeyGen 也推出了自己的 UGC 广告数字人 一张个人照片+一张产品照片 输入文字内容 即可生成产品介绍视频
分享
评论 0
0
小互
1个月前
奥特曼: - 小扎搞了一亿美金来挖人,结果没挖走 - 我们相信我们有很大机会实现超级人工智能 - 我们打造了一种创新的企业文化,大家使命优先 - 小扎他们团队没什么创新能力,企业文化很烂 - 我们的团队相信一定会得到回报...
#Meta
#人工智能
#企业文化
#超级人工智能
分享
评论 0
0
小互
1个月前
猩球崛起 🙂
#猩球崛起
#电影
#科幻
#动作
#人猿
#进化
分享
评论 0
0
小互
1个月前
OpenAI 正尝试摆脱微软的控制🤢 据The Information :OpenAI允许微软在重组后拥有其约33%的股份,作为回报,微软要放弃其未来的利润分成权。这意味着微软不再从 OpenAI 新结构中直接获取收入分成 同时OpenAI希望修改与微软现有的合同条款,要求微软放弃其独家托管OpenAI模型的权力 OpenAI 较早与微软签署协议,规定微软拥有OpenAI 模型于 Azure 云平台托管的独家权利。此次重谈中,OpenAI 希望解除该排他性,使其可在其他云服务(如Google Cloud、Oracle、SoftBank等)部署与托管 此前微软通过投资及协议,享有高达 20% 的收入分成权。根据The Information披露,OpenAI 预计到 2030 年前将这一比例降至约 10% OpenAI 收购编程公司 Windsurf 时,原合同赋予微软对 OpenAI IP 的访问权。OpenAI 正尝试将该收购从现有合同排除,以阻止微软获取 Windsurf 的核心知识产权 这表明OpenAI正在尝试摆脱微软的控制,为降低对微软 Azure 的依赖,OpenAI 已与 Google Cloud(今年5月达成)、SoftBank、Oracle 等机构签订合作,提高其算力来源的多元化
OpenAI与微软关系紧张,或将发起反垄断投诉· 5 条信息
#OpenAI
#微软
#控制
#股份
#利润分成
#合同条款
#托管权力
#重组
分享
评论 0
0
小互
1个月前
MiniMax 发布混合注意力推理开源模型 MiniMax-M1 训练成本仅为 53.5 万美元 性能超越Qwen3、DeepSeek-R1 逼近顶级闭源模型 MiniMax-M1引入了一种全新Lightning Attention 上下文优化注意力机制 相比 DeepSeek R1 等模型,在处理 10 万 tokens 的生成任务时,MiniMax-M1 的计算量仅为其 25%。 该模型基于前代模型 MiniMax-Text-01 开发,总参数规模为 4560亿,每个token激活参数为 45.9亿,支持最长 100万tokens 的上下文输入(约为 DeepSeek R1 的8倍)。 提出了一种新型强化学习算法 CISPO(Clipped Importance Sampling with Policy Optimization),该算法: 不裁剪 token 梯度,而是裁剪采样权重(importance weights)。 减少训练不稳定性,提升收敛质量。 缩短训练时长(Qwen2.5对比实验显示,训练速度提升2倍)
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 7 条信息
#MiniMax-M1
#开源模型
#Lightning Attention
#深度学习
#Qwen3
#DeepSeek-R1
#AI性能
#模型对比
#注意力机制
#上下文优化
分享
评论 0
0
1
2
3
4
5
6
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞