小互

统计数据

205
文章
0
粉丝
0
获赞
701
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
小互
4个月前
视频似乎是1倍速 并没有加速 Figure 机器人已经相当灵活了...
#视频 #1倍速 #加速 #Figure机器人 #灵活
avatar
小互
4个月前
AI抢人白热化 据路透社:一些 OpenAI 的顶级研究员欲跳槽到 Ilya Sutskever 创办的新公司 SSI 为了挽留他们,OpenAI 向他们开出了 200 万美元的留任奖金 并承诺如果留下,还可获得 2000 万美元以上的股票期权 据两位知情人士透露,部分员工只需要继续工作一年就能获得全部奖金。 SSI 和 OpenAI 双方对此事 拒绝置评。
#OpenAI #SSI #人工智能 #人才争夺 #股权激励
avatar
小互
4个月前
兄弟们,牛P了 11Labs 推出 Eleven v3(Alpha 版) 应该是目前地表最强的文本转语音模型了 它 不仅会说话,还能演戏 支持 70 多种语言 多个角色间的自然对话 以及通过 [sad]、[whispers]、[laughs] 等音频标签精准控制语音情绪与非语言表达 与旧版本相比,v3 拥有更强的文本理解能力,可以模拟真实对话中的中断、情感变化与语气调整。
#11Labs #Eleven_v3 #文本转语音 #多语言支持 #语音情绪控制 #人工智能 #技术创新
avatar
小互
4个月前
OpenAI 推出两大核心功能 将企业或者你的内部知识与 ChatGPT 深度融合 1、Connectors(连接器):将企业内部知识源(如GitHub、Dropbox、SharePoint等)可以连接至 ChatGPT,实现私域知识的智能检索与分析。 2、Record Mode(记录模式):ChatGPT可以自动记录、转录、摘要你会议内容。 通过全新的连接器系统,用户可以让 ChatGPT 接入如 Outlook、Google Drive、Gmail 等关键工具,并在权限范围内获取实时上下文信息。对于企业级用户,还支持接入 SharePoint、Dropbox、Box 等服务。 权限继承:仅检索用户本身已授权的内容。
#OpenAI #ChatGPT #企业智能 #连接器 #私域知识 #会议记录
avatar
小互
4个月前
Komiko :AI 驱动的漫画、动画和插画一体化创作平台 支持AI 线稿自动上色、背景移除、图像增强,支持从关键帧生成完整动画,支持 AI 动画补帧。 只需几分钟即可创作出专业品质的漫画、漫画和动画 新推出 视频到视频 功能 上传视频,选择艺术风格或使用提示,即可将视频转换成各种形式
#Komiko #AI #漫画创作 #动画创作 #插画创作 #视频到视频 #AI艺术 #人工智能 #科技创新
avatar
小互
4个月前
下死手了🤣 Anthropic 宣布将在5天内切断 Windsurf 的所有API访问权限 具体涉及的模型包括: • Claude 3.5 Sonnet • Claude 3.7 Sonnet • Claude 3.7 Sonnet Thinking 由于Windsurf 从未获得 Claude 4 的直接访问权限 等于直接被Anthropic彻底封杀了❌
#Anthropic #windsurf #API访问 #模型封锁 #Claude 3.5 #Claude 3.7 #技术变动
avatar
小互
4个月前
S1 提供原生支持以下语言: 英语、中文、日语、德语、法语、西班牙语 韩语、阿拉伯语、俄语、荷兰语、意大利语、波兰语、葡萄牙语 S1 是当前市场上最具性价比的高质量 TTS 模型: 仅 $15/百万字节 相当于大约 $0.8/小时 音频成本 详细内容:
#多语言支持 #TTS模型 #性价比 #高质量 #英语 #中文 #日语 #德语 #法语 #西班牙语 #韩语 #阿拉伯语 #俄语 #荷兰语 #意大利语 #波兰语 #葡萄牙语
avatar
小互
4个月前
Fish Audio 发布最新的语音生成模型:S1 宣称达到专业配音演员的表现力与自然度 S1具备: 高度自然、流畅的声音 丰富的语气和情绪控制 强大的指令跟随能力 可通过自然语言控制一系列情绪:从(愤怒)、(高兴)、(悲伤)到细微的(强调)、(低语)、(同情)等等! 其训练数据超过 200 万小时音频 表现力和自然度在 TTS-Arena 中排名第一
#Fish Audio #语音生成模型 #专业配音 #自然度 #TTS-Arena
avatar
小互
4个月前
人应该保持输出能力 就算没有,也要逼着自己输出 尤其是在AI时代 很多人喜欢搞什么笔记,收藏各种资料,实际上只输入,你获取的东西都是零散的,没什么思考,都是别人的思考。 应该尝试输出,我上周和人录了个播客,发现多人一起输出的时候你之前输入的东西会不自觉的系统起来。 而且多人同时输出内容,会产生很多启发的思考,丰富你的知识和思维体系,打破你的一些思想茧房。 还有就是多人同时输出,最好是一种带有强迫性的方式会更好,比如一起录节目会让逼迫你爆发一些东西,还有彼此都会被逼输出一些干货,彼此能收获更多,而多人聊天会彼此或多或少会隐藏一些东西。
#AI时代 #知识输出 #思维拓展
avatar
小互
4个月前
可以搞黄色的视频模型😄 NSFW_Wan_1.3b 根据文字提示生成成人视频内容 该模型基于一个包含大约 1,250 个不同的 NSFW 子版块中排名前 1,000 帖子的数据集训练
#搞黄色 #NSFW模型 #成人视频 #训练数据 #NSFW_Wan_1.3b
avatar
小互
4个月前
微软推出 Bing Video Creator 由Sora驱动 可免费生成视频 目前已在 Bing 手机APP上线 时长:每段视频为 5秒 格式:目前支持 9:16(竖屏),未来支持 16:9(横屏) 并发限制:最多可同时排队创建 3个视频 生成的视频存储期限为90天 可选择 下载、分享 付费机制 免费用户每人有 10次快速生成(Fast Mode) 之后可通过 100个微软积分/次继续快速生成 或选择 标准生成速度(Standard Mode)
#微软 #Bing Video Creator #Sora驱动 #视频生成 #手机APP #竖屏视频 #横屏视频 #视频存储 #付费机制 #微软积分
avatar
小互
4个月前
借助实时分析语音节奏与停顿信号(如“um”“ah”),AI 可判断何时等待、何时回应,避免打断用户或不自然的等待,使对话更像真实人类交流。 几乎没有延迟... 详细介绍:
#AI对话 #语音识别 #人机互动
avatar
小互
4个月前
ElevenLabs 发布其对话语音助手: Conversational AI 2.0 相较于上一代有了巨大飞跃 亮点功能: 说话不尴尬了:它能听懂你什么时候停顿、什么时候在思考,不会中途打断你说话。 多语言切换很顺滑:你说中文,它说中文;你说西班牙语,它也能自动切换。 回答更“懂行”:它可以从你公司的知识库里直接找资料来回答你,不胡说。 批量打电话不求人:几百几千个客户,系统可以一次性给他们打电话发通知。 一个模型管两种互动方式:不用分开发文字和语音版本,省人力。
#elevenlabs #对话语音助手 #Conversational AI #多语言 #AI技术 #客户服务 #语音识别
avatar
小互
4个月前
波士顿动力公司分享了其 Atlas 机器人的感知系统和视觉能力构建方法 Atlas现在能够有效处理遮挡和不确定性。精准的校准确保了精准的手眼协调,从而实现可靠的操控。 波士顿动力公司的人工智能团队解释了他们如何让 Atlas 人形机器人感知世界并与世界互动。 这是一个融合了图像识别、三维几何理解、 实时控制、错误恢复、与任务规划的复杂感知-决策系统。 波士顿动力正致力于构建一个融合感知和控制的统一模型——推动人工智能从空间智能走向物理智能。
#波士顿动力 #Atlas机器人 #人工智能 #机器视觉 #机器人技术 #感知系统
avatar
小互
4个月前
Deepseek 官方公布了 DeepSeek-R1-0528 细节 ↓🧵 推理能力全面增强: 通过加大后训练算力,模型的思维深度与推理能力显著提升。AIME 2025 测试中准确率从 70% 提升至 87.5%。 幻觉率显著降低: 在摘要、改写、阅读理解等场景下幻觉率下降约 45~50%。输出内容更可靠,事实一致性更高。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 106 条信息
#DeepSeek #DeepSeek-R1-0528 #推理能力 #AIME 2025 #幻觉率
avatar
小互
4个月前
字节跳动今天发布了一个图像Agent 小云雀AI 感觉有点像lovart 🙂 只需一句指令,主动思考、智能执行、快速交付,让想法一键直达爆款视频与图片。 无需专业技能,让创作像聊天一样轻松,真正实现“灵感即所得,创作零门槛”。
#字节跳动 #图像Agent #小云雀AI #Lovart #爆款视频 #创作零门槛
avatar
小互
4个月前
这个Veo 3 制作的片子非常的炸裂 😂 看的令人动容啊 AI演员的独白,他们活在虚无中,每天被提示词操控他们的人生 他们的人生只有短短的8秒钟... 命运完全不能由自己掌握...
#Veo3 #AI演员 #虚无 #命运 #提示词
avatar
小互
4个月前
人一到网络上似乎会很容易触发一种反驳情绪 就是看到和自己观点或者认知认知或者经验违背的东西,总会不自觉地触发反驳情绪进行激烈评论 我这两年一直在克制这种情绪,允许自己接受不同的观点和思想。 我也很少拉黑人,除非对方一上来就进行人身攻击,而不是就事论事! 还有就是年纪大了容易不自觉的进入一种思想信息茧房,自我封闭,我一直是对各种东西都感兴趣,但是现在感觉是一种基因开关被打开了! 不自觉地就会主动忽略很多自己觉得无关的信息!🤣
#网络反驳情绪 #接受不同观点 #思想信息茧房
avatar
小互
4个月前
Claude 推出语音助手 可以在APP客户端进行体验 支持通过语音助手访问你的日历、Gmail、Google Drive等获取信息和进行网络搜索内容进行回答…
#Claude #语音助手 #APP客户端 #日历 #Gmail #Google Drive #网络搜索
avatar
小互
4个月前
Anthropic 宣布 Claude 的网页搜索功能向全球免费用户开放 用户无需额外订阅即可通过Claude获取实时网络信息
#Anthropic #Claude #网页搜索 #免费用户 #实时网络信息
avatar
小互
4个月前
Veo 3 生成介绍商品的视频 这很省事了😎
#Veo3 #视频生成 #智能工具
avatar
小互
4个月前
Google Project Astra 充当人工智能导师 利用AI来指导学生如何进行问题解决,循循善诱而不是直接告诉答案。 Astra 能够实时识别图像并进行语音和多种模式的交互。
#Google #AI #Project Astra #教育科技 #人工智能 #智能导师
avatar
小互
4个月前
Gemini Pro 会员 现在也可以使用Veo 3了 不需要充值 Ultra 会员了 Pro 会员就是之前的高级会员,改名了 之前白嫖的学生会员可以直接使用
#Gemini Pro #Veo 3 #Ultra 会员 #Pro 会员 #高级会员 #学生会员
avatar
小互
4个月前
Google 展示 Android XR 智能眼镜原型机 长时间记忆、实时语音交互、根据用户行为自动提供帮助 Android XR 智能眼镜功能: 上下文理解:通过摄像头和麦克风获取用户视角,结合地理位置信息理解当前场景和任务。 语音交互:随时启动语音助手,无需手动唤醒、无需使用手机。 实时辅助:根据用户行为自动推荐动作,如导航、查资料、拍照、翻译等。 记忆与个性化:具备长时间任务记忆功能,理解用户偏好、事务上下文。 与 Gemini 整合,实现真正的视觉助手
#Google #Android #XR #智能眼镜 #语音交互 #实时辅助
avatar
小互
4个月前
Google 推出虚拟试衣工具 上传一张自己照片 AI 将在几秒钟内生成你穿上该商品的逼真效果图 - 基于新一代 图像生成模型,专为时尚场景设计 - 依托全球 500 亿商品数据,提供实时可信商品信息 - 还可以根据用户需求主动进行 多条件搜索与比较、比价分析 - 购物流程全自动执行,还可以自动支付下单
#Google #虚拟试衣 #AI技术 #图像生成模型 #时尚科技 #商品数据分析 #自动购物流程 #AI购物助手
© 2025 news.news. All rights reserved. 0.10987 秒. v1.0.46
我的评论