时政
财经
科技
虚拟货币
其他
登录
小互
关注
统计数据
205
文章
0
粉丝
0
获赞
701
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
小互
4个月前
视频似乎是1倍速 并没有加速 Figure 机器人已经相当灵活了...
#视频
#1倍速
#加速
#Figure机器人
#灵活
分享
评论 0
0
小互
4个月前
AI抢人白热化 据路透社:一些 OpenAI 的顶级研究员欲跳槽到 Ilya Sutskever 创办的新公司 SSI 为了挽留他们,OpenAI 向他们开出了 200 万美元的留任奖金 并承诺如果留下,还可获得 2000 万美元以上的股票期权 据两位知情人士透露,部分员工只需要继续工作一年就能获得全部奖金。 SSI 和 OpenAI 双方对此事 拒绝置评。
#OpenAI
#SSI
#人工智能
#人才争夺
#股权激励
分享
评论 0
0
小互
4个月前
兄弟们,牛P了 11Labs 推出 Eleven v3(Alpha 版) 应该是目前地表最强的文本转语音模型了 它 不仅会说话,还能演戏 支持 70 多种语言 多个角色间的自然对话 以及通过 [sad]、[whispers]、[laughs] 等音频标签精准控制语音情绪与非语言表达 与旧版本相比,v3 拥有更强的文本理解能力,可以模拟真实对话中的中断、情感变化与语气调整。
#11Labs
#Eleven_v3
#文本转语音
#多语言支持
#语音情绪控制
#人工智能
#技术创新
分享
评论 0
0
小互
4个月前
OpenAI 推出两大核心功能 将企业或者你的内部知识与 ChatGPT 深度融合 1、Connectors(连接器):将企业内部知识源(如GitHub、Dropbox、SharePoint等)可以连接至 ChatGPT,实现私域知识的智能检索与分析。 2、Record Mode(记录模式):ChatGPT可以自动记录、转录、摘要你会议内容。 通过全新的连接器系统,用户可以让 ChatGPT 接入如 Outlook、Google Drive、Gmail 等关键工具,并在权限范围内获取实时上下文信息。对于企业级用户,还支持接入 SharePoint、Dropbox、Box 等服务。 权限继承:仅检索用户本身已授权的内容。
#OpenAI
#ChatGPT
#企业智能
#连接器
#私域知识
#会议记录
分享
评论 0
0
小互
4个月前
Komiko :AI 驱动的漫画、动画和插画一体化创作平台 支持AI 线稿自动上色、背景移除、图像增强,支持从关键帧生成完整动画,支持 AI 动画补帧。 只需几分钟即可创作出专业品质的漫画、漫画和动画 新推出 视频到视频 功能 上传视频,选择艺术风格或使用提示,即可将视频转换成各种形式
#Komiko
#AI
#漫画创作
#动画创作
#插画创作
#视频到视频
#AI艺术
#人工智能
#科技创新
分享
评论 0
0
小互
4个月前
下死手了🤣 Anthropic 宣布将在5天内切断 Windsurf 的所有API访问权限 具体涉及的模型包括: • Claude 3.5 Sonnet • Claude 3.7 Sonnet • Claude 3.7 Sonnet Thinking 由于Windsurf 从未获得 Claude 4 的直接访问权限 等于直接被Anthropic彻底封杀了❌
#Anthropic
#windsurf
#API访问
#模型封锁
#Claude 3.5
#Claude 3.7
#技术变动
分享
评论 0
0
小互
4个月前
S1 提供原生支持以下语言: 英语、中文、日语、德语、法语、西班牙语 韩语、阿拉伯语、俄语、荷兰语、意大利语、波兰语、葡萄牙语 S1 是当前市场上最具性价比的高质量 TTS 模型: 仅 $15/百万字节 相当于大约 $0.8/小时 音频成本 详细内容:
#多语言支持
#TTS模型
#性价比
#高质量
#英语
#中文
#日语
#德语
#法语
#西班牙语
#韩语
#阿拉伯语
#俄语
#荷兰语
#意大利语
#波兰语
#葡萄牙语
分享
评论 0
0
小互
4个月前
Fish Audio 发布最新的语音生成模型:S1 宣称达到专业配音演员的表现力与自然度 S1具备: 高度自然、流畅的声音 丰富的语气和情绪控制 强大的指令跟随能力 可通过自然语言控制一系列情绪:从(愤怒)、(高兴)、(悲伤)到细微的(强调)、(低语)、(同情)等等! 其训练数据超过 200 万小时音频 表现力和自然度在 TTS-Arena 中排名第一
#Fish Audio
#语音生成模型
#专业配音
#自然度
#TTS-Arena
分享
评论 0
0
小互
4个月前
人应该保持输出能力 就算没有,也要逼着自己输出 尤其是在AI时代 很多人喜欢搞什么笔记,收藏各种资料,实际上只输入,你获取的东西都是零散的,没什么思考,都是别人的思考。 应该尝试输出,我上周和人录了个播客,发现多人一起输出的时候你之前输入的东西会不自觉的系统起来。 而且多人同时输出内容,会产生很多启发的思考,丰富你的知识和思维体系,打破你的一些思想茧房。 还有就是多人同时输出,最好是一种带有强迫性的方式会更好,比如一起录节目会让逼迫你爆发一些东西,还有彼此都会被逼输出一些干货,彼此能收获更多,而多人聊天会彼此或多或少会隐藏一些东西。
#AI时代
#知识输出
#思维拓展
分享
评论 0
0
小互
4个月前
可以搞黄色的视频模型😄 NSFW_Wan_1.3b 根据文字提示生成成人视频内容 该模型基于一个包含大约 1,250 个不同的 NSFW 子版块中排名前 1,000 帖子的数据集训练
#搞黄色
#NSFW模型
#成人视频
#训练数据
#NSFW_Wan_1.3b
分享
评论 0
0
小互
4个月前
微软推出 Bing Video Creator 由Sora驱动 可免费生成视频 目前已在 Bing 手机APP上线 时长:每段视频为 5秒 格式:目前支持 9:16(竖屏),未来支持 16:9(横屏) 并发限制:最多可同时排队创建 3个视频 生成的视频存储期限为90天 可选择 下载、分享 付费机制 免费用户每人有 10次快速生成(Fast Mode) 之后可通过 100个微软积分/次继续快速生成 或选择 标准生成速度(Standard Mode)
#微软
#Bing Video Creator
#Sora驱动
#视频生成
#手机APP
#竖屏视频
#横屏视频
#视频存储
#付费机制
#微软积分
分享
评论 0
0
小互
4个月前
借助实时分析语音节奏与停顿信号(如“um”“ah”),AI 可判断何时等待、何时回应,避免打断用户或不自然的等待,使对话更像真实人类交流。 几乎没有延迟... 详细介绍:
#AI对话
#语音识别
#人机互动
分享
评论 0
0
小互
4个月前
ElevenLabs 发布其对话语音助手: Conversational AI 2.0 相较于上一代有了巨大飞跃 亮点功能: 说话不尴尬了:它能听懂你什么时候停顿、什么时候在思考,不会中途打断你说话。 多语言切换很顺滑:你说中文,它说中文;你说西班牙语,它也能自动切换。 回答更“懂行”:它可以从你公司的知识库里直接找资料来回答你,不胡说。 批量打电话不求人:几百几千个客户,系统可以一次性给他们打电话发通知。 一个模型管两种互动方式:不用分开发文字和语音版本,省人力。
#elevenlabs
#对话语音助手
#Conversational AI
#多语言
#AI技术
#客户服务
#语音识别
分享
评论 0
0
小互
4个月前
波士顿动力公司分享了其 Atlas 机器人的感知系统和视觉能力构建方法 Atlas现在能够有效处理遮挡和不确定性。精准的校准确保了精准的手眼协调,从而实现可靠的操控。 波士顿动力公司的人工智能团队解释了他们如何让 Atlas 人形机器人感知世界并与世界互动。 这是一个融合了图像识别、三维几何理解、 实时控制、错误恢复、与任务规划的复杂感知-决策系统。 波士顿动力正致力于构建一个融合感知和控制的统一模型——推动人工智能从空间智能走向物理智能。
#波士顿动力
#Atlas机器人
#人工智能
#机器视觉
#机器人技术
#感知系统
分享
评论 0
0
小互
4个月前
Deepseek 官方公布了 DeepSeek-R1-0528 细节 ↓🧵 推理能力全面增强: 通过加大后训练算力,模型的思维深度与推理能力显著提升。AIME 2025 测试中准确率从 70% 提升至 87.5%。 幻觉率显著降低: 在摘要、改写、阅读理解等场景下幻觉率下降约 45~50%。输出内容更可靠,事实一致性更高。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 106 条信息
#DeepSeek
#DeepSeek-R1-0528
#推理能力
#AIME 2025
#幻觉率
分享
评论 0
0
小互
4个月前
字节跳动今天发布了一个图像Agent 小云雀AI 感觉有点像lovart 🙂 只需一句指令,主动思考、智能执行、快速交付,让想法一键直达爆款视频与图片。 无需专业技能,让创作像聊天一样轻松,真正实现“灵感即所得,创作零门槛”。
#字节跳动
#图像Agent
#小云雀AI
#Lovart
#爆款视频
#创作零门槛
分享
评论 0
0
小互
4个月前
这个Veo 3 制作的片子非常的炸裂 😂 看的令人动容啊 AI演员的独白,他们活在虚无中,每天被提示词操控他们的人生 他们的人生只有短短的8秒钟... 命运完全不能由自己掌握...
#Veo3
#AI演员
#虚无
#命运
#提示词
分享
评论 0
0
小互
4个月前
人一到网络上似乎会很容易触发一种反驳情绪 就是看到和自己观点或者认知认知或者经验违背的东西,总会不自觉地触发反驳情绪进行激烈评论 我这两年一直在克制这种情绪,允许自己接受不同的观点和思想。 我也很少拉黑人,除非对方一上来就进行人身攻击,而不是就事论事! 还有就是年纪大了容易不自觉的进入一种思想信息茧房,自我封闭,我一直是对各种东西都感兴趣,但是现在感觉是一种基因开关被打开了! 不自觉地就会主动忽略很多自己觉得无关的信息!🤣
#网络反驳情绪
#接受不同观点
#思想信息茧房
分享
评论 0
0
小互
4个月前
Claude 推出语音助手 可以在APP客户端进行体验 支持通过语音助手访问你的日历、Gmail、Google Drive等获取信息和进行网络搜索内容进行回答…
#Claude
#语音助手
#APP客户端
#日历
#Gmail
#Google Drive
#网络搜索
分享
评论 0
0
小互
4个月前
Anthropic 宣布 Claude 的网页搜索功能向全球免费用户开放 用户无需额外订阅即可通过Claude获取实时网络信息
#Anthropic
#Claude
#网页搜索
#免费用户
#实时网络信息
分享
评论 0
0
小互
4个月前
Veo 3 生成介绍商品的视频 这很省事了😎
#Veo3
#视频生成
#智能工具
分享
评论 0
0
小互
4个月前
Google Project Astra 充当人工智能导师 利用AI来指导学生如何进行问题解决,循循善诱而不是直接告诉答案。 Astra 能够实时识别图像并进行语音和多种模式的交互。
#Google
#AI
#Project Astra
#教育科技
#人工智能
#智能导师
分享
评论 0
0
小互
4个月前
Gemini Pro 会员 现在也可以使用Veo 3了 不需要充值 Ultra 会员了 Pro 会员就是之前的高级会员,改名了 之前白嫖的学生会员可以直接使用
#Gemini Pro
#Veo 3
#Ultra 会员
#Pro 会员
#高级会员
#学生会员
分享
评论 0
0
小互
4个月前
Google 展示 Android XR 智能眼镜原型机 长时间记忆、实时语音交互、根据用户行为自动提供帮助 Android XR 智能眼镜功能: 上下文理解:通过摄像头和麦克风获取用户视角,结合地理位置信息理解当前场景和任务。 语音交互:随时启动语音助手,无需手动唤醒、无需使用手机。 实时辅助:根据用户行为自动推荐动作,如导航、查资料、拍照、翻译等。 记忆与个性化:具备长时间任务记忆功能,理解用户偏好、事务上下文。 与 Gemini 整合,实现真正的视觉助手
#Google
#Android
#XR
#智能眼镜
#语音交互
#实时辅助
分享
评论 0
0
小互
4个月前
Google 推出虚拟试衣工具 上传一张自己照片 AI 将在几秒钟内生成你穿上该商品的逼真效果图 - 基于新一代 图像生成模型,专为时尚场景设计 - 依托全球 500 亿商品数据,提供实时可信商品信息 - 还可以根据用户需求主动进行 多条件搜索与比较、比价分析 - 购物流程全自动执行,还可以自动支付下单
#Google
#虚拟试衣
#AI技术
#图像生成模型
#时尚科技
#商品数据分析
#自动购物流程
#AI购物助手
分享
评论 0
0
上一页
1
2
3
4
5
6
7
8
9
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞