Gorden Sun

统计数据

266
文章
0
粉丝
0
获赞
642
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
Gorden Sun
2个月前
我草ElevenLabs的v3语音模型,已经是Next Level级别了,超越Fish Audio成为最佳中文语音模型,同时也是多语言的首选模型。不知道是不是因为Alpha阶段的原因,现在没有屏蔽NSFW内容。 不要在公开场合外放视频!不要在公开场合外放视频!不要在公开场合外放视频!
avatar
Gorden Sun
2个月前
资讯日报,7月12日:
avatar
Gorden Sun
2个月前
Manus搬到新加坡总体讲是好事。之前也有个类似情况的公司,叫HeyGen,从深圳搬到了美国,现在基本是虚拟人领域第一了。 为什么说整体是好事? 公司:Manus搬到新加坡可以用Claude模型,有机会争取做到世界第一(现在其实很不好用)。 员工:没法带到新加坡的员工,赔偿不用说,有Manus这段履历,这些员工也不用愁找不到工作。 行业:至于中国的通用智能体,慢一点也没关系,等DeepSeek千问豆包的模型再追一追,智能体的路证实能走通了,字节自然就做好了。
avatar
Gorden Sun
2个月前
米哈游创始人蔡浩宇的AI游戏出Demo了 简单玩了下,游戏体验类似豆包+生命线(iOS文字多支线游戏)。 像豆包的部分:3D人物说话,有表情,嘴型同步。玩家语音输入,游戏人物根据用户的输入实时给出语音反馈。语音响应很快(有个通信的动画也降低了延迟的感受),应该自己搭建的ASR+LLM+TTS的对话流程。能听懂中文,但是只会说英文。 像生命线的部分:每当游戏进度有进展,游戏界面会变成聊天框的形式,打字或者发语音交流。 游戏有主线故事,就是帮助人物脱困,你没找到线索也会自动推进剧情。有点AI游戏的雏形了,有主线故事但是没有固定台词,游戏人物有性格设定,说话语气和内容能体现出来,真是期待5年后的AI游戏形态。现阶段的话,有个3D能互动的虚拟人聊天,稍晚加点背景设定,我就挺爱聊的。 美区Steam可以玩(我记得当初填Waitlist明明要求iPhone手机),地址:
avatar
Gorden Sun
2个月前
CSDN怎么有脸收费。。。
avatar
Gorden Sun
2个月前
资讯日报,7月11日:
avatar
Gorden Sun
2个月前
Reka Flash 3.1:开源高性价比模型 20B参数,性能接近Qwen 3 32B,非常适合用作本地运行的模型(代码、自动化任务等),也适合进一步微调用于智能体。Reka是一家成立成立不久的小公司,成员基本来自谷歌DeepMind。 模型:
avatar
Gorden Sun
2个月前
WebSailor:开源WebAgent 阿里开源,专门执行复杂信息搜索的WebAgent,WebSailor-72B版本目前是开源最佳Web Agent,能力接近豆包Search。 Github:
avatar
Gorden Sun
2个月前
资讯日报,7月10日:
avatar
Gorden Sun
2个月前
资讯日报,7月9日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
2个月前
这个动漫科幻风格的sref,效果是真好。MidJourney图片生成视频好像有版权检测,高达没法动起来。 --sref 2007748773
avatar
Gorden Sun
2个月前
Reachy Mini:HuggingFace出品的开源机器人 机器人有摄像头、麦克风,能做动作,能接入AI实现基于视频和语音的对话,支持自己编程给机器人做应用,所有资源都会开源。 Lite版本299美元,无线版本449美元。 官方介绍:
avatar
Gorden Sun
2个月前
资讯日报,7月8日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
2个月前
MCP Toolbox for Databases 谷歌开源的数据MCP工具,可以让Agent连接数据,从而能增删改查数据库。支持多种客户端和数据库。 官方文档: Github:
avatar
Gorden Sun
2个月前
资讯日报,7月7日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
2个月前
资讯日报,7月6日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
2个月前
资讯日报,7月5日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
2个月前
MuseSteamer:百度的AI视频模型 视频效果整体不错,画质比较高,手部精准。动作幅度一般,幅度比不上可灵2.1,视频帧率较低。 目前好像是免费使用,我生成了十几个视频也没提示额度不足。 在线使用:
avatar
Gorden Sun
2个月前
AI资讯日报,7月4日:
澎湃AI新闻合辑:未来科技与社会热点交锋· 75 条信息
#AI #资讯日报 #7月4日
avatar
Gorden Sun
2个月前
ThinkSound:音频生成模型 输入文本、视频、音频或者这几张类型的组合,生成音频。尤其适合给AI生成的音频配上音效。 项目地址: Github: 在线体验:
avatar
Gorden Sun
2个月前
OCRFlux:开源最佳PDF识别模型 效果非常好,相比其他OCR有几大核心亮点: 1)能自动跨页合并段落和表格(首个实现该功能的开源模型),即使页面底部有注释,也能自动跳转注释的位置。如下方图1和图2 2)识别精准度高,96%的准确率,明显高于olmOCR-7B 3)3B大小的模型,3090单卡可运行 4)Markdown输出格式
avatar
Gorden Sun
2个月前
AI资讯日报,7月3日:
澎湃AI新闻合辑:未来科技与社会热点交锋· 75 条信息
#AI #资讯 #日报
avatar
Gorden Sun
2个月前
X-UniMotion:能实现精细手部动作的视频模型 输入参考人物和动作视频,实现参考人物做相同的动作,特色是能复刻复杂、精确的手部动作,几乎看不出瑕疵。目前仅有项目介绍。 项目地址:
avatar
Gorden Sun
2个月前
AI资讯日报,7月2日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
2个月前
OmniAvatar:音频驱动生成虚拟人视频 阿里开源的模型,基于Wan 2.1,通过音频生成虚拟人说话视频,嘴型匹配,有表情有动作。 项目地址: Github:
© 2025 news.news. All rights reserved. 0.04566 秒. v1.0.46
我的评论