Gorden Sun

统计数据

266
文章
0
粉丝
0
获赞
642
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
Gorden Sun
2个月前
MiniMax-M1:MiniMax开源的推理模型 分80K和40K两个版本,这里的80K和40K是指推理消耗的最大token数。456B总参数,激活参数45.9B。评分超过旧版DeepSeek R1和Qwen3-235B-A22B。 在线使用: 模型: Github:
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 10 条信息
#MiniMax #开源模型 #推理模型 #DeepSeek R1 #Qwen3-235B-A22B #人工智能
avatar
Gorden Sun
2个月前
AI资讯日报,6月16日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
#AI #资讯 #日报
avatar
Gorden Sun
2个月前
Ultra-FineWeb:中英双语开源数据集 OpenBMB开源的数据集,包括1T英文token和120B中文token,是训练MiniCPM4的数据集。 数据地址:
#开源数据集 #中英文 #OpenBMB #MiniCPM4
avatar
Gorden Sun
2个月前
Flow里的Veo 3提示词里不能写中文了,生成准确的中文语音更难了,看来中文只能等即梦了。
#Veo3 #中文语音 #即梦 #Flow #提示词
avatar
Gorden Sun
2个月前
AI资讯日报,6月15日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
2个月前
Ming-Omni:首个开源版多模态GPT-4o 蚂蚁集团和inclusionAI开源,支持输入文本、语音、图片、视频,输出文本、语音、图片(跟GPT-4o一样),应该是对标GPT-4o的第一个开源模型。 项目地址: Github:
#Ming-Omni #开源 #多模态模型 #GPT-4o #蚂蚁集团 #inclusionAI
avatar
Gorden Sun
2个月前
MagicTryOn:视频版AI换衣 基于Wan 2.1视频模型,使用VideoX-Fun实现了换衣流程。 Github: 项目地址:
#MagicTryOn #视频版AI换衣 #Wan2.1视频模型 #VideoX-Fun #换衣流程 #AI技术 #Github项目 #视频处理
avatar
Gorden Sun
3个月前
AI资讯日报,6月14日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
#AI #资讯 #日报 #6月14日
avatar
Gorden Sun
3个月前
Claude Opus为第一作者发表论文 arxiv上有一篇新论文,Claude Opus是第一作者,论文的内容是驳斥之前苹果发表的论文“大型推理模型不是真正的智能模型”,论据是苹果的实验设计有局限性。 论文:
#Claude Opus #论文驳斥 #苹果
avatar
Gorden Sun
3个月前
AI资讯日报,6月13日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
3个月前
AI资讯日报,6月12日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
3个月前
MidJourney开始视频评分 可以在MidJourney网站上评分他们的AI视频模型生成视频,总体感受是美学依旧在线,但是视频水平也就是可灵1.5的水平,经常出现各种错误和幅度过小的情况。 我对MidJourney的视频模型很担忧,因为v7至今还会把手画错。 地址:
#midjourney #AI视频 #视频评分 #模型错误
avatar
Gorden Sun
3个月前
字节开源LatentSync 1.6 嘴型同步模型,能处理切换镜头的情形,效果还可以。 模型: Github:
#字节开源 #LatentSync #嘴型同步 #AI模型 #GitHub
avatar
Gorden Sun
3个月前
V-JEPA 2:Meta开源的世界模型 杨立昆带队的视觉模型,不仅能理解视频,而且能预测视频。在视觉评测的所有项目上都获得了最高分,在指挥机器人行动方面遥遥领先。 官方介绍: Github: 模型:
#Meta #世界模型 #V-JEPA 2 #视觉模型 #视频预测
avatar
Gorden Sun
3个月前
AI资讯日报,6月11日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
3个月前
MonkeyOCR:兼具质量与效率的OCR模型 3B参数,采用结构-识别-关联的处理流程,兼具准确率和效率。 准确率比传统OCR明显提升,公式识别比MinerU提升了15%准确率;识别速度明显超过VLLM模型,每秒识别0.84页,大幅优于Qwen2.5 VL-7B的每秒0.12页。 Github: 模型:
#MonkeyOCR #OCR技术 #识别准确率 #公式识别 #识别速度
avatar
Gorden Sun
3个月前
AI资讯日报,6月10日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
3个月前
Mirage:虚拟人模型 通过音频驱动,生成生动的人物视频,嘴型同步,有丰富的表情和人物动作,跟HeyGen类似。本身是付费产品,但是官方发布了一个非常详细的技术报告,如果从事这方面的研究,值得一读。 官方介绍: 详细技术报告:
#虚拟人 #音频驱动 #人物视频 #HeyGen #技术报告
avatar
Gorden Sun
3个月前
PartCrafter:生成结构化3D模型 输入图片,生成3D模型,基于DiT,特点是生成的3D模型可以拆成小部件。 项目地址:
#3D模型 #图像生成 #人工智能 #DiT技术 #结构化3D #部件分解
avatar
Gorden Sun
3个月前
AI资讯日报,6月9日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
3个月前
AI资讯日报,6月8日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
avatar
Gorden Sun
3个月前
AI资讯日报,6月6日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
#AI #资讯 #日报 #6月6日
avatar
Gorden Sun
3个月前
AI资讯日报,6月5日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
#AI资讯 #每日新闻
avatar
Gorden Sun
3个月前
Fish Audio开源S1-mini语音模型 S1模型的蒸馏版本,0.5B参数,S1的效果不错,在官网可以体验。S1 mini可以自己部署免费使用,但是不可商用。 在线体验: 模型:
#Fish Audio #开源 #S1-mini语音模型 #蒸馏版本 #参数 #效果 #官网体验 #部署 #免费使用 #不可商用
avatar
Gorden Sun
3个月前
AI资讯日报,6月4日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
© 2025 news.news. All rights reserved. 0.06306 秒. v1.0.46
我的评论