时政
财经
科技
虚拟货币
其他
登录
Gorden Sun
关注
统计数据
266
文章
0
粉丝
0
获赞
642
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
Gorden Sun
2个月前
MiniMax-M1:MiniMax开源的推理模型 分80K和40K两个版本,这里的80K和40K是指推理消耗的最大token数。456B总参数,激活参数45.9B。评分超过旧版DeepSeek R1和Qwen3-235B-A22B。 在线使用: 模型: Github:
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 10 条信息
#MiniMax
#开源模型
#推理模型
#DeepSeek R1
#Qwen3-235B-A22B
#人工智能
分享
评论 0
0
Gorden Sun
2个月前
AI资讯日报,6月16日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
#AI
#资讯
#日报
分享
评论 0
0
Gorden Sun
2个月前
Ultra-FineWeb:中英双语开源数据集 OpenBMB开源的数据集,包括1T英文token和120B中文token,是训练MiniCPM4的数据集。 数据地址:
#开源数据集
#中英文
#OpenBMB
#MiniCPM4
分享
评论 0
0
Gorden Sun
2个月前
Flow里的Veo 3提示词里不能写中文了,生成准确的中文语音更难了,看来中文只能等即梦了。
#Veo3
#中文语音
#即梦
#Flow
#提示词
分享
评论 0
0
Gorden Sun
2个月前
AI资讯日报,6月15日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
分享
评论 0
0
Gorden Sun
2个月前
Ming-Omni:首个开源版多模态GPT-4o 蚂蚁集团和inclusionAI开源,支持输入文本、语音、图片、视频,输出文本、语音、图片(跟GPT-4o一样),应该是对标GPT-4o的第一个开源模型。 项目地址: Github:
#Ming-Omni
#开源
#多模态模型
#GPT-4o
#蚂蚁集团
#inclusionAI
分享
评论 0
0
Gorden Sun
2个月前
MagicTryOn:视频版AI换衣 基于Wan 2.1视频模型,使用VideoX-Fun实现了换衣流程。 Github: 项目地址:
#MagicTryOn
#视频版AI换衣
#Wan2.1视频模型
#VideoX-Fun
#换衣流程
#AI技术
#Github项目
#视频处理
分享
评论 0
0
Gorden Sun
3个月前
AI资讯日报,6月14日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
#AI
#资讯
#日报
#6月14日
分享
评论 0
0
Gorden Sun
3个月前
Claude Opus为第一作者发表论文 arxiv上有一篇新论文,Claude Opus是第一作者,论文的内容是驳斥之前苹果发表的论文“大型推理模型不是真正的智能模型”,论据是苹果的实验设计有局限性。 论文:
#Claude Opus
#论文驳斥
#苹果
分享
评论 0
0
Gorden Sun
3个月前
AI资讯日报,6月13日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
分享
评论 0
0
Gorden Sun
3个月前
AI资讯日报,6月12日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
分享
评论 0
0
Gorden Sun
3个月前
MidJourney开始视频评分 可以在MidJourney网站上评分他们的AI视频模型生成视频,总体感受是美学依旧在线,但是视频水平也就是可灵1.5的水平,经常出现各种错误和幅度过小的情况。 我对MidJourney的视频模型很担忧,因为v7至今还会把手画错。 地址:
#midjourney
#AI视频
#视频评分
#模型错误
分享
评论 0
0
Gorden Sun
3个月前
字节开源LatentSync 1.6 嘴型同步模型,能处理切换镜头的情形,效果还可以。 模型: Github:
#字节开源
#LatentSync
#嘴型同步
#AI模型
#GitHub
分享
评论 0
0
Gorden Sun
3个月前
V-JEPA 2:Meta开源的世界模型 杨立昆带队的视觉模型,不仅能理解视频,而且能预测视频。在视觉评测的所有项目上都获得了最高分,在指挥机器人行动方面遥遥领先。 官方介绍: Github: 模型:
#Meta
#世界模型
#V-JEPA 2
#视觉模型
#视频预测
分享
评论 0
0
Gorden Sun
3个月前
AI资讯日报,6月11日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
分享
评论 0
0
Gorden Sun
3个月前
MonkeyOCR:兼具质量与效率的OCR模型 3B参数,采用结构-识别-关联的处理流程,兼具准确率和效率。 准确率比传统OCR明显提升,公式识别比MinerU提升了15%准确率;识别速度明显超过VLLM模型,每秒识别0.84页,大幅优于Qwen2.5 VL-7B的每秒0.12页。 Github: 模型:
#MonkeyOCR
#OCR技术
#识别准确率
#公式识别
#识别速度
分享
评论 0
0
Gorden Sun
3个月前
AI资讯日报,6月10日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
分享
评论 0
0
Gorden Sun
3个月前
Mirage:虚拟人模型 通过音频驱动,生成生动的人物视频,嘴型同步,有丰富的表情和人物动作,跟HeyGen类似。本身是付费产品,但是官方发布了一个非常详细的技术报告,如果从事这方面的研究,值得一读。 官方介绍: 详细技术报告:
#虚拟人
#音频驱动
#人物视频
#HeyGen
#技术报告
分享
评论 0
0
Gorden Sun
3个月前
PartCrafter:生成结构化3D模型 输入图片,生成3D模型,基于DiT,特点是生成的3D模型可以拆成小部件。 项目地址:
#3D模型
#图像生成
#人工智能
#DiT技术
#结构化3D
#部件分解
分享
评论 0
0
Gorden Sun
3个月前
AI资讯日报,6月9日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
分享
评论 0
0
Gorden Sun
3个月前
AI资讯日报,6月8日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
分享
评论 0
0
Gorden Sun
3个月前
AI资讯日报,6月6日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
#AI
#资讯
#日报
#6月6日
分享
评论 0
0
Gorden Sun
3个月前
AI资讯日报,6月5日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
#AI资讯
#每日新闻
分享
评论 0
0
Gorden Sun
3个月前
Fish Audio开源S1-mini语音模型 S1模型的蒸馏版本,0.5B参数,S1的效果不错,在官网可以体验。S1 mini可以自己部署免费使用,但是不可商用。 在线体验: 模型:
#Fish Audio
#开源
#S1-mini语音模型
#蒸馏版本
#参数
#效果
#官网体验
#部署
#免费使用
#不可商用
分享
评论 0
0
Gorden Sun
3个月前
AI资讯日报,6月4日:
#AI乱象不止:内容注水,隐私堪忧· 173 条信息
分享
评论 0
0
上一页
1
2
3
4
5
6
7
8
9
10
11
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞