Gorden Sun

统计数据

516
文章
0
粉丝
0
获赞
3103
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
Gorden Sun
3周前
AI资讯日报,12月10日:
avatar
Gorden Sun
3周前
Mistral开源Devstral 2代码模型 分Devstral 2 (123B)和Devstral Small 2 (24B)两个版本,均开源,123B版本评分超过Kimi K2,接近DeepSeek V3.2,参数只有DeepSeek的六分之一。123B版本目前提供免费API。 同时发布了Mistral Vibe CLI,命令行的编码工具,类似Claude Code。 官方介绍: 123B模型: 24B模型:
avatar
Gorden Sun
3周前
Mind Lab发布:1000B模型的高效强化学习框架 使用LoRA,对1000B MoE模型进行强化学习,相比传统方法,仅使用10%的GPU资源。提升了模型的特定能力,且保留了原始的通用能力。相关代码已被合并到魔搭和英伟达的Github分支。 官方介绍:
avatar
Gorden Sun
3周前
AI资讯日报,12月9日:
avatar
Gorden Sun
3周前
谷歌不再在AI Studio里提供免费的Gemini 2.5 Pro API,大幅缩减了Gemini 2.5 Flash的API免费次数。缩减了AI Studio开发者渠道的Banana API并发数。 都是为了给Vertex腾出TPU,因为Banana Pro太火了。
avatar
Gorden Sun
3周前
智谱开源AutoGLM 能自动化操作安卓手机的智能体框架,类似豆包手机助手的效果,能理解用户任务、规划动作、读取屏幕并操作。 同时开源了底层模型AutoGLM-Phone-9B(基于GLM-4.1V-9B微调)。 Github:
avatar
Gorden Sun
3周前
AI资讯日报,12月8日:
avatar
Gorden Sun
3周前
2毛钱,2分钟,一键生成大厂卷王PPT (此类PPT通常由花哨的框架+细致的功能模块堆叠而成,视觉效果高大上,但多少已实现、多少归功于演讲者则不得而知) 在线使用: 体验Key:sk-8XjfwIIWqM87zb3EqPFb9ccBURjYNLX8B9iOjopHc5uaRDbr 代码、提示词、参考图是开源的,Github:
avatar
Gorden Sun
3周前
AI资讯日报,12月7日:
avatar
Gorden Sun
3周前
LiveAvatar:阿里夸克开源的实时虚拟人模型 能实时生成虚拟人视频(需要5个H800),能生成无限长度的视频且画质不降低。 模型: 项目地址:
avatar
Gorden Sun
4周前
AI资讯日报,12月4日:
avatar
Gorden Sun
4周前
VibeVoice-Realtime-0.5B:实时文本生成语音 微软开源,仅0.5B大小(基于LLM: Qwen2.5-0.5B),实时把文本转换成音频,仅300毫秒延迟。英语效果不错。 模型: 在线体验(不支持实时):
avatar
Gorden Sun
4周前
AI资讯日报,12月3日:
avatar
Gorden Sun
4周前
Seedream 4.5版本发布 人像一致性大幅提升,有一定的推理能力(但是比较弱,明显比不上Banana Pro),简单提示词就能生成美学在线的图片。 我是在Fal上通过API使用的,豆包上现在应该已经能用到了。速度很快,20秒出一张2K分辨率的图片。
avatar
Gorden Sun
1个月前
AI资讯日报,12月2日:
avatar
Gorden Sun
1个月前
AI资讯日报,12月1日:
avatar
Gorden Sun
1个月前
ViBT:更快速的视频风格转换 核心功能:编辑图片、图片风格转换、视频风格转换、视频补帧。与传统扩散模型不同,ViBT直接建模输入和输出之间的轨迹,实现高效的数据到数据转换,速度比传统方法快2倍。 项目地址: Github:
avatar
Gorden Sun
1个月前
DeepSeek线上模型已更新
#DeepSeek #在线模型 #模型更新
avatar
Gorden Sun
1个月前
AI资讯日报,11月30日:
澎湃AI新闻合辑:未来科技与社会热点交锋· 112 条信息
#AI #资讯 #11月30日
avatar
Gorden Sun
1个月前
GELab-Zero:完全开源的GUI Agent解决方案 集成了模型和基础设施,支持本地部署,提供完整的隐私控制。简化了手机GUI Agent的工程复杂度。能实现查找任务、操作APP等手机端任务。 Github:
谷歌Deep Research:AI操作系统雏形?· 145 条信息
#GUI Agent #开源 #本地部署 #隐私控制 #手机端任务
avatar
Gorden Sun
1个月前
Gemini 3 Pro不太好用。 你要是从头让他发挥,Gemini 3给的效果很惊艳;但你要是拿着东西让他改,他总是会改掉额外的内容,而且完全不告诉你,指令遵循有问题。
Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini 3 Pro #效果不佳 #指令遵循问题 #修改额外内容 #用户体验负面
avatar
Gorden Sun
1个月前
AI资讯日报,11月29日:
AI技术引发伦理争议,专家呼吁加强监管· 167 条信息
#AI #资讯日报 #11月29日
avatar
Gorden Sun
1个月前
Step-Audio-R1:能推理的音频模型 延长推理时间可以提升推理效果,音频理解能力超过Gemini 2.5 Pro,接近Gemini 3。 模型:
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#Step-Audio-R1 #音频模型 #推理能力提升 #Gemini 2.5 Pro #音频理解
avatar
Gorden Sun
1个月前
AI资讯日报,11月28日:
AI技术引发伦理争议,专家呼吁加强监管· 167 条信息
#AI #资讯 #11月28日
avatar
Gorden Sun
1个月前
AI资讯日报,11月27日:
AI技术引发伦理争议,专家呼吁加强监管· 167 条信息
#AI #资讯 #11月27日
...
© 2025 news.news. All rights reserved. 0.04145 秒. v1.0.46
我的评论