时政
财经
科技
虚拟货币
其他
登录
Gorden Sun
关注
统计数据
559
文章
0
粉丝
0
获赞
7779
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
Gorden Sun
9小时前
AI资讯日报,1月17日:
分享
评论 0
0
Gorden Sun
10小时前
谷歌开源MedGemma 1.5 1.0版本的升级版,专门用于医疗领域的多模态LLM,特点是能解读医疗影像,目前只开源了4B版本。 模型:
分享
评论 0
0
Gorden Sun
1天前
AI资讯日报,1月16日:
分享
评论 0
0
Gorden Sun
1天前
Black Forest Labs开源FLUX.2 [klein] 分4B和9B两个大小,特点是出图速度极快,效果也非常好,支持编辑图片。4B可商用,9B不可商用。 在线使用(安全校验极其严格): 官方介绍: 模型: 图片时我生成的效果,图1是原图,图2是修改为3D卡通风格。
分享
评论 0
0
Gorden Sun
1天前
谷歌开源TranslateGemma:高效的翻译模型 基于Gemma3训练,训练数据来自人类数据和Gemini合成的数据,分4B、12B、27B三个尺寸。 最大的特点是高效,12B模型可以达到原来27B的翻译准确率,而且保留了Gemma3的视觉能力,能翻译图片。 官方介绍: 模型:
分享
评论 0
0
Gorden Sun
1天前
Step-Audio-R1.1:实时语音对话模型 阶跃开源,能一边对话一边思考的模型,延迟比较低,评分显著高于其他实时语音模型。采用双脑架构,一个大脑专门推理,一个大脑专门生成语音。 模型:
分享
评论 0
0
Gorden Sun
2天前
AI资讯日报,1月15日:
分享
评论 0
0
Gorden Sun
2天前
json-render:AI生成可控UI样式 Vercel开源的框架,预先定义好UI样式组件,AI只能使用这些定义好的UI组件,从而控制生成效果,且可以流式渲染。组件可以是不同曾经的内容,基础的例如按钮、输入框,复杂的例如卡片、播放器样式。 Github:
分享
评论 0
0
Gorden Sun
2天前
千问接入的生态:淘宝、支付宝、闪购、飞猪,能给你点外卖。 谷歌Personal Intelligence接入的生态:Gmail、谷歌相册、YouTube,你要买轮胎他能根据你相册里车的照片给你提供合适的型号,你要读书他能根据你的YouTube记录推荐你感兴趣的书,给谷歌开的隐私权限越大,AI越懂你。 生态差距太大了。
分享
评论 0
0
Gorden Sun
2天前
阶跃开源视觉多模态模型Step3-VL-10B 评分很高,除了Qwen之外,又多了一个开源视觉模型的选择。 模型:
分享
评论 0
0
Gorden Sun
3天前
AI资讯日报,1月14日:、
分享
评论 0
0
Gorden Sun
3天前
Yolo26:最新的实时物体检测和分割 Ultralytics发布了Yolo26,以后也跟苹果一样,按年份来给版本命名了。在实时检测、实时分割方面是最佳的模型。 Github:
分享
评论 0
0
Gorden Sun
3天前
GLM-Image还可以,部分能力达到了Nano Banana一代的水平,整体是稍弱于即梦4.0和Banana一代,但重点是,这是完全开源的模型。 图片转手办效果可以,能写几句话的中文不出错,语义理解也不错。 模型:
分享
评论 0
0
Gorden Sun
4天前
AI资讯日报,1月13日:
分享
评论 0
0
Gorden Sun
4天前
Baichuan-M3:百川开源的医疗模型 基于Qwen3-235B-A22B微调,幻觉率低。 模型:
分享
评论 0
0
Gorden Sun
4天前
Vercel开源agent-browser 专门给CLI Agent(基于命令行的Agent,例如Claude Code、Codex)使用的浏览器自动化Agent,使用无头浏览器,能实现浏览器内查找、操作、管理状态等操作,可以实现自动化网页操作,但是实际使用需要考虑账号风控的问题。 Github:
分享
评论 0
0
Gorden Sun
4天前
我对DeepSeek V4的期待是代码和Agent能力超过Sonnet 4.5,接近Opus 4.5,然后国内进入百Agent大战时代,生产力又又又提升。 提前攒好一个Agent,等DeepSeek V4上线后,把API从Claude切到DeepSeek,彻底成功!
分享
评论 0
0
Gorden Sun
5天前
AI资讯日报,1月12日:
分享
评论 0
0
Gorden Sun
6天前
AI资讯日报,1月11日:
分享
评论 0
0
Gorden Sun
1周前
AI资讯日报,1月10日:
分享
评论 0
0
Gorden Sun
1周前
Dify循环里最后一个节点的输出,为什么循环外的节点无法使用?我感觉这是非常基础的功能,应该能使用才对。 图1是循环里最后一个节点的输出,图2是循环外节点可以使用的变量列表,没有这个循环节点
分享
评论 0
0
Gorden Sun
1周前
AI资讯日报,1月9日:
分享
评论 0
0
Gorden Sun
1周前
Gmail新出的AI Inbox,算是个主动式的AI,能自动分析你邮箱里的邮件,给出建议。 这个是比较大的功能,AI/Agent正在从被动接受人类任务变成主动给人类执行任务,类似的还有ChatGPT的每日助手、谷歌的Jules闲时自动任务。 可能不用太长时间,如果Agent有了足够多的关于你的上下文,能主动和被动帮你搞定大部分事,就看谁的数字分身更多更高级了。
分享
评论 0
0
Gorden Sun
1周前
UniVideo:统一视频模型 可灵开源,能理解、生成、编辑视频,像是视频版Nano Banana,但不是原生模型,是使用Qwen VL多模态LLM+混元视频模型+MetaQueries(连接多模态LLM和扩散模型)组合而成。 模型:
分享
评论 0
0
Gorden Sun
1周前
吉利银河 M9亮相CES2026,搭载阶跃星辰原生语音模型Step-Audio 2,端到端架构,直接语音输入、语音输出,没有ASR+LLM+TTS的过程。 优势: · 低延迟,0.7秒内即可响应 · 长上下文,支持多轮对话 · 原生模型,能识别原始语音的情感和语气 应该是国产新能源最早搭载原生音频大模型的车。
分享
评论 0
0
1
2
3
4
5
6
7
8
9
10
11
...
23
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞