时政

财经

科技

#多模态模型

2025-05-24 00:18:42

谷歌新发布的Gemini 2.5 Flash Exp Audio模型，是原生多模态模型，支持文本、图片、语音输入，支持文本、语音输出。输出的语音支持各种语气和声音，也能唱歌和RAP，虽然中文有时会有发音错误，但整体也非常不错了，ASMR的少女声音，让人感觉又恋爱了。下方视频第一段：少女ASMR 下方视频第二段：唱歌和RAP

#谷歌 #Gemini #多模态模型

2025-05-03 10:37:19

还是多模态的模型好，GPT-4o可以同时兼顾绘画和语义。

#多模态模型 #GPT-4o #绘画

李老师不是你老师

2025-04-06 11:49:26

4月5日 Meta发布了其新一代开源大语言模型Liama4，其拥有超过4000亿参数，Meta宣称该模型是同类中最好的多模态模型（可以处理图像输入输出），在参数量更少运行门槛更低的情况下，编程和推理能力上和DeepSeek V3相当。并且该模型完全免费开源，用户可以从Liama官网下载并部署在本地。

#Meta #开源 #大语言模型

2025-03-16 16:29:56

百度公司推出了两款全新的人工智能模型——ERNIE 4.5 和 ERNIE X1，对 AI 行业产生了重大影响。ERNIE 4.5 是新一代多模态模型，在多个基准测试中超越了 GPT-4.5，具备更强的理解、生成、推理和记忆能力，并且成本更低。该模型在处理多种数据类型方面表现出色，同时有效减少了 AI “幻觉”现象。ERNIE X1 的性能与 DeepSeek R1 相当，但成本仅为其一半，专

#百度 #人工智能 #多模态模型

karminski-牙医

2025-01-28 04:18:03

来了嗷！全网首测！DeepSeek 4 小时之前又发布了一个多模态模型——Janus-pro！这个模型的特点是将文生图和图生文合二为一了！我觉得这个模型更多是方向上的验证，如果验证靠谱就会推出可以投入生产的模型了。 [1/?]
#DeepSeek #Janus-Pro #多模态模型

网易新闻-新京报

2025-01-28 03:18:12

进军文生图 DeepSeek发布多模态模型Janus-Pro
进军文生图 DeepSeek发布多模态模型Janus-Pro,文生,文年生,janus,多模态模型,deepseek
#进军 #文生图 #DeepSeek

新浪新闻-新京报

2025-01-28 02:41:00

进军文生图 DeepSeek发布多模态模型Janus-Pro

新京报贝壳财经讯（记者罗亦丹）北京时间1月28日凌晨，近期爆红的国产大模型DeepSeek在GitHub平台发布了Jan..._新浪网

#文生图 #DeepSeek #多模态模型

没有更多了 🤐