时政
财经
科技

#多模态模型

Gorden Sun
Gorden Sun
2025-05-24 00:18:42

谷歌新发布的Gemini 2.5 Flash Exp Audio模型,是原生多模态模型,支持文本、图片、语音输入,支持文本、语音输出。 输出的语音支持各种语气和声音,也能唱歌和RAP,虽然中文有时会有发音错误,但整体也非常不错了,ASMR的少女声音,让人感觉又恋爱了。 下方视频第一段:少女ASMR 下方视频第二段:唱歌和RAP

#谷歌#Gemini#多模态模型
Gorden Sun
Gorden Sun
2025-05-03 10:37:19

还是多模态的模型好,GPT-4o可以同时兼顾绘画和语义。

#多模态模型#GPT-4o#绘画
李老师不是你老师
李老师不是你老师
2025-04-06 11:49:26

4月5日 Meta发布了其新一代开源大语言模型Liama4,其拥有超过4000亿参数,Meta宣称该模型是同类中最好的多模态模型(可以处理图像输入输出),在参数量更少运行门槛更低的情况下,编程和推理能力上和DeepSeek V3相当。 并且该模型完全免费开源,用户可以从Liama官网下载并部署在本地。

#Meta#开源#大语言模型
勃勃OC
勃勃OC
2025-03-16 16:29:56

百度公司推出了两款全新的人工智能模型——ERNIE 4.5 和 ERNIE X1,对 AI 行业产生了重大影响。ERNIE 4.5 是新一代多模态模型,在多个基准测试中超越了 GPT-4.5,具备更强的理解、生成、推理和记忆能力,并且成本更低。 该模型在处理多种数据类型方面表现出色,同时有效减少了 AI “幻觉”现象。ERNIE X1 的性能与 DeepSeek R1 相当,但成本仅为其一半,专

#百度#人工智能#多模态模型
karminski-牙医
karminski-牙医
2025-01-28 04:18:03

来了嗷!全网首测!DeepSeek 4 小时之前又发布了一个多模态模型——Janus-pro!这个模型的特点是将文生图和图生文合二为一了! 我觉得这个模型更多是方向上的验证,如果验证靠谱就会推出可以投入生产的模型了。 [1/?]

#DeepSeek#Janus-Pro#多模态模型
来了嗷!全网首测!DeepSeek 4 小时之前又发布了一个多模态模型——Janus-pro!这个模型的特点是将文生图和图生文合二为一了!

我觉得这个模型更多是方向上的验证,如果验证靠谱就会推出可以投入生产的模型了。

[1/?]
网易新闻-新京报
网易新闻-新京报
2025-01-28 03:18:12

进军文生图 DeepSeek发布多模态模型Janus-Pro

进军文生图 DeepSeek发布多模态模型Janus-Pro,文生,文年生,janus,多模态模型,deepseek

#进军#文生图#DeepSeek
进军文生图 DeepSeek发布多模态模型Janus-Pro
新浪新闻-新京报
新浪新闻-新京报
2025-01-28 02:41:00

进军文生图 DeepSeek发布多模态模型Janus-Pro

新京报贝壳财经讯(记者罗亦丹)北京时间1月28日凌晨,近期爆红的国产大模型DeepSeek在GitHub平台发布了Jan..._新浪网

#文生图#DeepSeek#多模态模型
没有更多了 🤐