向阳乔木2025-04-15 22:33:46今天跟几个朋友天津聚会撸串。 酒过三巡,聊出一个特别棒的产品方向。 用AI帮助创作者生成多模态内容,适配平台调性,RPA自动发布。 喝酒的技术大拿朋友刚好还写过十多个平台的同步发布,估计很快就能搞个demo出来。 我估计最快下周就能出个内测版。 #天津聚会#AI生成内容#多模态
WY2025-04-15 09:26:20OpenAI气数已尽,Altman不干实事 看今天发的GPT-4.1,我感觉OpenAI大概率气数已尽了。高端打不过Gemini和Claude,nano估计也打不过Gemini Flash(看得分就不如4o-mini),只敢跟两年前的4o比,但还不能替换4o,因为不是多模态的。 明显看出来OpenAI是手里没什么牌了,捉襟见肘,就算明后天再发个o4出来可能也无济于事,因为大概率会超贵导致其实没#OpenAI#GPT-4.1#Gemini
央广网-央视新闻客户端2025-03-21 18:36:00多模态跨尺度生物医学成像设施通过国家验收成像技术是生物医学最重要的研究工具之一,也是推动生命科学基础研究和临床医学研究发展的核心动力。我国首个生物医学成像领域综合型大科学装置――多模态跨尺度生物医学成像设施,今天(21日)在北京怀柔科学城通过国家验收。#多模态#跨尺度#生物医学成像
karminski-牙医2025-03-13 05:05:47刚刚 Google 的开源模型 Gemma 3 发布了! 几个关键点: - 这次放出了pt(预训练,Pre-Training)和 it (指令微调,Instruction Tuning)版本,默认用it即可。pt更多是给大家用来微调用的基座模型 - Gemma-3 是多模态的,可以处理图片输入 - 大小分别是1B,4B,12B,27B - 支持 128K 上下文 - MMLU-Pro 评分,Ge#Google#开源模型#多模态
AIGCLINK2025-03-07 10:44:31牛,Mistral刚刚发布了号称地表最强OCR,给文档理解设立了新标准! Mistral OCR具备强大认知能力,能准确理解文档中包括文本、图像、表格、公式等在内的每个元素 特点: 1、原生多语言和多模态,支持数千种文字、字体以及语言 2、能准确理解复杂的文档元素,包括图像、数学公式、表格以及 LaTeX 格式等,尤其擅长处理包含图表、图形、公式和插图的科学论文等富文档 3、在多个文档分析#Mistral#OCR#科技创新
宝玉2025-03-04 12:40:45模型即产品(The Model is the Product) 作者:Alexander Doria 过去几年,人们一直在讨论下一个AI发展周期可能是什么:智能体(Agents)?推理系统(Reasoners)?还是彻底的多模态? 现在是时候下结论了:下一个周期,就是“模型本身即产品”。 目前,无论是科研界还是产业界的变化,都在推动这种转型: • 通用模型扩展遇到了瓶颈。OpenAI发布GP#模型即产品#AI发展周期#智能体
外汇交易员2025-02-12 12:41:22据CNBC报道,受DeepSeek等竞争对手的冲击,百度计划在今年下半年发布下一代AI模型文心一言5.0。消息人士透露,文心一言5.0“在多模态能力方面有重大增强”。 #百度#AI#文心一言5.0
-Zho-2025-01-28 00:57:40卧槽!!!DeepSeek 又直接发大招了!整上多模态大一统开源模型 Janus-Pro 系列了!!!卧槽了!!! 上一个开源多模态统一模型还是Emu3(10月21号左右),我发的测试原帖在: 模型(7B): 模型(1B): 等我过年期间写好JanusPro的插件和当时Emu3的插件一起发!#JanusPro#开源模型#多模态
宝玉2025-01-24 15:23:20字节的 AI 自动化测试框架,自然语言就可以测试 Web UI,比如像这样的测试代码: await ai('在搜索框中输入 "Headphones",然后回车'); 当然需要多模态的模型,支持的模型包括: - gpt-4o - claude-3-opus-20240229 - gemini-1.5-pro - qwen-vl-max-latest - doubao-vision-pro-32k #字节#人工智能#自动化测试
卡尔的AI沃茨2024-12-27 14:18:37上手实测gemini-2.0一周感想,一个key能顶五六个AI应用。 不同于贵到肉疼的 o1 API, 也区别于“升级版封号斗罗pro-max-plus-ultra”的 Claude(额度是上午充的,号是中午没的。。。) Gemini 它免费啊! 原生多模态能做很多事了,翻译、编程、日常对话、联网搜索、中文视频聊天、视频剪辑、屏幕共享,把我其他AI应用的活也抢了。 这次来总结一下这几个玩法:#Gemini#AI应用#多模态