宝玉
0 关注者
GPT-4.5 的多模态还是挺强的
中日政经评论
1周前
百度真是个烂到底的公司了。最早all in人工智能的公司,最后啥也没搞出来,反而成了头条的人才培养基地。
Gorden Sun
Stream-Omni:多模态聊天框架 实现的效果类似GPT-4o,支持文本、图片、语音输入,同时输出文本和语音,不是原生多模态模型,而是把视觉和语音跟文本对齐,成本更低,适合自研多模态交互时使用。 Github:
阑夕
豆包新上线了AI播客,瑞士军刀功能再+1,目前支持PDF和网页链接的上传,总体来说,通过大模型的智能识别,豆包现在可以把任何内容转化成一条高度口语化的双人对话播客,属于趣味性和实用价值都很高的一次尝试。 熟悉大模型播客产品的人都知道,豆包这次对标的是谷歌NotebookLM——或者说是它最出圈的Audio Overviews功能——后者通过识别用户上传的文本、网页、视频,就可以转化成一条口语化且
中国民主转型研究所(ICDT)
欢迎收听《中国民主季刊》2025年第二季播客节目 专论 莎拉·克雷普斯 道格·克里纳:人工智能如何威胁民主(徐行健翻译 朗读 麥莉)
Mr Panda
想找找大家1v1聊聊 AI , 尤其是没有技术背景的同学, 很想知道没有计算机背景的同学,是如何面对AI 的挑战的。 如果大家有兴趣私聊我,也许我也可以给到你一些启发