Gorden Sun

统计数据

818

文章

0

粉丝

0

获赞

51556

阅读

4个月前

AI资讯日报，11月27日：

AI技术引发伦理争议，专家呼吁加强监管· 167 条信息

#AI #资讯 #11月27日

4个月前

谷歌也挺草台的，自家NotebookLM都因为Nano Banana Pro不够用而暂停了1天生成PPT的功能，结果现在谷歌企业版随便注册，无需绑卡，只需要一个邮箱就能注册，注册就有30天免费试用。然后Nano Banana Pro和Gemini 3免费用！😂😂😂 服务器被薅到频繁报500了注册地址：

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#谷歌 #NotebookLM #Nano Banana Pro #服务器薅羊毛 #500错误

4个月前

通义开源的Z-Image-Turbo图片模型太强了仅6B大小，1秒出图，但是质量却非常非常高，人物真实、美学在线，天然认识各种名人，没有审核，绝对是本地AI绘画的首选模型。模型：在线使用：

智谱直播发布全球最佳视觉模型GLM-4.5V，挑战AI视觉领域极限· 21 条信息

#通义 #Z-Image-Turbo #图片模型 #开源 #AI绘画

4个月前

AI资讯日报，11月26日：

澎湃AI新闻合辑：未来科技与社会热点交锋· 112 条信息

#AI #资讯 #11月26日

4个月前

有没有老司机帮忙看看Nano Banana Pro画的准不准，我只认识波多野结衣

#Nano Banana Pro #波多野结衣 #老司机 #不准 #求助

4个月前

Nano Banana Pro的能力边界还没被充分挖掘用过Nano Banana Pro的人还非常少知道Nano Banana Pro就是Gemini 3 Pro image的更加少 Nano Banana Pro还有巨大的市场谷歌还得涨

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Nano Banana Pro #Gemini 3 Pro Image #市场潜力 #用户稀少 #谷歌

4个月前

AI资讯日报，11月25日：

澎湃AI新闻合辑：未来科技与社会热点交锋· 112 条信息

#AI #资讯 #11月25日

4个月前

EverMemOS：企业级智能记忆系统 LLM训练大致分为三个阶段，Pre-Training学知识，SFT学说话，Post-Training学思考。这样的LLM用作问答没有问题，但是用作AI助理或者家庭机器人就有一个非常致命的缺点：LLM没有记忆，每次对话默认从零开始。除非附带历史信息，LLM不会记得你的任何信息，无法提供个性化、连贯的服务。 LLM记忆的设计模式主要分为两类：第一类是模拟人类的记忆方式（来自论文CoALA），第二类是从计算机工程的角度设计（Letta提出）。拟人化记忆的四种记忆类型： · 临时记忆：当前对话的内容，对应到LLM就是context，LLM的context的长度通常是256K tokens，Gemini则能达到1M tokens。 · 事实类记忆：这类记忆通常对所有人都是一样的。对于人类来说，就是人学到的知识和事实，例如水在0度结冰、小明不喜欢吃香菜；对于LLM，就是关于用户的信息，例如用户是男性、名字叫Gorden。 · 经历类记忆：这类记忆则因人而异。对于人类来说，就是发生过的事，例如上个周末去了公园、吃了火锅；对于LLM来说，过去的聊天记录提炼出来的总结都可以算作这类记忆，例如用户提问了如何减肥。 · 技能类记忆：对人类来说，就是如何开车这种学会后不必再思考、形成了本能的技能；对于LLM来说，就是system prompt，例如让LLM回复时必须使用Json格式。（例如）计算机工程出发的记忆类型： · 消息缓冲区：即当前对话内容，对应拟人化记忆的临时记忆。 · 核心记忆：由智能体维护的事实类记忆，但是对于当前对话，只取有关联的事实用作上下文。 · 历史对话记录：包括所有完整的历史对话记录，在必要是搜索使用。 · 压缩类记忆：存储在外部的、经过提炼且加了索引的知识和记忆，通常用向量数据库存储，在查询后把信息放到上下文中。比历史对话记录更高效。 EverMemOS主要使用的是拟人化记忆模式，结合了工程类记忆的效率实践，设计了多层次、多类型的记忆结构。存储记忆的大致流程是： 1）识别对话中的关键信息，提炼成记忆单元； 2）按对话主题、对话用户，与之前的记忆整合，梳理出脉络和用户画像； 3）建立记忆的关键词和索引，用于快速召回；如何调用记忆调用记忆的核心挑战是如何避免因为记忆过多、查询过慢导致响应时间变长。对于需要快速响应的对话，EverMemOS直接使用RRF融合算法（Reciprocal Rank Fusion）；对于复杂的场景，Agent会生成2-3个互补查询，补全缺失的信息，提升复杂问题的覆盖面，然后并行查询出需要使用的记忆。召回多层次的记忆后，再与当前对话内容拼接，整合成完整的上下文，给出最终的回复。一个典型的例子是你让AI给你推荐饮食，AI可以联想到你前几天做了牙科手术，从而有针对性的调整建议。通过 "结构化记忆 → 多策略召回 → 智能检索 → 上下文推理" 的记忆和召回路径，EverMemOS在LoCoMo评测里达到了 92.4% 的推理准确率**，**为目前最佳。长时间的记忆里、高准确率的召回率，是AI助理和AI机器人的必需能力，2025年是Agent的元年，2026会成为记忆的元年。 Github：

#EverMemOS #智能记忆系统 #LLM记忆 #AI助理 #LoCoMo评测

4个月前

AI资讯日报，11月24日：

AI技术引发伦理争议，专家呼吁加强监管· 167 条信息

#AI #资讯 #11月24日

4个月前

DR Tulu：专为Deep Research长任务训练的模型仅8B大小，专门针对深度研究的长任务进行了强化训练，评分非常高（需要实际验证才能确认，8B还是参数太小了） Github：

#DR Tulu #深度研究 #长任务训练 #8B模型 #高评分待验证

4个月前

RynnVLA-002：整合的视觉-语言-行动和世界模型阿里达摩院开源的模型，整合了VLA的世界模型。世界模型用于生成场景图片，VLA模型用于生成动作，同时也支撑世界模型生成图片。除了用于可交互的世界场景外，更适用于机器人任务。在评测数据集的表现上，接近闭源模型。模型：

#VLA模型 #世界模型 #阿里达摩院 #机器人任务 #开源模型

4个月前

这个羊毛得薅，谷歌官方Vertex AI免费使用Nano Banana Pro，支持生成4K图片，没有水印。使用地址（不要登录谷歌账号，开无痕窗口使用即可）：

nanobanana平台助力个人形象照生成，专业形象照引发热议· 107 条信息

#薅羊毛 #谷歌Vertex AI #Nano Banana Pro #免费使用 #生成4K图片

4个月前

为我生成图中角色的绘制 Q 版的，LINE 风格的半身像表情包，注意头饰要正确彩色手绘风格，使用 4x6 布局，涵盖各种各样的常用聊天语句，或是一些有关的娱乐 meme 其他需求：不要原图复制。所有标注为手写简体中文。生成的图片需为 4K 分辨率 16:9

#Q版表情包 #LINE风格 #手绘 #4K分辨率 #简体中文

4个月前

AI资讯日报，11月23日：

AI技术引发伦理争议，专家呼吁加强监管· 167 条信息

#AI #资讯 #11月23日

4个月前

Google Flow上也能用Nano Banana Pro了，之前只有Ultra用户能用，现在Pro用户也能用，不花费积分，每天有上限，大概是200张。缺点是只能生成16:9和9:16的图片。

nanobanana平台助力个人形象照生成，专业形象照引发热议· 107 条信息

#Google Flow #Nano Banana Pro #图片生成 #16:9 #9:16

4个月前

AI资讯日报，11月22日：

AI技术引发伦理争议，专家呼吁加强监管· 167 条信息

#AI #资讯 #11月22日

4个月前

Nano Banana Pro可以在Antigravity里使用了优点是能免费且能生成没有水印的图片，缺点是安全审核更严格，很多图片不允许生成，本质是为了生成参考UI图。只能生成1K分辨率的图片，Gemini APP默认生成的是2K分辨率。

nanobanana平台助力个人形象照生成，专业形象照引发热议· 107 条信息

#Nano Banana Pro #Antigravity #UI图生成 #1K分辨率 #安全审核严格

4个月前

WorldGen：文字生成3D场景不能算世界模型，只是文字生成3D场景，世界模型Genie是根据交互实时生成场景，WorldGen本质还是生成3D模型。官方介绍：

#WorldGen #3D场景生成 #文字生成 #非世界模型 #Genie

4个月前

AI资讯日报，11月20日：

AI技术引发伦理争议，专家呼吁加强监管· 167 条信息

#AI #资讯 #11月20日

4个月前

AI资讯日报，11月19日：

AI技术引发伦理争议，专家呼吁加强监管· 167 条信息

#AI #资讯 #11月19日

4个月前

Gemini 3就是世界模型，等今晚（最晚明晚）nano banana 2和Gemini Flash 3发布，还得接着震惊😨

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 3 #世界模型 #Nano Banana 2 #Gemini Flash 3 #技术发布

4个月前

最搞笑的是，cloudflare挂了，一众AI浏览器打都打不开了，还是得Chrome

#CloudFlare故障 #AI浏览器 #CHROME #网络故障 #技术

4个月前

Gemini 3的Model Card已经泄露了，基本全部评分都是第一，而且大幅领先。 PDF文件：

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 3 #Model Card #性能领先 #AI模型 #积极

4个月前

AI资讯日报，11月18日：

AI技术引发伦理争议，专家呼吁加强监管· 167 条信息

#AI #资讯 #11月18日

4个月前

Gemini 3，遥遥领先

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini #Gemini 3 #领先

... ...