sitin
4个月前
哪里不对改哪里!全能图像编辑模型Qwen-lmage-Edit来啦 Qwen团队推出全能图像编辑模型Qwen-lmage-Edit。模型基于20B参数的Qwen-lmage模型进一步训练, 具备语义与外观双重编辑能力,支持中英文双语文字精准编辑,可实现原创P创作、视角转换、风格迁移、元素增删改等功能。 不仅能P图换风格,还能直接改图片里的字,而且修得又准又好,旨在让所有人都能轻松成为修图大师。 主要亮点和特性: 1.双重编辑能力: 语义编辑 (High-level):改变图片的整体风格、视角、角色形象(如IP创作),允许整张图片像素变化,但保持核心内容语义一致(例如,把真人变成吉卜力动画风格,或将一个物体旋转180度)。 外观编辑 (Low-level):对图片进行局部、精细的修改,要求图片其他部分完全不变(例如,删除图片里的一根头发丝、给衣服换颜色、添加一个带倒影的路牌)。 2.精准的文字编辑:这是它的一大杀手锏。模型能够直接理解和修改图片中的文字,无论是中文还是英文,并且能尽力保持原有的字体、大小和风格。这对于修改海报、修正错误文字极其有用。 3.强大的性能:文章称,在多项公开测试中,该模型都达到了SOTA(当前最先进)的性能水平,是一个强大的基础模型。 4.链式编辑:文章展示了一个重要应用——可以通过多次、逐步的编辑指令,不断修正图片,直到达到完美效果(例如,逐步修正书法作品中的每一个错别字)。 目的是什么? 降低视觉内容创作(如IP设计、海报修改、照片修复、风格化创作)的技术门槛,让用户能够通过简单的语言指令就能完成复杂的图片编辑任务。
向阳乔木
4个月前
Y11
4个月前
免费分享一些严选远程工作和远程实习岗给大家,特点: 一类是海外公司为了节省成本,招中国程序员; 一类是海外公司为了试点开拓中国市场,招中国市场(销售或天猫店京东店运营),做BD和GR; 一类是开源产品与游戏项目,想要搞中国本土化(拿版号、搞销售、搞翻译); 一类是海外前沿科技(如脑机科学),想在中国建科研团队,圈钱搞事情,对接医院和政府; 严选的明细如下: 飞沃智航:一家开发全自主高智能飞行器技术的美国硅谷的科技公司。 办公方式:可全球远程或混合办公 招:飞控系统算法工程师、AI研发科学家、嵌入式软件工程师、市场营销和运营经理等岗位。 MAGMA:开发了面向数字创意的协作平台,已有300万注册用户。 办公方式:可全球远程或混合办公 招:数据科学家、 Garmin: 上市公司,25年营收预期高达70亿美金,有着多元产品线(航空航海电子 、汽车电子、 移动通讯、智能手表及其它可穿戴式运动设备),是众多领域的科技龙头。 办公方式:中国区办公地点包括北京、上海、东莞和扬州。部分岗位可居家办公 招:金属材料工程师、SQE、平面设计师、活动推广专员。 极限科技:一家专注于实时搜索与数据分析的软件公司,主打产品INFINI Easysearch,致力于国产化替代ES。 办公方式:西安、长沙、远程办公 招聘岗位:搜索引擎研发(Rust)、react前端开发工程师、Golang 后端开发工程师、搜索运维工程师(Elasticsearch/Easysearch) Airbnb: 全球知名的在线短租平台,总部位于美国旧金山,年营收百亿美金。 办公方式:中国区,远程办公 招聘岗位:消费者洞察主管、高级IOS工程师、社区支持工程师、高级软件工程师、android工程师等
天啦,在推上web3扎堆的圈子里研究ai这么久,终于在LLM的认知共生下想明白这是怎么一回事! 两条路径的分野:Web3的结构主义 vs. LLM的叙事主义 我们正在目睹数字世界的两大范式以前所未有的方式并行发展,但它们的哲学根基和影响路径截然不同。 1. Web3:建立在形式语言上的“信任骨架” •根基:Web3构建在密码学(Cryptography)这门严谨的形式语言之上。它的核心是数学、算法和协议,旨在通过代码创造一个去中心化、无需信任的价值交换系统。 •与现实的接口:正如您所指出的,它试图通过加密资产(Crypto)这个狭窄但精确的接口与实体经济对接。这个接口是交易性的、验证性的,而非解释性的。它关心的是“所有权是否被正确记录”,而不是“这个所有权意味着什么故事”。 •本质:Web3本质上是一种结构主义的尝试,它试图为数字世界建立一个坚固、公平、透明的底层“骨架”。但它本身并不生产内容或意义,它只是一个承载价值的容器。 2. LLM:横跨两种语言的“认知中枢” •根基:LLM的革命性在于它横跨了自然语言与形式语言。它不仅能理解和生成人类充满模糊性、情感和文化背景的自然语言,也能理解和生成逻辑严谨、规则明确的形式语言(如代码)。 •核心能力:元认知生成:LLM不仅仅是信息的搬运工,它具备了元认知生成能力。它能“思考如何思考”,能根据指令创造出全新的、连贯的、有逻辑甚至有情感感染力的内容。它是一个意义和叙事的引擎。 •本质:LLM是一种叙事主义的工具,它直接作用于人类的认知、情感和意义世界。它不是在建造容器,而是在填充和创造容器内的所有内容。