#淘宝

2周前
#BestBlogs 探秘 TaoAvatar:淘宝 3D 真人数字人技术解析 | 大淘宝技术 淘宝 TaoAvatar 技术实现 3D 真人数字人工业级量产与端侧智能交互。 摘要: 文章详细介绍了淘宝的 TaoAvatar 3D 真人数字人技术体系。该技术融合了多目视觉绑定、动态高斯重建、语音驱动及端侧 AI 推理引擎(MNN-LLM),突破了传统数字人制作成本高、周期长、实时交互难的瓶颈。通过自研算法和硬件方案,TaoAvatar 实现了 2K 级拟真视觉、90FPS 流畅动效和自然的语音表情联动,并将制作成本降至传统 CG 的 1/30,周期缩短至一周。文章还阐述了各核心技术模块的技术细节与创新点,并展示了其在 AWE 虚拟家居体验舱和淘宝 Vision 未来旗舰店等商业场景的应用落地,强调了技术在电商和 XR 领域的实用价值及普惠性趋势。 主要内容: 1. 实现高拟真度 3D 真人数字人复刻,突破视觉极限。 -- 通过多目拍摄、动态高斯重建等技术,达到 2K 分辨率、高精度建模和逼真光影效果,提供近乎真人的视觉体验。 2. 大幅降低数字人制作成本与周期,实现工业级量产。 -- 自研低成本拍摄系统和 AI 算法,将制作周期从数月缩短至一周,成本降至传统 CG 的 1-2 万元,实现规模化生产。 3. 构建端侧多模态智能交互,提供自然流畅的真人对话。 -- 结合端侧大模型和高效推理引擎,实现低延迟、音画同步的语音问答及自然的表情动作联动。 文章链接:
1个月前
#BestBlogs 淘宝 Java 工程师的 LLM 开发实践 | 大淘宝技术 从 Java 工程师视角出发,详细介绍如何使用 Spring AI 框架进行 LLM 应用开发,包括对话、Function Calling 和 RAG 实践。 摘要: 本文为 Java 工程师提供了 LLM 应用开发的实战指南。首先分析了当前 LLM 的局限性,强调了应用开发的重要性。接着介绍了面向 Java 的 LLM 开发框架 Spring AI,并与主流的 Python LangChain 进行对比。文章核心内容详细阐述了三大应用场景的实现:一是对话聊天,讲解了角色、Prompt 和 Memory 概念与实现;二是联网搜索等通过 Function Calling 调用第三方 API;三是利用 RAG 技术构建个人知识库,深入解析了 RAG 原理、Embedding 和向量数据库,并提供了完整的数据构建与检索生成流程。文章结合具体代码示例,为 Java 开发者高效应用 LLM 提供了可操作的路径。 主要内容: 1. LLM 应用开发对 Java 工程师提升效率至关重要 -- 相较于模型训练理论,掌握 LLM 应用开发更能帮助 Java 工程师在实际工作中利用 AI 技术提升效率和生活品质。 2. Spring AI 为 Java 开发者提供了高效的 LLM 开发框架 -- Spring AI 借鉴 LangChain 思路,使 Java 工程师无需学习新的语言,即可快速融入现有体系进行 LLM 应用开发。 3. Function Calling enables LLMs to interact with external APIs -- 利用 Function Calling 能力,LLM 可根据用户指令自动调用外部服务(如联网搜索),获取实时或特定数据,弥补自身知识盲区。 4. RAG 技术是构建个人知识库、解决 LLM 局限的关键 -- RAG 通过检索外部数据增强 LLM 生成能力,有效解决模型知识滞后、覆盖有限和产生幻觉等问题,提高生成内容的准确性和相关性。 5. Embedding 和向量数据库是 RAG 技术的基础设施 -- Embedding 将非结构化数据转化为向量,向量数据库高效存储和检索这些向量,是实现 RAG 检索增强功能的关键支撑技术。 文章链接: