#多模态交互

Y11
1周前
高端招聘:云端推理服务技术专家(P8) ----- 通义实验室-云端推理服务技术专家-北京/杭州 通义实验室 · 北京|杭州 职位描述 设计并构建面向多模态交互(语音、视觉、语言、上下文融合)的云端推理服务平台,支持Omni/Speech/VL等大模型的在线/近线推理; 主导端云协同架构中云端服务模块的技术方案,包括模型服务化(Model Serving)、动态批处理(Dynamic Batching)、请求调度、弹性扩缩容、负载均衡等关键能力; 优化云端推理链路的延迟、吞吐与资源利用率,针对ToB客户对SLA(如; 99.9%)构建统一的服务治理框架,集成监控告警、日志追踪(如OpenTelemetry)、AB测试、灰度发布、故障自愈等运维能力; 与算法团队紧密协作,推动模型结构适配、量化部署、缓存策略等端云联合优化方案落地; 职位要求 计算机科学、软件工程或相关专业硕士及以上学历,3年以上后端/云服务/推理平台开发经验; 精通Go/Python/C++至少一种语言,具备扎实的系统编程和高并发服务开发能力; 熟悉主流推理框架(如Triton Inference Server、vLLM、TensorRT-LLM、ONNX Runtime)及模型服务化最佳实践; 有大规模AI服务部署经验,熟悉GPU资源调度、模型版本管理、冷启动优化、长尾请求处理等典型问题; 有ToB项目交付经验,能理解客户需求并转化为可靠、可运维的技术方案; ------ 报名地址详见: 搜索。
Y11
1周前
高端招聘:通义实验室招AI交互系统高级架构师(P9) ----- 通义实验室-AI交互系统高级架构师-北京/杭州 通义实验室 · 北京|杭州 职位描述 主导面向ToB行业(如AI手机厂商、智能汽车Tier1/主机厂等)的多模态交互系统整体架构设计,制定可扩展、高性能、低延迟的技术方案; 深度参与客户需求分析,抽象行业共性问题,构建标准化、模块化的交互算法平台,支持多客户、多终端快速适配; 负责核心交互链路的设计与优化,包括但不限于:端云协同语音识别与合成、多轮对话管理、视觉-语言跨模态理解、情境感知建模、用户意图预测与个性化响应; 推动算法在资源受限设备(如车载芯片、手机SoC)上的高效部署,兼顾精度、功耗与实时性; 牵头关键技术攻关,评估并引入大模型(LLM)、多模态基础模型(Multimodal Foundation Models)等前沿技术在交互场景中的应用路径; 协同产品、硬件、OS、云服务及客户工程团队,确保技术方案从概念到量产的高质量交付; 输出面向客户的架构白皮书、技术提案及标杆案例,支撑售前技术交流与生态合作; 职位要求 计算机、人工智能、自动化或相关专业硕士及以上学历,8年以上AI算法研发经验,5年以上大型系统架构设计经验; 在多模态人机交互领域有扎实积累,精通至少三项核心技术:语音处理(ASR/TTS/NLU)、计算机视觉(人脸/手势/场景理解)、自然语言处理、对话系统、行为建模或个性化推荐; 熟悉端侧AI部署全流程,掌握模型压缩(剪枝/量化/蒸馏)、推理加速(TensorRT、NNAPI、Core ML等)及异构计算优化技术; 具备优秀的系统抽象与工程落地能力,熟练使用C++/Python,熟悉Linux/Android/QNX等嵌入式或移动操作系统; 有AI手机、智能座舱、机器人或其他ToB智能硬件产品的完整项目经验,曾主导过从0到1的交互系统构建者优先; 具备出色的跨部门协作、技术影响力和客户沟通能力,能将复杂技术转化为客户价值; 对人机交互体验有极致追求,兼具技术前瞻性与商业落地思维; ------ 报名地址详见: 搜索。