ginobefun
1个月前
#BestBlogs Amazon Bedrock + Whisper:构建高效无服务器音频摘要方案 | 亚马逊云科技 | AWS Machine Learning Blog 基于 AWS Bedrock 和 Whisper 的无服务器音频摘要方案。 摘要: 本文详细介绍了如何使用 AWS 服务构建无服务器解决方案,实现音频录音的转录、摘要和敏感信息脱敏。该方案利用 Amazon Bedrock 平台,通过 Anthropic 的 Claude 等模型实现内容摘要,并使用 Bedrock Guardrails 进行 PII 脱敏,结合 Amazon Bedrock Marketplace 提供的 Whisper 模型进行转录。架构采用 AWS Lambda、Step Functions 进行流程编排,S3 提供存储,CloudFront 用于前端内容分发,以及 API Gateway。文章详细阐述了架构设计、部署前提、Whisper 模型和 Bedrock Guardrail 的部署步骤,并提供 AWS CDK 代码,方便快速部署。同时,强调了方案的实用性和安全性,包括自动 PII 脱敏、细粒度的 IAM 权限控制和 S3 访问控制。 主要内容: 1. 通过 Amazon Bedrock 集成多种 AI 模型,实现完整工作流。 -- 在一个无服务器流水线中,结合 Whisper 进行准确转录,Claude 进行简洁摘要,并使用 Bedrock Guardrails 自动进行 PII 脱敏。 2. 利用 AWS 无服务器服务实现可扩展且经济高效的解决方案。 -- 使用 Lambda、Step Functions、S3 和 API Gateway 构建高度可扩展、托管且按需付费的架构,适用于音频处理工作流。 3. 使用 Amazon Bedrock Guardrails 实施 PII 脱敏,保护数据隐私。 -- 演示如何配置和应用 Bedrock Guardrails,自动识别并脱敏摘要结果中的敏感信息,例如姓名和电话号码。 4. 提供可以使用 AWS CDK 代码随时部署的架构。 -- 提供了一个实用且可操作的解决方案,通过基础设施即代码,开发者可以快速部署和测试该工作流程。 文章链接:
宝玉
1个月前
机器人现在能代替人工分拣包裹了,而且进化速度很快,视频是Figures CEO的访谈: 今天我们发布了一段视频,展示了一台机器人在物流场景中的应用。这台机器人完全靠一个端到端的神经网络控制,它只需输入摄像头捕获的画面,就能直接输出相应的操作动作。现在,这套系统已经接近人类的操作速度和准确率。放眼全球,你还能找到谁在做类似的事吗? 在这段视频中,机器人正在进行包裹分类任务,它能区分硬质的纸盒包装和塑料包装包裹,并试图将塑料包装表面弄平整,使条形码能够清晰呈现。这套系统目前正运行在你们自己的物流设施中,对吗? 这里面的挑战是:处理物流中的小型包裹尤其困难。因为每个包裹都是不一样的,每次堆叠在一起的包裹情况也完全不同,这给机器人带来了巨大的挑战。这种场景是没办法通过传统的编码方式解决的。 更有趣的是,这与我们之前发布的视频——关于冲压机作业的视频,形成了鲜明的对比。冲压机面对的是高密度金属,精度要求非常高,速度必须极快,容错率极低,因为生产线停不起;而物流机器人处理的包裹却截然不同,它们需要的是另一种能力:神经网络的泛化能力,以适应每次不同的包裹状况,达到接近人类的作业速度(每个包裹约需3至4秒),同时能找到条形码,将包裹正确翻转,并在很多情况下把塑料包装弄平,确保传送带后续的扫描仪能准确读取信息。 这两种作业的需求差别之大几乎是正交的(orthogonal):一个强调精准度和高速度,另一个则强调泛化和柔性控制。这也让人清晰地看到现代AI智能体在不同场景中的灵活性和潜力。