Leo Xiang

统计数据

206

文章

0

粉丝

0

获赞

3760

阅读

6个月前

说一个最近的观点：大厂的 asr 和 tts 可能真做不到中厂以及小厂，大厂的合规成本太高了。

#大厂 #ASR #TTS #合规成本 #小厂

6个月前

转存50T数据，最终发现居然是百度网盘最便宜。

#百度网盘 #数据存储 #价格 #性价比 #转存

6个月前

一个周末借助Claude完成一个同声传译/双语字幕的Mac端应用： 1、支持ScreenCaptureKit 采集系统声音、单应用声音、以及麦克风声音，以及多流的mixer； 2、支持OpenAI Realtime API 以及阿里云Gummy 实时转录模型； 3、支持多家大模型翻译API。 PS：也能支持视频号视频/直播的实时字幕和翻译了。有相关需求的伙伴可以一起聊聊，看是否可以做成一个产品或者API 出来？

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#同声传译 #双语字幕 #Mac端应用 #OpenAI Realtime API #阿里云Gummy

6个月前

看到一个人的自我介绍很有意思，很符合当下vibe coding的描述：文字工作者(写代码的)

#文字工作者 #写代码 #Vibe Coding #自我介绍 #当下

6个月前

在国内会议记录、实时字幕、语音输入方向产品的商业化都被豆包给杀死了。

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#豆包 #商业化 #国内会议记录 #实时字幕 #语音输入

6个月前

Azure 的 asr 和 tts 是提供SDK 最全的，比如基本的采集和播放都已经支持了，想问一下推友，你们在选asr和tts的供应商的时候一个好用的SDK在决策中占多大的比重？

#Azure #ASR #TTS #SDK #供应商选择

6个月前

Claude code hooks的一个好的玩法，搞完一个任务之后自动播放一个声音。这个完全可以拓展一下：搞个桌宠，每完成一个任务之后就跟你搔首弄姿一下。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude #code hooks #任务完成 #声音提示 #桌宠

6个月前

上二休五：形容一种周一到周五忙公司的事情，周末才有两天时间好好写代码的人一种状态。

#上二休五 #程序员 #工作日忙碌 #周末写代码 #时间分配

6个月前

对我个人来说，非常实用的agent有两个，已经具备反思的能力： 1、Claude code：写代码/以及解决技术问题成功率非常高。 2、ChatGPT Agent：我拿相同的prompt测试，ChatGPT Agent的结果是超过O3的，甚至我估计设计一些错误的prompt引导，ChatGPT Agent 经过思考之后告诉我是错误的，他之前的结论是对的。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude Code #ChatGPT Agent #代码能力 #反思能力 #技术问题解决

6个月前

受不了这些虚拟信用卡平台了，打算办理一张自己的海外的信用卡： 1、目前我有香港的银行卡； 2、下个月会出差去香港。如果是这样的话最靠谱简单的办理海外信用卡的方案是什么？

#虚拟信用卡平台 #香港银行卡 #海外信用卡 #出差 #办理

6个月前

Claude code 大家在后台运行的时候有什么好的思路和实践没？初步想法是：睡觉前给他安排三个任务，明天一早醒来来验收

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude #Code #任务安排 #后台运行 #效率工具

6个月前

最近开源的的几个模型都号称能超越 claude 4，但实际用在Claude code中效果依旧差距很大。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#开源模型 #Claude 4 #性能差距 #代码能力 #失望

6个月前

朋友圈已经不能说真话了，针对一个产品发表了一下评论，然后就被同事要求删内容。😂😂

#朋友圈 #言论自由 #职场压力 #人际关系 #负面

7个月前

入手了一个TicNote 来体验这些转录的硬件，推友有啥想重点了解的不？

#Ticnote #转录硬件 #体验 #求推荐 #评测

7个月前

有对配音行业了解的推友么？想付费聊天以及请你吃饭。

#配音行业 #付费聊天 #求助 #行业交流 #寻求帮助

7个月前

Voice Agent 以及 Agent方向的应用还非常早期，单从产品的用户日活以及越活来说，相比移动互联网时代还相差两个数量级。

#Voice Agent #Agent应用 #早期阶段 #用户日活低 #移动互联网

7个月前

今天Claude code 不稳定，严重影响效率。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude #code不稳定 #效率影响 #消极

7个月前

看到某些公司对实习生和毕业生的要求是：如果不能在6个月内超过AI写代码的能力，就淘汰。

#AI浪潮：重塑就业，风险暗涌？· 140 条信息

#AI写代码 #实习生 #毕业生 #淘汰 #能力要求

7个月前

周末除了带娃就是学习和写代码，有了这么多AI工具的加持，周末都不舍得休息。

#AI工具 #学习 #写代码 #周末 #带娃

7个月前

北京的伙伴谁有买了 Plaud note 或者 Ticnote的不？想借来体验一下，回报是可以帮着你解答一些音视频方向的问题以及请你吃一顿饭。

#Plaud Note #Ticnote #体验 #音视频 #北京

7个月前

利用好LLM 的prefix特性，用小模型先回复，然后大模型续上，LLM 首句延迟可以大幅降低到100ms级别。今天vibe coding 的成果之一：

#LLM #prefix特性 #小模型 #大模型 #首句延迟

7个月前

给团队所有伙伴讲了一下 Claude code的账号开通和使用方法，看多少人能用起来。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude #code账号 #团队伙伴 #使用方法 #开通

7个月前

我自己深度使用claude code的体验，对我来说： 1、Cursor 在代码方面能提效 30% - 50%； 2、Claude code 提效在 100% - 200%之间；但需要注意的是，大部分工程师每天写代码的时间有多少？有20%么？

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Cursor #Claude Code #效率提升 #工程师 #代码

7个月前

一天N个会，约时间和参会都是非常大的痛点，真需要一个开会的Agent： 1、建立一个个人的知识库，设定特定的prompt； 2、音视频Agent 在桌面端接管会议的音频输入和输出，配合 ASR/LLM/TTS/声音clone ；我猜已经有人在做这个了吧？

7个月前

在Claude Code 帮助下，一天的时间把一个跑在mac 本地的语音助手项目搞起来了，支持特性如下： 1、mac上的音频采集和播放； 2、支持VAD 和打断； 3、ASR 使用sencevoice； 4、LLM 使用 mlx-qwen系列； 5、TTS目前用了 siliconflow 上的 cosyvoice( TTS 跑在本地还是太慢) 项目地址如下：下周末Vibe coding继续，把这个项目打磨好。