Leo Xiang

统计数据

206
文章
0
粉丝
0
获赞
3760
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
Leo Xiang
6个月前
说一个最近的观点: 大厂的 asr 和 tts 可能真做不到中厂以及小厂,大厂的合规成本太高了。
#大厂 #ASR #TTS #合规成本 #小厂
avatar
Leo Xiang
6个月前
转存50T数据,最终发现居然是百度网盘最便宜。
#百度网盘 #数据存储 #价格 #性价比 #转存
avatar
Leo Xiang
6个月前
一个周末借助Claude完成一个同声传译/双语字幕的Mac端应用: 1、支持ScreenCaptureKit 采集系统声音、单应用声音、以及麦克风声音,以及多流的mixer; 2、支持OpenAI Realtime API 以及 阿里云Gummy 实时转录模型; 3、支持多家大模型翻译API。 PS:也能支持视频号视频/直播的实时字幕和翻译了。 有相关需求的伙伴可以一起聊聊,看是否可以做成一个产品或者API 出来?
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#同声传译 #双语字幕 #Mac端应用 #OpenAI Realtime API #阿里云Gummy
avatar
Leo Xiang
6个月前
看到一个人的自我介绍很有意思,很符合当下vibe coding的描述: 文字工作者(写代码的)
#文字工作者 #写代码 #Vibe Coding #自我介绍 #当下
avatar
Leo Xiang
6个月前
在国内会议记录、实时字幕、语音输入方向产品的商业化都被豆包给杀死了。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#豆包 #商业化 #国内会议记录 #实时字幕 #语音输入
avatar
Leo Xiang
6个月前
Azure 的 asr 和 tts 是提供SDK 最全的,比如基本的采集和播放都已经支持了,想问一下推友,你们在选asr和tts的供应商的时候一个好用的SDK在决策中占多大的比重?
#Azure #ASR #TTS #SDK #供应商选择
avatar
Leo Xiang
6个月前
Claude code hooks的一个好的玩法,搞完一个任务之后自动播放一个声音。 这个完全可以拓展一下: 搞个桌宠,每完成一个任务之后就跟你搔首弄姿一下。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude #code hooks #任务完成 #声音提示 #桌宠
avatar
Leo Xiang
6个月前
上二休五: 形容一种周一到周五忙公司的事情,周末才有两天时间好好写代码的人一种状态。
#上二休五 #程序员 #工作日忙碌 #周末写代码 #时间分配
avatar
Leo Xiang
6个月前
对我个人来说,非常实用的agent有两个,已经具备反思的能力: 1、Claude code: 写代码/以及解决技术问题成功率非常高。 2、ChatGPT Agent:我拿相同的prompt测试,ChatGPT Agent的结果是超过O3的,甚至我估计设计一些错误的prompt引导,ChatGPT Agent 经过思考之后告诉我是错误的,他之前的结论是对的。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude Code #ChatGPT Agent #代码能力 #反思能力 #技术问题解决
avatar
Leo Xiang
6个月前
受不了这些虚拟信用卡平台了,打算办理一张自己的海外的信用卡: 1、目前我有香港的银行卡; 2、下个月会出差去香港。 如果是这样的话最靠谱简单的办理海外信用卡的方案是什么?
#虚拟信用卡平台 #香港银行卡 #海外信用卡 #出差 #办理
avatar
Leo Xiang
6个月前
Claude code 大家在后台运行的时候有什么好的思路和实践没? 初步想法是:睡觉前给他安排三个任务,明天一早醒来来验收
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude #Code #任务安排 #后台运行 #效率工具
avatar
Leo Xiang
6个月前
最近开源的的几个模型都号称能超越 claude 4,但实际用在Claude code中效果依旧差距很大。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#开源模型 #Claude 4 #性能差距 #代码能力 #失望
avatar
Leo Xiang
6个月前
朋友圈已经不能说真话了,针对一个产品发表了一下评论,然后就被同事要求删内容。😂😂
#朋友圈 #言论自由 #职场压力 #人际关系 #负面
avatar
Leo Xiang
7个月前
入手了一个TicNote 来体验这些转录的硬件, 推友有啥想重点了解的不?
#Ticnote #转录硬件 #体验 #求推荐 #评测
avatar
Leo Xiang
7个月前
有对配音行业了解的推友么? 想付费聊天以及请你吃饭。
#配音行业 #付费聊天 #求助 #行业交流 #寻求帮助
avatar
Leo Xiang
7个月前
Voice Agent 以及 Agent方向的应用还非常早期,单从产品的用户日活以及越活来说,相比移动互联网时代还相差两个数量级。
#Voice Agent #Agent应用 #早期阶段 #用户日活低 #移动互联网
avatar
Leo Xiang
7个月前
今天Claude code 不稳定,严重影响效率。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude #code不稳定 #效率影响 #消极
avatar
Leo Xiang
7个月前
看到某些公司对实习生和毕业生的要求是: 如果不能在6个月内超过AI写代码的能力,就淘汰。
#AI浪潮:重塑就业,风险暗涌?· 140 条信息
#AI写代码 #实习生 #毕业生 #淘汰 #能力要求
avatar
Leo Xiang
7个月前
周末除了带娃 就是 学习和写代码,有了这么多AI工具的加持,周末都不舍得休息。
#AI工具 #学习 #写代码 #周末 #带娃
avatar
Leo Xiang
7个月前
北京的伙伴谁有买了 Plaud note 或者 Ticnote的不? 想借来体验一下,回报是可以帮着你解答一些音视频方向的问题以及请你吃一顿饭。
#Plaud Note #Ticnote #体验 #音视频 #北京
avatar
Leo Xiang
7个月前
利用好LLM 的prefix特性,用小模型先回复,然后大模型续上,LLM 首句延迟可以大幅降低到100ms级别。 今天vibe coding 的成果之一:
#LLM #prefix特性 #小模型 #大模型 #首句延迟
avatar
Leo Xiang
7个月前
给团队所有伙伴讲了一下 Claude code的账号开通 和使用方法,看多少人能用起来。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude #code账号 #团队伙伴 #使用方法 #开通
avatar
Leo Xiang
7个月前
我自己深度使用claude code的体验,对我来说: 1、Cursor 在代码方面能提效 30% - 50%; 2、Claude code 提效在 100% - 200%之间; 但需要注意的是,大部分工程师每天写代码的时间有多少? 有20%么?
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Cursor #Claude Code #效率提升 #工程师 #代码
avatar
Leo Xiang
7个月前
一天N个会,约时间和参会都是非常大的痛点,真需要一个开会的Agent: 1、建立一个个人的知识库,设定特定的prompt; 2、音视频Agent 在桌面端接管会议的音频输入和输出,配合 ASR/LLM/TTS/声音clone ; 我猜已经有人在做这个了吧?
avatar
Leo Xiang
7个月前
在Claude Code 帮助下,一天的时间把一个跑在mac 本地的语音助手项目搞起来了,支持特性如下: 1、mac上的音频采集和播放; 2、支持VAD 和 打断; 3、ASR 使用sencevoice; 4、LLM 使用 mlx-qwen系列; 5、TTS目前用了 siliconflow 上的 cosyvoice( TTS 跑在本地还是太慢) 项目地址如下: 下周末Vibe coding继续,把这个项目打磨好。
© 2025 news.news. All rights reserved. 0.10598 秒. v1.0.46
我的评论