Leo Xiang

统计数据

69
文章
0
粉丝
0
获赞
195
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
Leo Xiang
12小时前
Cli 类的编程Agent还有一个非常大的优势就是可以更快的迭代,比如claude code 就能保持一天一个版本的迭代。 Cursor 类基于IDE的工作只能保证一到两周一个版本迭代。
AI编程工具激战:Claude Code、Gemini Cli崛起· 615 条信息
#编程Agent #Cli类 #Claude Code #快速迭代 #Cursor类
avatar
Leo Xiang
5天前
求推荐个能在linux 环境下科学上网的工具? 场景是需要在云端使用GPU + Claude code来进行远程开发。 现在很多科学上网工具对linux 都支持不太好。
AI编程工具激战:Claude Code、Gemini Cli崛起· 615 条信息
#Linux #科学上网 #Claude Code #远程开发 #GPU
avatar
Leo Xiang
1周前
genspark真是卷王,每周都有功能上新。
#GenSpark #卷王 #功能上新 #积极
avatar
Leo Xiang
1周前
周末claude code实战分享: 给大家讲讲如何借助claude code 用一个周末的时间从0开发一个同声传译的应用。 另外创建了一个转录/翻译/同传的产品技术讨论群,在关注这个方向的可以加群聊聊你的需求。
AI编程工具激战:Claude Code、Gemini Cli崛起· 615 条信息
#Claude #同声传译 #应用开发 #技术讨论群 #周末
avatar
Leo Xiang
1周前
说一个最近的观点: 大厂的 asr 和 tts 可能真做不到中厂以及小厂,大厂的合规成本太高了。
#大厂 #ASR #TTS #合规成本 #小厂
avatar
Leo Xiang
2周前
转存50T数据,最终发现居然是百度网盘最便宜。
#百度网盘 #数据存储 #价格 #性价比 #转存
avatar
Leo Xiang
2周前
一个周末借助Claude完成一个同声传译/双语字幕的Mac端应用: 1、支持ScreenCaptureKit 采集系统声音、单应用声音、以及麦克风声音,以及多流的mixer; 2、支持OpenAI Realtime API 以及 阿里云Gummy 实时转录模型; 3、支持多家大模型翻译API。 PS:也能支持视频号视频/直播的实时字幕和翻译了。 有相关需求的伙伴可以一起聊聊,看是否可以做成一个产品或者API 出来?
#同声传译 #双语字幕 #Mac端应用 #OpenAI Realtime API #阿里云Gummy
avatar
Leo Xiang
2周前
看到一个人的自我介绍很有意思,很符合当下vibe coding的描述: 文字工作者(写代码的)
#文字工作者 #写代码 #Vibe Coding #自我介绍 #当下
avatar
Leo Xiang
2周前
在国内会议记录、实时字幕、语音输入方向产品的商业化都被豆包给杀死了。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 382 条信息
#豆包 #商业化 #国内会议记录 #实时字幕 #语音输入
avatar
Leo Xiang
3周前
Azure 的 asr 和 tts 是提供SDK 最全的,比如基本的采集和播放都已经支持了,想问一下推友,你们在选asr和tts的供应商的时候一个好用的SDK在决策中占多大的比重?
#Azure #ASR #TTS #SDK #供应商选择
avatar
Leo Xiang
4周前
上二休五: 形容一种周一到周五忙公司的事情,周末才有两天时间好好写代码的人一种状态。
#上二休五 #程序员 #工作日忙碌 #周末写代码 #时间分配
avatar
Leo Xiang
4周前
受不了这些虚拟信用卡平台了,打算办理一张自己的海外的信用卡: 1、目前我有香港的银行卡; 2、下个月会出差去香港。 如果是这样的话最靠谱简单的办理海外信用卡的方案是什么?
#虚拟信用卡平台 #香港银行卡 #海外信用卡 #出差 #办理
avatar
Leo Xiang
1个月前
朋友圈已经不能说真话了,针对一个产品发表了一下评论,然后就被同事要求删内容。😂😂
#朋友圈 #言论自由 #职场压力 #人际关系 #负面
avatar
Leo Xiang
1个月前
入手了一个TicNote 来体验这些转录的硬件, 推友有啥想重点了解的不?
#Ticnote #转录硬件 #体验 #求推荐 #评测
avatar
Leo Xiang
1个月前
有对配音行业了解的推友么? 想付费聊天以及请你吃饭。
#配音行业 #付费聊天 #求助 #行业交流 #寻求帮助
avatar
Leo Xiang
1个月前
Voice Agent 以及 Agent方向的应用还非常早期,单从产品的用户日活以及越活来说,相比移动互联网时代还相差两个数量级。
#Voice Agent #Agent应用 #早期阶段 #用户日活低 #移动互联网
avatar
Leo Xiang
1个月前
看到某些公司对实习生和毕业生的要求是: 如果不能在6个月内超过AI写代码的能力,就淘汰。
#AI浪潮:重塑就业,风险暗涌?· 94 条信息
#AI写代码 #实习生 #毕业生 #淘汰 #能力要求
avatar
Leo Xiang
1个月前
周末除了带娃 就是 学习和写代码,有了这么多AI工具的加持,周末都不舍得休息。
#AI工具 #学习 #写代码 #周末 #带娃
avatar
Leo Xiang
1个月前
北京的伙伴谁有买了 Plaud note 或者 Ticnote的不? 想借来体验一下,回报是可以帮着你解答一些音视频方向的问题以及请你吃一顿饭。
#Plaud Note #Ticnote #体验 #音视频 #北京
avatar
Leo Xiang
1个月前
利用好LLM 的prefix特性,用小模型先回复,然后大模型续上,LLM 首句延迟可以大幅降低到100ms级别。 今天vibe coding 的成果之一:
#LLM #prefix特性 #小模型 #大模型 #首句延迟
avatar
Leo Xiang
1个月前
一天N个会,约时间和参会都是非常大的痛点,真需要一个开会的Agent: 1、建立一个个人的知识库,设定特定的prompt; 2、音视频Agent 在桌面端接管会议的音频输入和输出,配合 ASR/LLM/TTS/声音clone ; 我猜已经有人在做这个了吧?
avatar
Leo Xiang
1个月前
在Claude Code 帮助下,一天的时间把一个跑在mac 本地的语音助手项目搞起来了,支持特性如下: 1、mac上的音频采集和播放; 2、支持VAD 和 打断; 3、ASR 使用sencevoice; 4、LLM 使用 mlx-qwen系列; 5、TTS目前用了 siliconflow 上的 cosyvoice( TTS 跑在本地还是太慢) 项目地址如下: 下周末Vibe coding继续,把这个项目打磨好。
avatar
Leo Xiang
1个月前
Elevanlabs 的TTS 真是已经下一个Level了, 听完你会点赞的 😄。
avatar
Leo Xiang
1个月前
智谱的ai域名如何备案成功的? 其他家的ai域名为啥不可以。
avatar
Leo Xiang
1个月前
Gemini 刚刚发布了一个 genai-processors 的库,把Agent用到的能力都封装成一个个的 Processor,而且支持pipeline 模式的组装。 非常喜欢这种设计,把原子能力设计的非常小,且支持各种组合,非常适合vibe coding。
© 2025 news.news. All rights reserved. 0.05251 秒. v1.0.46
我的评论