时政
财经
科技
虚拟货币
其他
登录
Leo Xiang
关注
统计数据
206
文章
0
粉丝
0
获赞
3760
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
Leo Xiang
6个月前
说一个最近的观点: 大厂的 asr 和 tts 可能真做不到中厂以及小厂,大厂的合规成本太高了。
#大厂
#ASR
#TTS
#合规成本
#小厂
分享
评论 0
0
Leo Xiang
6个月前
转存50T数据,最终发现居然是百度网盘最便宜。
#百度网盘
#数据存储
#价格
#性价比
#转存
分享
评论 0
0
Leo Xiang
6个月前
一个周末借助Claude完成一个同声传译/双语字幕的Mac端应用: 1、支持ScreenCaptureKit 采集系统声音、单应用声音、以及麦克风声音,以及多流的mixer; 2、支持OpenAI Realtime API 以及 阿里云Gummy 实时转录模型; 3、支持多家大模型翻译API。 PS:也能支持视频号视频/直播的实时字幕和翻译了。 有相关需求的伙伴可以一起聊聊,看是否可以做成一个产品或者API 出来?
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#同声传译
#双语字幕
#Mac端应用
#OpenAI Realtime API
#阿里云Gummy
分享
评论 0
0
Leo Xiang
6个月前
看到一个人的自我介绍很有意思,很符合当下vibe coding的描述: 文字工作者(写代码的)
#文字工作者
#写代码
#Vibe Coding
#自我介绍
#当下
分享
评论 0
0
Leo Xiang
6个月前
在国内会议记录、实时字幕、语音输入方向产品的商业化都被豆包给杀死了。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#豆包
#商业化
#国内会议记录
#实时字幕
#语音输入
分享
评论 0
0
Leo Xiang
6个月前
Azure 的 asr 和 tts 是提供SDK 最全的,比如基本的采集和播放都已经支持了,想问一下推友,你们在选asr和tts的供应商的时候一个好用的SDK在决策中占多大的比重?
#Azure
#ASR
#TTS
#SDK
#供应商选择
分享
评论 0
0
Leo Xiang
6个月前
Claude code hooks的一个好的玩法,搞完一个任务之后自动播放一个声音。 这个完全可以拓展一下: 搞个桌宠,每完成一个任务之后就跟你搔首弄姿一下。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude
#code hooks
#任务完成
#声音提示
#桌宠
分享
评论 0
0
Leo Xiang
6个月前
上二休五: 形容一种周一到周五忙公司的事情,周末才有两天时间好好写代码的人一种状态。
#上二休五
#程序员
#工作日忙碌
#周末写代码
#时间分配
分享
评论 0
0
Leo Xiang
6个月前
对我个人来说,非常实用的agent有两个,已经具备反思的能力: 1、Claude code: 写代码/以及解决技术问题成功率非常高。 2、ChatGPT Agent:我拿相同的prompt测试,ChatGPT Agent的结果是超过O3的,甚至我估计设计一些错误的prompt引导,ChatGPT Agent 经过思考之后告诉我是错误的,他之前的结论是对的。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude Code
#ChatGPT Agent
#代码能力
#反思能力
#技术问题解决
分享
评论 0
0
Leo Xiang
6个月前
受不了这些虚拟信用卡平台了,打算办理一张自己的海外的信用卡: 1、目前我有香港的银行卡; 2、下个月会出差去香港。 如果是这样的话最靠谱简单的办理海外信用卡的方案是什么?
#虚拟信用卡平台
#香港银行卡
#海外信用卡
#出差
#办理
分享
评论 0
0
Leo Xiang
6个月前
Claude code 大家在后台运行的时候有什么好的思路和实践没? 初步想法是:睡觉前给他安排三个任务,明天一早醒来来验收
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude
#Code
#任务安排
#后台运行
#效率工具
分享
评论 0
0
Leo Xiang
6个月前
最近开源的的几个模型都号称能超越 claude 4,但实际用在Claude code中效果依旧差距很大。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#开源模型
#Claude 4
#性能差距
#代码能力
#失望
分享
评论 0
0
Leo Xiang
6个月前
朋友圈已经不能说真话了,针对一个产品发表了一下评论,然后就被同事要求删内容。😂😂
#朋友圈
#言论自由
#职场压力
#人际关系
#负面
分享
评论 0
0
Leo Xiang
7个月前
入手了一个TicNote 来体验这些转录的硬件, 推友有啥想重点了解的不?
#Ticnote
#转录硬件
#体验
#求推荐
#评测
分享
评论 0
0
Leo Xiang
7个月前
有对配音行业了解的推友么? 想付费聊天以及请你吃饭。
#配音行业
#付费聊天
#求助
#行业交流
#寻求帮助
分享
评论 0
0
Leo Xiang
7个月前
Voice Agent 以及 Agent方向的应用还非常早期,单从产品的用户日活以及越活来说,相比移动互联网时代还相差两个数量级。
#Voice Agent
#Agent应用
#早期阶段
#用户日活低
#移动互联网
分享
评论 0
0
Leo Xiang
7个月前
今天Claude code 不稳定,严重影响效率。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude
#code不稳定
#效率影响
#消极
分享
评论 0
0
Leo Xiang
7个月前
看到某些公司对实习生和毕业生的要求是: 如果不能在6个月内超过AI写代码的能力,就淘汰。
#AI浪潮:重塑就业,风险暗涌?· 140 条信息
#AI写代码
#实习生
#毕业生
#淘汰
#能力要求
分享
评论 0
0
Leo Xiang
7个月前
周末除了带娃 就是 学习和写代码,有了这么多AI工具的加持,周末都不舍得休息。
#AI工具
#学习
#写代码
#周末
#带娃
分享
评论 0
0
Leo Xiang
7个月前
北京的伙伴谁有买了 Plaud note 或者 Ticnote的不? 想借来体验一下,回报是可以帮着你解答一些音视频方向的问题以及请你吃一顿饭。
#Plaud Note
#Ticnote
#体验
#音视频
#北京
分享
评论 0
0
Leo Xiang
7个月前
利用好LLM 的prefix特性,用小模型先回复,然后大模型续上,LLM 首句延迟可以大幅降低到100ms级别。 今天vibe coding 的成果之一:
#LLM
#prefix特性
#小模型
#大模型
#首句延迟
分享
评论 0
0
Leo Xiang
7个月前
给团队所有伙伴讲了一下 Claude code的账号开通 和使用方法,看多少人能用起来。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude
#code账号
#团队伙伴
#使用方法
#开通
分享
评论 0
0
Leo Xiang
7个月前
我自己深度使用claude code的体验,对我来说: 1、Cursor 在代码方面能提效 30% - 50%; 2、Claude code 提效在 100% - 200%之间; 但需要注意的是,大部分工程师每天写代码的时间有多少? 有20%么?
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Cursor
#Claude Code
#效率提升
#工程师
#代码
分享
评论 0
0
Leo Xiang
7个月前
一天N个会,约时间和参会都是非常大的痛点,真需要一个开会的Agent: 1、建立一个个人的知识库,设定特定的prompt; 2、音视频Agent 在桌面端接管会议的音频输入和输出,配合 ASR/LLM/TTS/声音clone ; 我猜已经有人在做这个了吧?
分享
评论 0
0
Leo Xiang
7个月前
在Claude Code 帮助下,一天的时间把一个跑在mac 本地的语音助手项目搞起来了,支持特性如下: 1、mac上的音频采集和播放; 2、支持VAD 和 打断; 3、ASR 使用sencevoice; 4、LLM 使用 mlx-qwen系列; 5、TTS目前用了 siliconflow 上的 cosyvoice( TTS 跑在本地还是太慢) 项目地址如下: 下周末Vibe coding继续,把这个项目打磨好。
分享
评论 0
0
上一页
1
2
3
4
5
6
7
8
9
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞