时政
财经
科技
登录
Leo Xiang
关注
统计数据
57
文章
0
粉丝
0
获赞
56
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
Leo Xiang
1天前
在Claude Code 帮助下,一天的时间把一个跑在mac 本地的语音助手项目搞起来了,支持特性如下: 1、mac上的音频采集和播放; 2、支持VAD 和 打断; 3、ASR 使用sencevoice; 4、LLM 使用 mlx-qwen系列; 5、TTS目前用了 siliconflow 上的 cosyvoice( TTS 跑在本地还是太慢) 项目地址如下: 下周末Vibe coding继续,把这个项目打磨好。
分享
评论 0
0
Leo Xiang
2天前
Elevanlabs 的TTS 真是已经下一个Level了, 听完你会点赞的 😄。
分享
评论 0
0
Leo Xiang
2天前
这里有个Claude code 逆向分析,对学习如何设计一个好的Agent 应该非常有帮助。
AI编程工具激战:Claude Code、Gemini Cli崛起· 241 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 327 条信息
分享
评论 0
0
Leo Xiang
2天前
用claude code 写代码确实容易分心,在等待过程中很容易刷个X,干个其他的事情。
AI编程工具激战:Claude Code、Gemini Cli崛起· 241 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 327 条信息
分享
评论 0
0
Leo Xiang
3天前
智谱的ai域名如何备案成功的? 其他家的ai域名为啥不可以。
分享
评论 0
0
Leo Xiang
3天前
Gemini 刚刚发布了一个 genai-processors 的库,把Agent用到的能力都封装成一个个的 Processor,而且支持pipeline 模式的组装。 非常喜欢这种设计,把原子能力设计的非常小,且支持各种组合,非常适合vibe coding。
分享
评论 0
0
Leo Xiang
5天前
腾讯的EdgeOne + AI建站给大家送福利了🔥🔥 腾讯 Kepler Plan S3 全球高校开发者大赛正式启动 🔥 AI 正在重新定义前端开发。Kepler Plan 开发者大赛本季内容聚焦【AI+建站】,诚邀高校学生免费报名参赛,运用腾讯EdgeOne Pages + AI 工具智能开发、部署下一代网站。 丰厚奖励: 💼 腾讯招聘:为优胜队伍成员提供腾讯内推机会 🖥 开发者资源:最高可享受12个月免费腾讯云EdgeOne标准版套餐(价值$7080) 🏆 官网展示:获奖项目将作为官方网站模板在腾讯官网上展示 📈 履历添彩:提交网站项目,完赛即可获得官方证书 赛程安排: - 报名启动:7月4日 - 项目提交DDL:8月4日 12am(美东时间) - 决赛名单公布:8月7日 - 奖项公布:8月下旬 🚀报名地址:
分享
评论 0
0
Leo Xiang
1周前
11labs的专业的音频clone (需要30分钟训练) 收费依旧是很贵,目前看这块没有太多竞品,大家还是在卷zero shot 声音clone。
分享
评论 0
0
Leo Xiang
1周前
现在clone一个产品实现的门槛太低了。 构建自己产品的时候要好好想想如何构建自己持续的竞争力。
#AI掘金:副业新机,Podify寻伙伴· 52 条信息
分享
评论 0
0
Leo Xiang
1周前
用了几天Claude code,CC 的强项在于规划 以及 tool的使用,从能力上来说确实比Cursor目前的版本更好。但CC的这部分优势很难保持,Cursor 估计很快就能学习以及追上来,估计下个版本就能跟CC的效果对齐。 还没切换Claude code 应该不用着急。
AI编程工具激战:Claude Code、Gemini Cli崛起· 241 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 327 条信息
分享
评论 0
0
Leo Xiang
2周前
音频端到端模型一个残酷的现实。
分享
评论 0
0
Leo Xiang
2周前
应该给Gemini CLI 增加一个语音输入,这个就是真的PC端的语音助手了。
分享
评论 0
0
Leo Xiang
2周前
让Claude code 写了一个国内大模型速度评测的leaderboard,豆包1.6的这个模型的速度确实快。
AI编程工具激战:Claude Code、Gemini Cli崛起· 241 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 327 条信息
分享
评论 0
0
Leo Xiang
2周前
Claude code 敞开用一天几十美刀,能开订阅还是开订阅吧。
AI编程工具激战:Claude Code、Gemini Cli崛起· 241 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 327 条信息
分享
评论 0
0
Leo Xiang
2周前
让claude code 帮我写了一个评测各家模型的小工具并做成leaderboard,一把过的感觉太爽了。
AI编程工具激战:Claude Code、Gemini Cli崛起· 241 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 327 条信息
分享
评论 0
0
Leo Xiang
2周前
Claude code + Cursor 配合食用效果更佳。 从这个方面说Claude code 并不会对Cursor造成太多的竞争。
AI编程工具激战:Claude Code、Gemini Cli崛起· 241 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 327 条信息
分享
评论 0
0
Leo Xiang
2周前
Claude code 确实工具用的很好,会规划好todo,一步一步的执行。
AI编程工具激战:Claude Code、Gemini Cli崛起· 241 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 327 条信息
分享
评论 0
0
Leo Xiang
2周前
Gemini-cli 的介绍是: An open-source AI agent。 不只是一个编程工具。
分享
评论 0
0
Leo Xiang
2周前
不知道有没有硬件可以接管手机的音频,能接管手机音频的输入和播放,并能支持编程对音频进行处理。 如果有这样的硬件和解决方案可以联系我。
分享
评论 0
0
Leo Xiang
2周前
OpenAI 引入了Webhooks,Agent相关的交互越来越复杂,可能最终的方式还是SDK + 长连接。
分享
评论 0
0
Leo Xiang
2周前
端到端音频模型 和 三段式(asr/llm/tts) 语音技术栈本质的区别是:端到端方案本身有更完备的上下文。 如果提供更多的上下文给到asr 和 tts,理论上可以做到更好,上限更高以及更灵活。
分享
评论 0
0
Leo Xiang
3周前
有什么能稳定使用claude code 的方法么,claude 账号前两周刚被封了。
AI编程工具激战:Claude Code、Gemini Cli崛起· 241 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 327 条信息
分享
评论 0
0
Leo Xiang
3周前
不知道国内有没有类似Groq类似的产品,需要LLM的首Token降至100ms以内voice agent 的体验才能普遍提升上去。
分享
评论 0
0
Leo Xiang
3周前
在voice agent场景下为了响应快,会先用一个小模型做一下承接语(返回一些语气词 或者 附和语),然后再等待大模型真正的返回。 这个时候有个痛点是:TTS在合成单字 或者 短句的时候往往效果不好,比较好的一个策略就是TTS也能支持流式的输入。
分享
评论 0
0
Leo Xiang
3周前
Gemini 2.5 Pro 多模态确实遥遥领先,扔一个跟AI对话的视频让大模型分析延迟,直接给出结果。而且跟人打标签给出的结果类似。
Google Gemini 2.5发布引发AI模型性价比热议· 34 条信息
#AI编程:群雄逐鹿,Gemini、Grok、OpenAI混战· 327 条信息
分享
评论 0
0
1
2
3
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞