Leo Xiang

统计数据

206
文章
0
粉丝
0
获赞
3760
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
Leo Xiang
3个月前
李新野这本书写的太牛,居然看出心流,午饭都忘记吃了。
#李新野 #心流 #书籍 #积极 #午饭
avatar
Leo Xiang
3个月前
Chatgpt atlas 有时候会假装自己读了当前网页内容,给出一个有偏差的结论。
#ChatGPT #Atlas #虚假信息 #偏差结论 #AI
avatar
Leo Xiang
3个月前
ChatGPT Atles 在一些页面上确实很卡,这种基础体验如果做不好好的话很影响大家的迁移。 想搞好一个浏览器的基础能力又不是一个小团队能解决的, 需要投入大量的研发资源,ChatGPT Atles 是否能成还存在很多变数。
#ChatGPT Atles #性能问题 #用户体验 #研发投入 #不确定性
avatar
Leo Xiang
3个月前
想扩充TTS 系统各个语种的音色,兄弟们都知道有哪些靠谱的音色批量购买渠道么? 海天瑞声、标贝、数据堂就先不考虑了,交付周期长也比较贵。
#TTS系统 #音色扩充 #音色购买渠道 #交付周期长 #价格贵
avatar
Leo Xiang
3个月前
计划11月12号在新加坡举办一个 Voice Agent 方向的 Workshop,目前还缺一位分享嘉宾,有在新加坡做LLM、Voice Agent、ASR/TTS 方向的伙伴愿意来贡献一个分享的不?
#新加坡 #Voice Agent Workshop #LLM #ASR/TTS #分享嘉宾
avatar
Leo Xiang
3个月前
忽然发现浏览器都支持TTS了,选择文字右键有一个“Speech” 能力。
#浏览器TTS #文本转语音 #Speech功能 #技术体验 #积极
avatar
Leo Xiang
4个月前
claude code 中的 agentic grep 用下来效果比一般的rag要好很多,业界有比较通用的agentic search 或者 agentic rag 的实现么?
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#agentic grep #RAG #Agentic Search #Agentic RAG #Claude Code
avatar
Leo Xiang
4个月前
有了claude code web版本之后,异步进行两个项目变的非常容易了。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude #Code #Web版本 #异步 #项目
avatar
Leo Xiang
4个月前
内部做了一次“一小时构建高质量美观PPT” 实战分享, 反馈非常不错,打算继续打磨一下这个主题。 你对这个主题有什么期待么?
#PPT #分享 #高质量 #美观 #打磨
avatar
Leo Xiang
4个月前
用voe3.1 生成数字人的成本很低了: 给定一个数字人的几张照片,扔给voe,然后再配音+ 对口型。
AI视频井喷:Midjourney领跑,多模态混战· 337 条信息
#数字人 #VOE3.1 #低成本 #AI #照片驱动
avatar
Leo Xiang
4个月前
11labs 已经有这么丰富的产品组合了,国内最接近11labs的公司是哪家?
#11Labs #AI语音 #产品组合 #国内公司 #技术对比
avatar
Leo Xiang
4个月前
看了一下claude code 的plugins, 找了几个在github上的marketplace,还是没脱离subagents的范畴。 plugins 和 subagents 重合度太高了。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#Claude #plugins #subagents
avatar
Leo Xiang
4个月前
OpenAI agent builder 发布一周了,有哪些被验证的agents 出来了?
#OpenAI #Agent Builder #Agents #人工智能 #技术
avatar
Leo Xiang
4个月前
Soundhound 这家做Voice Agent的公司收入和股价增长都很猛,但由于Soundhound的客户都是大B,作为开发者体验不到他们的产品。 有没有非常熟悉Soundhound这家公司的伙伴,可以给讲讲这家公司的产品 以及 体验?
#Soundhound #Voice Agent #B端客户 #开发者体验
avatar
Leo Xiang
4个月前
把OpenAI 最新发布Chatkit 以及 Agentkit 部分的代码过了一遍,并不看好Agent builder这一套方案。 这一套Agent设计模式很容易被抄走,而且OpenAI 在工具平台持续运营上并不比其他的创业团队有优势。 但确实能很大的推动Agent方向的发展,最起码能让大家知道构建一个Agent的最佳实践。
#OpenAI #AgentKit #Agent Builder #不看好 #Agent设计模式
avatar
Leo Xiang
4个月前
大家可以在 体验下如何基于Chatkit 来创建以及完成一个Todo,整体的体验非常顺滑。
#ChatKit #Todo应用 #体验顺滑 #技术体验 #应用创建
avatar
Leo Xiang
4个月前
如果我要长期存200T 的数据,最低成本的方案是什么?
#数据存储 #长期存储 #200T #成本 #方案
avatar
Leo Xiang
4个月前
ChatKit 以及 Agent builder 这一套方案跟OpenAI 平台绑定就比较深了,看其他家会不会跟上。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#ChatKit #Agent Builder #OpenAI #平台绑定 #技术
avatar
Leo Xiang
4个月前
OpenAI 应该为这次发布准备了很久了,一上来久准备了完备的组件库和各种Widget。 有种小程序的既视感。
#OpenAI #小程序 #组件库 #Widget #既视感
avatar
Leo Xiang
4个月前
利好 cloudflare。
#CloudFlare #利好
avatar
Leo Xiang
4个月前
最近处理实时的转录、翻译、以及同声传译比较多, 把复用到的web端的音频采集、编码、VAD 抽象了一下封装成了SDK。 项目地址:
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#实时转录 #翻译 #同声传译 #web端音频采集 #SDK
avatar
Leo Xiang
4个月前
ChatGPT 已经能做到实时的生成能交互的图表和UI了。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#ChatGPT #实时生成 #交互图表 #UI
avatar
Leo Xiang
4个月前
大家做视频的时候都是口播么? 有没有配音的需求?
#视频制作 #口播 #配音 #需求 #讨论
avatar
Leo Xiang
4个月前
以前不太习惯在git 仓库中集成那么多hook, 现在已经成默认行为了。 1、让大模型对最近的代码修改review,并给出评价; 2、自动化测试; 3、e2e测试; 4、提交代码; 5、github 远端workflow 自动化测试再跑一次。
AI编程工具激战:Claude Code、Gemini Cli崛起· 1256 条信息
#git hook #代码Review #自动化测试 #github workflow
avatar
Leo Xiang
4个月前
Qwen3 Guard 模型引入了一个一直很期待的能力: 流式输入。 大模型大都支持了流式输出,但支持流式输入的模型还是第一个,如果大模型能支持流式输入,对很多低延迟的场景非常友好。 阿里的伙伴还在计划给vLLM 以及 sglang支持流式输入的能力,非常期待。
#Qwen3 #Guard模型 #流式输入 #低延迟 #vLLM
© 2025 news.news. All rights reserved. 0.04216 秒. v1.0.46
我的评论