Leo Xiang

统计数据

69
文章
0
粉丝
0
获赞
195
阅读

热门文章

1

TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...

145 32
avatar
Leo Xiang
3个月前
每天通过Chatgpt 学习一个小时,很快就能初步了解一个方向:
#ChatGPT #学习 #人工智能 #自我提升
avatar
Leo Xiang
3个月前
OpenAI 在协议定义上还是有号召力,Realtime API 的规范也基本成为标准了,看到多家的端到端方案都采用了Realtime API标准,或者是修改版的Realtime API 标准。
#OpenAI #协议定义 #Realtime API #标准化 #端到端方案
avatar
Leo Xiang
3个月前
好消息是:gemini live api 支持中文了 坏消息是: 中文tts效果基本没法听
#gemini live #API #中文支持 #TTS #语音合成
avatar
Leo Xiang
5个月前
OpenAI Agent SDK 仓库中有一个"Research Agent" 的实现, 流程如下: 1、用户输入研究主题。 2、planner_agent 制定搜索计划,列出查询词及其理由。 3、search_agent 并行执行搜索,使用 Web Search 工具获取并总结结果。 4、writer_agent 整合搜索摘要,生成最终报告。 ChatGPT 的 DeepResearch应该也是这个流程,用了更好的模型 + 更好的工程化。
#OpenAI #Agent SDK #Research Agent #搜索流程 #聊天机器人 #DeepResearch #AI技术
avatar
Leo Xiang
5个月前
OpenAI 这套开发工具把Agent开发需要的基础能力都提供了,搜索、RAG、意图识别、内容审核、Computer use 以及 Browser use,整个Agent开发的成本瞬间降低了很多。 预期可见的会出来一批Agent方向的产品。
#OpenAI #开发工具 #agent #搜索 #RAG #意图识别 #内容审核 #Computer use #Browser Use
avatar
Leo Xiang
6个月前
国内大模型公司To B不好做了,大家需求很一致,效果对齐deepseek 或者 直接部署deepseek。
#国内大模型公司 #To B市场 #市场需求 #效果对齐 #技术部署 #DeepSeek
avatar
Leo Xiang
6个月前
看到好几个群里都有在找 deepseek 稳定的api供应商的信息,从这个层面说算力还是远远不够。
#DeepSeek #api供应商 #算力
avatar
Leo Xiang
6个月前
OpenAI Deep Research 输出的研报质量非常之高, 用它输出了两份我所在行业的分析报告,质量应该能赶上工作三年的分析师出的内容。 Deep Research 还只能从互联网上收集信息,如果能支持把私有数据喂给他进行二次创作,效果会更好。
#OpenAI #Deep Research #研报质量 #行业分析 #私有数据
avatar
Leo Xiang
6个月前
经过这几天的开发,RealtimeAI开源项目已经初具雏形,目前项目已经支持了Gemini Multimodel live API 和 OpenAI Realtime API。 主要包括三部分: - AI SDK (WebRTC): 在客户端侧通过WebRTC协议捕获音视频流并进行处理,如音视频编码、部分前置推理等; - WebRTC Gateway:主要负责信令管理、NAT/防火墙穿透、转发媒体流等工作.; - AI Service :提供实时推理或实时数据处理能力,如语音识别、图像识别、实时字幕、语音合成、实时大模型交互; 项目地址:
#RealtimeAI #开源项目 #Gemini Multimodel #OpenAI Realtime API #AI SDK #WebRTC #WebRTC Gateway #信令管理 #音视频处理
avatar
Leo Xiang
7个月前
让Operator 去抓取X Timeline 上的10条内容,Operator操作半天给我返回了几条Post的链接,短期之内可能都是用来做做demo,到真正产生生产力还有很长路要走。 1、Operator 会在云端记录你的Session,比如之前登录过再次登录就不需要密码,但这个安全性怎么保证? 2、Operator 目前的能力还是只能完成点一点,输入文本类似的操作,更复杂的操作就无能为力了。
#Operator #X Timeline #demo #生产 #安全性 #能力 #操作
avatar
Leo Xiang
7个月前
在Deepseek R1 之前,OpenAI 的O1还是领先中国的大模型厂商一代,R1出来之后已经不存在代际差了。 OpenAI如何说服大家购买他的200$ 每月的Pro?
#DeepSeek R1 #OpenAI #大模型 #代际差 #Pro订阅
avatar
Leo Xiang
7个月前
给Gemini 2.0 增加了WebRTC的支持, 实现了类似 OpenAI Realtime API with WebRTC 的方案. Gemini with WebRTC,Like OpenAI Realtime API with WebRTC. 代码开源:
#Gemini2.0 #WebRTC #OpenSource #OpenAI #RealtimeAPI #Technology
avatar
Leo Xiang
7个月前
早晨醒来一想到我的ChatGPT Claude 以及 Cursor还没开始干活就有点愧疚,浪费了这个时代对我们的馈赠。
#ChatGPT #Claude #Cursor #生活 #生产力 #现代技术
avatar
Leo Xiang
7个月前
本周日的直播分享: 超越对话:OpenAI & Gemini实时API构建智能音视频应用
#OpenAI #Gemini #API #智能音视频 #技术分享
avatar
Leo Xiang
7个月前
看到一个语音聊天助手的prompt,分享给大家, 尤其是第四条,让大模型来引导聊天内容,整个对话轮次就上来了。
#语音聊天助手 #引导聊天内容 #聊天对话轮次
avatar
Leo Xiang
7个月前
写代码的时候我会Cursor 和 Claude App混着用,Cursor中有的问题解决不了,反而Claude 能给出更好的代码, 不确定Claude App中加入了什么样的魔法。
#Cursor #Claude App #写代码 #问题解决
avatar
Leo Xiang
7个月前
最近用的比较好的一个Cursor小特性: NotePads 比如最近开发Realtime API的SDK, 就把Realtime API 相关的文档放到NotePads中,Cursor就能自动学习到最新的Realtime API相关的知识了。
#Cursor小特性 #NotePads #Realtime API #SDK #文档管理
avatar
Leo Xiang
8个月前
用Cursor分别用js(通过浏览器) 和 golang 实现了 Realtime API with WebRTC 的通信过程: 1、在浏览器中WebRTC 资料比较多,完全依赖Cursor就能实现。 2、用golang在实现的过程中涉及到音频的采集和播放,遇到portaudio的编译 以及 pion的版本问题,这个时候需要人来一步步来debug,cursor 作为那个实施的人,不过效率也高了很多。
#Cursor #js #golang #WebRTC #浏览器 #音频采集 #portaudio #pion #debug
avatar
Leo Xiang
10个月前
最近深度使用 Napkin,这个工具很不错,大模型 + 图表方向潜力还非常大, 如下图:几分钟就可以出一个。 Napkin 的实现思路有伙伴研究过的没?
#Napkin #大模型 #图表工具 #科技创新 #数据分析
© 2025 news.news. All rights reserved. 0.04691 秒. v1.0.46
我的评论