时政
财经
科技
虚拟货币
其他
登录
Leo Xiang
关注
统计数据
69
文章
0
粉丝
0
获赞
195
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
Leo Xiang
3个月前
每天通过Chatgpt 学习一个小时,很快就能初步了解一个方向:
#ChatGPT
#学习
#人工智能
#自我提升
分享
评论 0
0
Leo Xiang
3个月前
OpenAI 在协议定义上还是有号召力,Realtime API 的规范也基本成为标准了,看到多家的端到端方案都采用了Realtime API标准,或者是修改版的Realtime API 标准。
#OpenAI
#协议定义
#Realtime API
#标准化
#端到端方案
分享
评论 0
0
Leo Xiang
3个月前
好消息是:gemini live api 支持中文了 坏消息是: 中文tts效果基本没法听
#gemini live
#API
#中文支持
#TTS
#语音合成
分享
评论 0
0
Leo Xiang
5个月前
OpenAI Agent SDK 仓库中有一个"Research Agent" 的实现, 流程如下: 1、用户输入研究主题。 2、planner_agent 制定搜索计划,列出查询词及其理由。 3、search_agent 并行执行搜索,使用 Web Search 工具获取并总结结果。 4、writer_agent 整合搜索摘要,生成最终报告。 ChatGPT 的 DeepResearch应该也是这个流程,用了更好的模型 + 更好的工程化。
#OpenAI
#Agent SDK
#Research Agent
#搜索流程
#聊天机器人
#DeepResearch
#AI技术
分享
评论 0
0
Leo Xiang
5个月前
OpenAI 这套开发工具把Agent开发需要的基础能力都提供了,搜索、RAG、意图识别、内容审核、Computer use 以及 Browser use,整个Agent开发的成本瞬间降低了很多。 预期可见的会出来一批Agent方向的产品。
#OpenAI
#开发工具
#agent
#搜索
#RAG
#意图识别
#内容审核
#Computer use
#Browser Use
分享
评论 0
0
Leo Xiang
6个月前
国内大模型公司To B不好做了,大家需求很一致,效果对齐deepseek 或者 直接部署deepseek。
#国内大模型公司
#To B市场
#市场需求
#效果对齐
#技术部署
#DeepSeek
分享
评论 0
0
Leo Xiang
6个月前
看到好几个群里都有在找 deepseek 稳定的api供应商的信息,从这个层面说算力还是远远不够。
#DeepSeek
#api供应商
#算力
分享
评论 0
0
Leo Xiang
6个月前
OpenAI Deep Research 输出的研报质量非常之高, 用它输出了两份我所在行业的分析报告,质量应该能赶上工作三年的分析师出的内容。 Deep Research 还只能从互联网上收集信息,如果能支持把私有数据喂给他进行二次创作,效果会更好。
#OpenAI
#Deep Research
#研报质量
#行业分析
#私有数据
分享
评论 0
0
Leo Xiang
6个月前
经过这几天的开发,RealtimeAI开源项目已经初具雏形,目前项目已经支持了Gemini Multimodel live API 和 OpenAI Realtime API。 主要包括三部分: - AI SDK (WebRTC): 在客户端侧通过WebRTC协议捕获音视频流并进行处理,如音视频编码、部分前置推理等; - WebRTC Gateway:主要负责信令管理、NAT/防火墙穿透、转发媒体流等工作.; - AI Service :提供实时推理或实时数据处理能力,如语音识别、图像识别、实时字幕、语音合成、实时大模型交互; 项目地址:
#RealtimeAI
#开源项目
#Gemini Multimodel
#OpenAI Realtime API
#AI SDK
#WebRTC
#WebRTC Gateway
#信令管理
#音视频处理
分享
评论 0
0
Leo Xiang
7个月前
让Operator 去抓取X Timeline 上的10条内容,Operator操作半天给我返回了几条Post的链接,短期之内可能都是用来做做demo,到真正产生生产力还有很长路要走。 1、Operator 会在云端记录你的Session,比如之前登录过再次登录就不需要密码,但这个安全性怎么保证? 2、Operator 目前的能力还是只能完成点一点,输入文本类似的操作,更复杂的操作就无能为力了。
#Operator
#X Timeline
#demo
#生产
#安全性
#能力
#操作
分享
评论 0
0
Leo Xiang
7个月前
在Deepseek R1 之前,OpenAI 的O1还是领先中国的大模型厂商一代,R1出来之后已经不存在代际差了。 OpenAI如何说服大家购买他的200$ 每月的Pro?
#DeepSeek R1
#OpenAI
#大模型
#代际差
#Pro订阅
分享
评论 0
0
Leo Xiang
7个月前
给Gemini 2.0 增加了WebRTC的支持, 实现了类似 OpenAI Realtime API with WebRTC 的方案. Gemini with WebRTC,Like OpenAI Realtime API with WebRTC. 代码开源:
#Gemini2.0
#WebRTC
#OpenSource
#OpenAI
#RealtimeAPI
#Technology
分享
评论 0
0
Leo Xiang
7个月前
早晨醒来一想到我的ChatGPT Claude 以及 Cursor还没开始干活就有点愧疚,浪费了这个时代对我们的馈赠。
#ChatGPT
#Claude
#Cursor
#生活
#生产力
#现代技术
分享
评论 0
0
Leo Xiang
7个月前
本周日的直播分享: 超越对话:OpenAI & Gemini实时API构建智能音视频应用
#OpenAI
#Gemini
#API
#智能音视频
#技术分享
分享
评论 0
0
Leo Xiang
7个月前
看到一个语音聊天助手的prompt,分享给大家, 尤其是第四条,让大模型来引导聊天内容,整个对话轮次就上来了。
#语音聊天助手
#引导聊天内容
#聊天对话轮次
分享
评论 0
0
Leo Xiang
7个月前
写代码的时候我会Cursor 和 Claude App混着用,Cursor中有的问题解决不了,反而Claude 能给出更好的代码, 不确定Claude App中加入了什么样的魔法。
#Cursor
#Claude App
#写代码
#问题解决
分享
评论 0
0
Leo Xiang
7个月前
最近用的比较好的一个Cursor小特性: NotePads 比如最近开发Realtime API的SDK, 就把Realtime API 相关的文档放到NotePads中,Cursor就能自动学习到最新的Realtime API相关的知识了。
#Cursor小特性
#NotePads
#Realtime API
#SDK
#文档管理
分享
评论 0
0
Leo Xiang
8个月前
用Cursor分别用js(通过浏览器) 和 golang 实现了 Realtime API with WebRTC 的通信过程: 1、在浏览器中WebRTC 资料比较多,完全依赖Cursor就能实现。 2、用golang在实现的过程中涉及到音频的采集和播放,遇到portaudio的编译 以及 pion的版本问题,这个时候需要人来一步步来debug,cursor 作为那个实施的人,不过效率也高了很多。
#Cursor
#js
#golang
#WebRTC
#浏览器
#音频采集
#portaudio
#pion
#debug
分享
评论 0
0
Leo Xiang
10个月前
最近深度使用 Napkin,这个工具很不错,大模型 + 图表方向潜力还非常大, 如下图:几分钟就可以出一个。 Napkin 的实现思路有伙伴研究过的没?
#Napkin
#大模型
#图表工具
#科技创新
#数据分析
分享
评论 0
0
上一页
1
2
3
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞