时政
财经
科技
虚拟货币
其他
登录
sitin
关注
统计数据
345
文章
0
粉丝
0
获赞
753
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
sitin
1周前
还是不能太依赖 AI。 今天差点翻车——付费充值页面旁边,居然有个“兑换码充值”,用户明明已经准备付款了,却被提示还能免费白嫖,不合逻辑啊。 更离谱的是,AI 还把我的付费充值入口放到登录后才能看到,这不是平白增加流失率吗? 幸好我自己多留了个心眼,发现了这两个坑。 所以啊,AI 再聪明,也得盯紧、核对,关键环节不能全放手。
AI技术引发伦理争议,专家呼吁加强监管· 30 条信息
#AI依赖
#付费充值
#用户流失
#风险控制
#人工核对
分享
评论 0
0
sitin
1周前
智谱发布并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V,总参数106B,激活参数12B。 模型基于智谱新一代文本基座模型GLM-4.5-Air,综合效果在41个公开视觉多模态榜单中达到SOTA水平,支持图像、视频、文档理解及GUI Agent等任务。 具备覆盖不同种视觉内容的处理能力,实现全场景视觉推理,包括: ·图像推理(场景理解、复杂多图分析、位置识别) ·视频理解(长视频分镜分析、事件识别) ·GUI 任务(屏幕读取、图标识别、桌面操作辅助) ·复杂图表与长文档解析(研报分析、信息提取) ·Grounding 能力(精准定位视觉元素)
智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限· 3 条信息
#智谱
#GLM-4.5V
#开源
#视觉推理模型
#多模态
分享
评论 0
0
sitin
1周前
全球搜索引擎里 Google 约 89.6% 份额,Baidu 只有 0.72%,Bing 都4.02%,想到差距,没想到差距这么大
#Google
#搜索引擎
#市场份额差距大
#Baidu
#Bing
分享
评论 0
0
sitin
1周前
创业带来的那种源源不断的内啡肽带来的成就感,和追剧时的多巴胺带来的情绪快感。两者完全不在一个维度上。
#创业
#成就感
#内啡肽
#追剧
#多巴胺
分享
评论 0
0
sitin
1周前
我去,人果然不能太熬夜,昨天晚上熬夜到1点。配置线上的支付环境,结果配置到另外一个网站上面去了。今天上午又花了一个小时找问题。 不过现在还好,遇到啥问题都有 AI 帮你全方位排错。以前写代码的时候都是靠自己摸索猜测,现在有 AI 辅助所有的环节走一遍之后,基本上一个小时以内啥卡点都能够被搞定。
#熬夜
#支付环境配置错误
#AI辅助
#效率提升
#积极
分享
评论 0
0
sitin
1周前
ChatGPT5 重新调整模型了,被大家吐槽新模型体验不够好
#ChatGPT5
#模型调整
#用户吐槽
#体验不佳
分享
评论 0
0
sitin
1周前
微软 Edge 浏览器推出Copilot 模式 内置AI助手和屏幕视觉功能 可跨标签页进行内容整合 Copilot 模式是 Microsoft Edge 浏览器中的 AI 助理体验,它将智能搜索、对话、任务执行和视觉理解功能整合在浏览器中,提供全新的网页使用方式。 让浏览器不只是“看网页”,而是“理解网页 + 帮你处理信息 + 生成内容”。 核心亮点如下: 1.跨标签页情境感知 经用户授权后,Copilot 可一次性读取所有打开的标签页,自动汇总、对比并给出下一步建议。例如同时打开多家酒店页面,可直接问“哪家离机场最近且含早餐”,AI 即时整合结果。 2.Copilot Vision 屏幕视觉 浏览器能“看见”当前屏幕内容并实时解析:阅读论文时生成要点,浏览商品时自动比价,观看视频时生成摘要并提炼评论区观点。 3.一站式任务托管 新标签页变成“搜索 + 对话”合一的输入框,用户用自然语言或语音即可下达复合任务,如“找北京 3 天内最便宜的东京航班并列出行李政策”,Edge 会自动搜索、整合并生成可点击的对比卡片。 4.极简交互与隐私控制 所有 AI 回答以侧边动态面板呈现,原始页面保持可见;微软强调仅在用户授权时访问浏览数据,并可随时关闭模式。 Copilot 模式现已内置在最新版 Edge,用户可在设置中一键开启体验。微软表示后续将继续迭代,并计划与 Copilot Pro 订阅深度结合
#微软 Edge 浏览器
#Copilot 模式
#AI 助手
#屏幕视觉功能
#跨标签页内容整合
分享
评论 0
0
sitin
1周前
创业这几年,最大的变化就是时间感被打碎:白天开会写代码,晚上答疑出方案,周末照样有人敲门。工作生活早就融在一起了,但我也不觉得这是坏事。 有人说,做到这个节奏还说“喜欢工作”,是不是有点装?但对我来说,这不是摆姿态——只是我真的享受这种状态:和一群人折腾有意思的事,看着它一点点成型,然后有人为它买单。
#创业
#时间感
#工作生活
#享受
#状态
分享
评论 0
0
sitin
1周前
刚给站点加了个 cron 自动化脚本,结果 GitHub 代码怎么都不同步到 Vercel。 排查 1 小时,最后才发现——Hobby 计划根本撑不起每分钟调度!🙃 注释掉 "crons" 瞬间恢复部署… 升级 Pro / 降低频率 / 外部 cron 三选一,否则就是坑。 ——记录一下,别像我一样逛了 60 分钟的“黑屋”😂
#GitHub
#Vercel
#cron 自动化脚本
#Hobby 计划
#部署失败
分享
评论 0
0
sitin
1周前
Magenta RealTime(Magenta RT)是 Google Magenta 项目推出的开源权重实时音乐生成模型,可让用户在创作、演奏时实时互动生成音乐。 一句话总结:它用 8 亿参数就能“边说边播”,在普通 Colab 免费 TPU 上,2 秒音频只需 1.25 秒生成,速度比播放还快,且直接输出 48 kHz 立体声 一、核心亮点 1.超实时 RTF>1:生成延迟低于播放速度,适合现场、直播、DJ 等即时场景。 2.2 秒切片 + 10 秒记忆:每 2 秒生成一段,同时回看过去 10 秒旋律,衔接自然不断流。 3.多模态“指挥”: • 文本提示:一句“来点赛博朋克紧张节奏”即可瞬间换风格。 • 音频提示:可上传参考音乐,实现实时流派/乐器变形。 4.开源可自托管:Apache 2.0 许可证,代码与权重已在 GitHub & Hugging Face 放出。 5.小身材大能量:0.8 B 参数,在免费 Colab 即可跑,48 kHz 立体声直接用于混音或现场。 二、技术架构速览 • 基于离散音频标记的 Transformer(8 亿参数)。 • 使用神经音频编解码器 SpectroStream,把波形转成紧凑标记;再经 MusicCoCa(音乐-文本多模态嵌入)把提示映射到同一语义空间。 • 训练数据:约 19 万小时免版权器乐,涵盖广泛流派,保证泛化与连贯性。 如果你想把 AI 变成随叫随到的“口袋 DJ”,现在就能把 Magenta RealTime 装进电脑或 Colab,立刻开玩。
#Magenta RealTime
#开源音乐生成模型
#实时互动音乐
#多模态音乐生成
#AI DJ
分享
评论 0
0
sitin
1周前
阿里小号要被注销了,刚刚趁着给阿里小号换绑电话,顺手翻了翻那几个“吃灰”已久的账号——结果吓一跳。 小红书后台堆了一墙的私信要资料,自己差点忘掉的抖音号也默默留着 4 W 粉丝在等更新。 账号越多,越要把内容当资产去管理,多平台分发是基本功; 真正有价值的内容不会被算法埋没,只要你还在输出,用户就一直在等。
#阿里小号注销
#小红书私信
#抖音账号运营
#内容资产管理
#多平台分发
分享
评论 0
0
sitin
2周前
用了 10 年的阿里小号,要关闭了, 最近还要盘点下我几百个账号的阿里小号 当时只是临时用用,没想到用成了主号
#阿里小号
#关闭
#账号
#怀旧
#不舍
分享
评论 0
0
sitin
2周前
最近我发现我的表达欲明显高了很多。 就是因为有了语音输入法,以前老感觉输出长文特别麻烦,都不想写,也不想分享—— 要写也是零零散散,根本没形成发朋友圈的习惯。现在就比较丝滑了。感谢好的工具,感谢好的产品,感谢豆包。 前几天豆包的商务经理和技术过来,我夸了他们6次。然后他们在说涛哥太喜欢我们的产品了,一定要跟我们合作起来, 他们在8月份还会放出很多比较厉害的模型,比如说通过一张图片加一个其他的视频,生成这张图的动作视频。 包括数字人也是特别厉害,比市面上的数字人的功能强大很多,豆包真的是很厉害 豆包的模型能力大概是在整个模型里面前五左右的,但是它的价格很便宜,大概是1/10都不到。
#语音输入法
#豆包
#产品体验
#AI模型
#性价比
分享
评论 0
0
sitin
2周前
MemU 是一个专为 AI 伴侣(AI Companion) 场景设计的 开源长期记忆框架,它的核心目标是让 AI 助手或虚拟伴侣拥有像人类一样的“记忆能力”,从而实现更自然、更连贯、更个性化的长期互动体验 MemU = 可读的“记忆文件系统” + 自动知识图谱 + 自适应遗忘 + 低成本快速检索,专为 AI 伴侣场景打造。 核心亮点 1.记忆文件系统 把每条记忆存成人类可读的“文档”,而非黑盒向量。 支持语义、关键词、上下文多种检索方式。 2.知识图谱式关联 自动把“上周看的电影”关联到“你喜欢的导演”“一起观影的朋友”,实现联想式回忆。 3.离线自我进化 AI 在不与你对话时,也会自动合并冗余记忆、生成主题总结、发现隐藏联系。 4.自适应遗忘 按访问频率动态降权或删除旧记忆,避免“信息垃圾场”,保持响应速度。 5.高精度 + 低成本 LoCoMo 数据集测试准确率 92.09%,通过批量处理可把 API 调用成本降低约 90% 适用场景 1.虚拟恋人/伴侣:记住你们的纪念日、共同话题、聊天风格。 2. AI 心理咨询师:长期追踪用户情绪变化,提供持续支持。 3.儿童陪伴机器人:记住孩子的成长轨迹、喜好、语言发展阶段。 4.品牌虚拟代言人:为每位用户打造“专属客服”体验
#AI伴侣
#长期记忆框架
#MemU
#知识图谱
#个性化互动
分享
评论 0
0
sitin
2周前
很多同学说,公域做好了,私域就不用管了。这个其实一个误区,我以前就是主要做公域,但是实际上我的变现能力一般,甚至一度时间都陷入了瓶颈。 但是我自从做了私域之后,我的变现能力就强了很多很多。 私域流量的价值更大,但是公域流量的话,算法推荐曝光更高,更容易起飞,用户对你的一个认知也还不错, 私域的话就是自己很真实,然后别人更愿意靠近你,而不是高高在上的大 v。 所以说大家在公域里面输出的时候,私域其实也不要停止,这样子会有很强的活人感。 有活人感,别人才能更好的靠近你,成为你。 公域是“冷流量池”,负责最大曝光;私域是“暖流量池”,负责高信任+高客单。
#AI掘金:知识付费新机,流量为王时代· 129 条信息
#公域流量
#私域流量
#变现能力
#用户信任
#活人感
分享
评论 0
0
sitin
2周前
stripe 自带的工具真好用,不需要 ngrok穿墙工具,对比其他支付,大公司出品就是不一样,几分钟就通了。
#Stripe
#支付工具
#ngrok
#穿墙工具
#大公司
分享
评论 0
0
sitin
2周前
一款专为普通照相馆设计的证件照后期AI自动化处理工具——LiYing,用户可以: 1.一键完成:抠图换底 → 尺寸裁剪 → 排版 → 压缩。 2,完全离线:模型和程序都在本地,不用担心隐私泄露。 3.多种打开方式:会命令行用 CLI,不会命令行点 BAT 或打开浏览器用 WebUI。 4.模型支持:人脸/人体/抠图三大模型全部开源,可按需下载。 5.注意:只适用于标准证件照,复杂背景或多人合照效果无法保证。
#证件照
#AI自动化处理
#离线
#抠图换底
#开源
分享
评论 0
0
sitin
2周前
这两天跟朋友聊天,聊到我今年在 AI 的深度使用,以及全力投入 AI 出海这件事。 我发现,对创业的掌控感前所未有地强,心态特别稳,状态也很在线。 以前的我,会因为一篇文章的小问题而纠结,会因为团队小伙伴的离职而痛苦,也会因为用户的退费而焦虑。 而现在,这些波动都不足以撼动我的节奏。 有人问:“是不是因为你在 AI 出海里赚到钱了?” 另一个朋友接话:“这就是鸡蛋放对了篮子的感觉。其他几个篮子就无所谓了” 当时我就觉得,这比喻太妙了。 当你抓住一个对的方向,其他篮子里的起伏,就都没那么重要了。
#AI
#AI出海
#创业掌控感
#心态稳定
#方向选择
分享
评论 0
0
sitin
2周前
很多人问,为啥我要每年花 200 多管理密码 一来密码快 600 个,每个密码不一样记不住 二来不同设备登录完全不方便 三来很多重要账号都有 2FA,如果没有 1p,每次登录扫码填写要累死。
#密码管理
#1password
#2fa
#账号安全
#效率工具
分享
评论 0
0
sitin
2周前
Google Gemini 应用上线了面向所有用户的新学习工具:Guided Learning,致力于增强批判性思维、深化理解并提升学习效率。 它不是一个“给答案”的工具,而是一个 AI 家教练,通过提问、互动、多媒体内容和分步讲解,引导学生主动思考、深度理解知识点。 1.三大配套功能 引导式学习:分步拆解难题、量身定制解释、支持上传个人资料。 可视化体验:自动配图、信息图、YouTube 视频,帮助理解抽象概念。 智能备考:自动生成抽认卡、学习指南,针对错题给出知识点与练习。 2.教育化设计 为教师提供可直接嵌入 Google Classroom 的链接,打造无评价、鼓励探索的学习环境。 3.技术底座 由 Google 专为学习优化的 LearnLM 模型家族支持,已集成进 Gemini 2.5。
Google Gemini 2.5发布引发AI模型性价比热议· 108 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 349 条信息
#Google Gemini
#Guided Learning
#AI教育
#批判性思维
#LearnLM模型
分享
评论 0
0
sitin
2周前
Google 宣布在 Gemini 应用中推出一个全新功能:名为 “Storybook” 的 AI 个性化插图故事书生成功能 仅需输入简短描述(如“一个关于勇敢小象的冒险”),系统自动生成 10 页图文故事书 支持 黏土动画、动漫、漫画、像素风等 多种艺术风格 。可上传图片(如孩子的画作),让 AI 以此为灵感创作专属故事 每页配有 AI 朗读旁白,支持 45+ 种语言(包括简体中文) 。支持 导出打印 或分享电子版 这一功能现已在全球 Gemini 应用中上线,支持 45 种以上语言,包括桌面端和移动端。
Google Gemini 2.5发布引发AI模型性价比热议· 108 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 349 条信息
#Google
#Gemini
#storybook
#AI
#个性化插图故事书
分享
评论 0
0
sitin
2周前
美国紫卡下来了 几个要点经验: 1. 紫卡 淘宝买新卡,可以自己设置密码方便安全 2. 设置 WiFi calling,省钱,100 分钟电话和短信免费,不然3.59 美金一分钟 3. 手机 vpn 设置美国ip 4. 电脑 web 网页,不用 vpn ,正常 ip 预充值避免没钱停机,用 visa 卡充值或者海外卡,淘宝也可以
#美国紫卡
#淘宝
#WiFi calling
#VPN
#预充值
分享
评论 0
0
sitin
2周前
如果你们用的 GPT5 不习惯,难受不舒服,恰好你又是 200 美刀一个月的 pro 用户,可以改为传统模型 O3。难受一天了
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 349 条信息
#GPT5
#O3模型
#用户体验
#pro用户
#模型切换
分享
评论 0
0
sitin
2周前
ElevenLabs发布了一款强大的AI音乐生成工具“Eleven Music”,它能够根据用户简单的文字描述,快速生成高度自定义、高质量、可编辑、多语言的音乐作品,适用于各种创作和商业场景。 用户只需输入简单的文本提示(Prompt),描述想要的音乐风格、情感、场景、乐器、节奏等(如“慢节奏的梦幻电子音乐,有点神秘感”或“充满活力的摇滚乐”),AI就能自动生成符合要求的高质量完整音乐作品。 支持对生成的音乐进行修改,包括编辑歌词(添加或修改)、调整声音、改变结构等。可以编辑单个段落或整首歌曲。 多语言支持,生成一首完整的音乐作品仅需几分钟,生成的音乐音质达到专业级的44.1kHz,媲美录音室制作。
#AI音乐生成
#elevenlabs
#Eleven Music
#音乐创作
#多语言支持
分享
评论 0
0
sitin
2周前
GPT5 来了!第一时间问了 AI编程出海, 相比 GPT-4,GPT-5 在 推理能力、准确性、减少幻觉(hallucinations) 方面有显著改进,速度更快 API 版本:提供 GPT-5、GPT-5-mini 和 GPT-5-nano 三种模型,支持 文本和图像输入,输出为文本,上下文长度达 272,000 tokens 能更好地执行长链工具和 API 调用,适合自动化代理任务,被认为是 OpenAI 最强的编程模型,擅长处理复杂代码任务 相比 GPT-4o,GPT-5 的幻觉率降低 26%,而 GPT-5-thinking 版本降低 65% 目前,ChatGPT Pro 用户(每月 200 美元):可无限制使用 GPT-5,并额外获得 GPT-5-pro 和 GPT-5-thinking(增强推理版本) 对普通人搞钱机会, 工作室快速 MVP, 垂直Copilot、自动化 agent, Shopify/Notion插件变现。下周 AI 出海开课,一起出海干美刀!
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 349 条信息
#GPT-5
#AI编程
#出海
#自动化代理
#ChatGPT Pro
分享
评论 0
0
上一页
1
2
3
4
5
6
7
8
9
10
11
12
13
14
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞