sitin

统计数据

790

文章

0

粉丝

0

获赞

11968

阅读

2个月前

副业心态小贴士 1.别怕没结果 —— 账号被封、没坚持下来这些 “坑”，都是下次做项目的经验，不是白干。 2.别急于放弃 —— 干几天没效果很正常，能多坚持几个月就多坚持，真不行再换也不迟。 3.先想清目标 —— 琢磨下未来 5-10 年想要的状态（比如自由职业、当高管），有方向才好坚持。 4.别给自己太大压力 —— 大部分人都是兼职做副业，又不是 “不做就活不下去”，放轻松反而能做好。

独立创业者如何突破零收入困境，迈向月入1000元· 307 条信息

#副业 #心态 #坚持 #目标 #压力

2个月前

自从做了 AI 出海后，整个玩法多了很多，人还是要走出去，不要固步自封啊👍

上海哥飞分享会：年轻创业者的出海故事与挑战· 52 条信息

#AI出海 #海外 #积极

2个月前

DeepSeek推出全新视觉文本压缩模型DeepSeek-OCR，专注于通过光学压缩技术高效处理长文本内容。模型参数仅3B，采用混合专家架构，视觉token数量减少20倍，压缩比达20倍，20个节点每天可处理3300万页数据。在Foxbenchmark测试中，各文本长度区间准确率超85%。支持多种分辨率配置、多语言处理、复杂图表解析等多模态能力，可在多轮对话中实现10倍压缩效率。 DeepSeek-OCR的主要功能 1.视觉文本压缩：将长文本内容通过视觉模态进行高效压缩，实现7-20倍的压缩比。 2.多语言OCR：支持近100种语言的文档识别，包括中文、英文、阿拉伯文、僧伽罗文等。 3.深度解析：能解析图表、化学公式、几何图形等复杂内容。 4.多格式输出：支持带布局的Markdown格式和无布局的自由OCR格式。

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#DeepSeek-OCR #视觉文本压缩 #多语言OCR #图表解析 #3B模型

2个月前

World Labs 发布一个全新的实时生成式世界模型只需一张 H100 GPU即可持续生成一个“真实的虚拟世界” 一张 H100 就能跑到 30–60FPS 的交互帧率，你在浏览器里就能自由转动视角、来回走，画面依然 3D 一致、不会散架。这是官方研究预览+在线 Demo 的能力定位。它跟以前的视频/3D 有啥不一样？不搭网格、不堆体素：不走 NeRF、Mesh 那套显式几何管线，直接从图像学“世界”，然后从任意新视角吐出下一帧。听起来像“会画画的相机”。实时可交互：你动视角它就画下一帧，并且记得你之前看过哪里，回头再看还是那样——官方把这种机制称为空间记忆/上下文调度（context juggling）。单卡可玩：目标就是单张 H100 实时。行业媒体和开发者圈也在验证与传播这个点。底层是一个自回归的 Diffusion Transformer：像“时间上的 GPT + 空间里的渲染器”。它会把你给的 1–N 张图编码进“世界记忆”，之后每动一下相机就预测“下一帧”，并把新帧再写回记忆里，既连续又一致。能拿来干嘛？游戏/互动内容：动态场景、关卡草图，艺术家边走边预览。 AI 智能体训练：更便宜的可交互环境。 AR/VR 与数孪生：从少量图片快速“生”出可探索空间。这些都是官方与报道里强调的典型方向。 RTFM = 生成式世界引擎雏形：不搭显式 3D，直接从图像里学世界；单卡实时、可交互且持久一致。如果你做游戏、智能体、AR/VR，值得马上关注和试用。

#生成式世界模型 #H100 GPU #实时渲染 #AI 交互 #虚拟世界

2个月前

今年创业最爽的事，就是 AI 能力提升带来的门槛下降：不确定性少了、试错成本低了，确定性就上来了。

#AI #创业 #门槛下降 #确定性 #积极

2个月前

Google 推出「Grounding with Google Maps」功能将 Gemini 接入Google Maps，你的问题涉及地理、路线、商户、区域时，模型会自动调用 Maps 数据来补全事实，再用自然语言组织答案。对开发者来说就是：开个开关，回答就“接地气”了特点： 1.准确且能感知位置的回答：利用 Google 地图广泛且最新的数据来回答地理位置特定的查询。 2.增强个性化功能：根据用户提供的位置信息量身定制推荐和信息。 3.上下文信息和 widget：用于在生成的内容旁边渲染互动式 Google 地图 widget 的上下文令牌。能力： 1.旅行/行程规划：不只是“随口推荐”，它会看距离、路程时间、开放时间、评分，给出能落地执行的行程表，并且能回一个可嵌入的交互地图。 2.本地化推荐：比如“在纽约找适合带娃的社区”，它会把周边学校、公园、医院、交通一并考虑，给出“城市画像”式建议。 3.空间问答： “这家咖啡店有户外位吗？”“银座这家餐厅周末几点关门？”——答案来自 Maps 的店铺详情和用户评论，可验证、可追溯。 4.行业/商业智能：门店选址、配送路径优化、商圈分析、地理感知客服，AI 不再只会写文案，开始理解“位置 + 时间”的业务变量。怎么用：在 Gemini API 请求里启用 Grounding with Google Maps 工具，模型会在需要时自动查地图数据；AI Studio 里有现成 Demo 可直接试。能配什么：限制经纬度范围、控制地图组件显示、定制返回字段（营业时间、照片、评分等）。支持与覆盖：Vertex AI 与 Gemini API 路线都在推进，覆盖 250M+ Places；支持 2.5 Pro/Flash/Flash-Lite 等型号（以官方清单为准）总结：AI 从“语言智能”迈进“空间智能”：它不仅知道“是什么”，还明白“在哪、怎么去、多远、怎么安排”。这一步，直接把很多 AI 应用从“文本层”推到了真实世界的可执行层。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Google Maps #Gemini #Grounding with Google Maps #空间智能 #本地化推荐

2个月前

Manus 1.5它开始像一个真正能干活的生产力系统，而不只是聊天的 AI。不仅能生成页面，而是能从零搭建、配置并部署完整的 Web 应用，这是 1.5 版本的核心突破。现在只需要用“说话”的方式告诉它： “帮我做一个能让用户注册、登录、上传照片，还能跟 AI 聊天的应用。” 它就能自动：写出前端 + 后端代码；配置好数据库；处理好用户登录验证；集成 AI 功能；设置通知系统；绑定自定义域名；一键部署上线全程你不用写任何配置脚本，动嘴就行。两个很实用的团队功能：实时协作：多人可以同时在一个会话中和 AI 一起工作，边聊边改，就像用 Google Docs 写文档一样自然。集中资料库：所有生成的文件、报告、设计、代码都会自动保存、归档，还能版本管理，慢慢就形成你们团队自己的“知识资产库”。这样一来，Manus 不再只是个人用的 AI 工具，而是一个团队的「AI 工作空间」。总结一下： Manus 1.5 已经从一个单纯的 AI 助手，进化成了一个能听懂、能思考、能执行、还能协作的「智能开发伙伴」。

#Manus 1.5 #AI Web应用 #低代码开发 #团队协作 #知识资产库

2个月前

开启了 chrome 浏览器插件的开发工作了，还好有 Claude code，让我这个不懂插件开发的都可以开发了🥳

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#chrome浏览器插件 #Claude Code #插件开发 #积极 #编程

2个月前

AI 出海做产品心态稳蛮重要的，不是简简单单接个单子，卖个虚拟资料，至少准备 3 个月投入再说，接单卖资料是副业，停了就断。出海做产品是事业，沉淀才有复利

独立创业者如何突破零收入困境，迈向月入1000元· 307 条信息

#AI出海 #产品心态 #长期投入 #事业沉淀 #复利

2个月前

分享几个觉得又实用、又有意思的开源项目，GitHub 上都能找到。 1、爬虫开源工具——Crawlee 这个项目在 GitHub 上快 2 万 Star 了，是个用 Node.js（还有 Python 版本）写的网络爬虫框架。它最大的特点就是：爬虫行为更像真人，不容易被网站的反爬机制拦住。比如你想抓 TikTok、YouTube 这类动态内容，它都能搞定。而且自带 CLI 工具，一键生成项目结构，给你现成的模板。支持 HTTP 请求，也能配合 Playwright 这种浏览器自动化工具去抓复杂网页，内置了代理切换、请求队列、错误重试、数据存储…… 用一句话总结：非常适合想写爬虫但又不想造轮子的同学。 2、屏幕录制工具——Cap Cap 是一个开源版的 Loom（就是那个录屏 + 视频分享工具）。它能同时录屏幕和摄像头，还支持跟随鼠标放大，录完能直接剪辑、导出 MP4 或生成链接分享。最关键的是：它有 Web 和桌面两个版本。Web 版可以自己部署，桌面版还能连接到你自己的 Cap 服务。 3、开源压缩工具——PeaZip PeaZip 是一款跨平台压缩解压工具，支持 Windows、macOS、Linux，能处理超过 200 种格式，包括 zip、rar、7z 这些常见的，还有分卷压缩文件。它除了基本功能，还特别注重隐私和安全，支持加密、两步验证、安全删除，还有哈希校验、脚本导出等高级功能。说白了，就是一个开源、无广告、比 WinRAR 更干净的压缩工具。

#开源项目 #爬虫工具Crawlee #屏幕录制工具Cap #压缩工具PeaZip #实用

2个月前

Github 4.7k star，一款让你可以不用 Figma 也能写 Prompt 画界面的开源神器！分享一个很有意思的开源项目：SuperDesign。一句话，它让你不用跳去 Figma，在 IDE 里写一行 prompt 就能把界面画出来，还能直接导出可用的组件/代码。GitHub 已经有 4.7k+ Star 了。它解决了什么痛点？我们平时写前端，写代码一套、改界面一套。按钮、表单、布局来回折腾，甚至还要和设计对齐。做个原型，沟通成本超高。 SuperDesign 的思路很简单：在 IDE 里直接“说人话”→ 自动出线框/组件/代码。省去来回切换。它到底是什么？一个嵌在 IDE 里的 AI 设计智能体（AI Design Agent）；你描述：“来个现代风的登录页，有 logo、两个输入框、一个登录按钮”，它几秒钟在侧边就给你界面结构、线框、配色建议，还能生成组件文件，项目里直接复用。适配环境 VS Code、Cursor、Claude Code、Windsurf 都能用。已经用 Cursor 或 Claude Code 的同学，几乎是无缝衔接。 5 个亮点，快速记住 1.一行 prompt 出整页：登录、注册、设置页都能一把梭。 2.不止能看，还能用：自动生成结构化组件，丢进项目继续调样式。 3.多 IDE 兼容：你用啥它认啥。 4.模型可选：本地模型（LM Studio）、OpenAI、OpenRouter 都能接。 5.开源 + 本地落地：没有订阅门槛，产物都在项目的 .superdesign/ 里，版本管理很友好。怎么上手？在 VS Code / Cursor 插件市场搜 SuperDesign，安装。打开左侧 SuperDesign 面板（Cursor 里 Cmd+Shift+P → superdesign: open canvas）。输入提示词，就能看到界面、线框、组件；一键导出代码用在项目里。小技巧：在项目根目录建一个，把你常用的提示词模板放进去，风格会更稳定。我个人的感受 SuperDesign 不是要替代设计师，它是把“能落地的界面结构”更快摆到你面前。从 Cursor、Claude Code，到现在的 SuperDesign，AI 已经不只是“写代码的”，它开始把设计、实现、联动串成一条龙。未来很可能是：你说一句需求，IDE 就把页面和组件都搭起来了。

#AI设计 #IDE #SuperDesign #界面生成 #开源

2个月前

做产品的好处就是他是一个资产一直放在那儿，被动的产生收益，虽然慢但是有，不用天天吆喝，用的好会有自发传播

#AI掘金：知识付费新机，流量为王时代· 244 条信息

#产品 #资产 #被动收益 #自发传播 #长期价值

2个月前

Claude skills 开干

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude #skills #开干

2个月前

我的 6 年小破公司一点小经验： 1. 现金为王，没有钱啥都不是，分分钟回去上班 2. 不排斥营销，刚开始太排斥，宁愿不赚钱也不接广告，少赚了不少，赚钱不寒碜，只要不做违法乱纪的。 3. 脱下孔乙己长衫，刚出来的时候自以为是觉得技术 yyds，看不起人家做销售做营销的，眼光狭隘 4. 做 ip 私域高客单，别做低客单要累死 5. 别 all in，先多跑两个副业项目，虽然赚的可能没有单一项目多，但是安全 6. 要低头赶路，也要抬头看天，多和外界沟通，请教，参与活动，

独立创业者如何突破零收入困境，迈向月入1000元· 307 条信息

#现金为王 #营销重要性 #摆脱自视清高 #高客单价 #副业分散风险

2个月前

从 stripe 到水星银行提了一笔钱美金💲就说我开通这个 instant payouts，现在可以随时把 Stripe 账户里的钱“秒提”到绑定的银行账户里，而不需要等正常的 7 天结算周期，手续费高一点

#Stripe #水星银行 #instant payouts #秒提 #手续费高

2个月前

Sora 2 史诗级更新来了！免费用户：现在最多可生成 15 秒视频（App 和 Web 都行）。 Pro 用户：最多可生成 25 秒（目前多数媒体与实测称 Web 端支持 25 秒，上限以官方页面为准）。故事板（Storyboard）：已在网页端向 Pro 开放 Beta，可按秒级分镜控制；在“composer”里选择 Storyboard 入口即可。实操建议： 1.先用短版试镜（5–10s）确定风格，再拉长到 15/25s； 2.每个分镜写清主体/动作/景别/镜头运动四要素； 3.复杂叙事用“多段生成+故事板拼接”，稳定性更好。 ps：25 秒目前以网页端 Pro 为主，官方仍在迭代，实际上限请以生成页提示为准。

#Sora 2 #视频生成 #故事板 #pro用户 #更新

2个月前

讯飞星火“深度研究”功能全新升级，实现底层思维链路、信息融合与内容呈现的全方面进化。功能通过多轮思考和搜索迭代，深度理解用户意图，提升内容质量;支持输出高质量图片，新增HTML网页导出与一键转PPT功能;结合外部搜索信源和本地文档，实现个性化思考。三个关键点： 1.自我反思 + 多轮搜索：像分析师一样边想边查，结论都有来源。 2.知识库 RAG + 信源 MCP：把你自己的 PDF/Word/报告喂进去，生成内容自动结合内部资料 + 外部权威。 3.成果呈现：报告不止文字表格，还能自动配图，并且一键转 PPT / 导出 HTML 网页。一句话：一杯咖啡的时间，搞定“从研究到交付”。

#讯飞星火 #深度研究 #功能升级 #知识库RAG #效率工具

2个月前

1. 我的小破公司 6 周年了，真的不容易，磕磕碰碰，没事真别去创业，也不知道多少个焦虑的日夜也没想到自己折腾这么久，到现在也开始了产品之路，放在 6 年前是不敢想的，真的得益于 AI 的发展，大大降低了门槛。比较理想就是在公司上班有一份轻松工作，自己做点副业小生意啥的。 2. AI 出海找到一个绕过 cloudflare 的服务 browserless的服务很牛逼，自动化厉害推荐给大家 3. 白天把18 年的苹果电脑拿去重装了系统作为备用机，用了这么多年还是苹果最好用，从 13 年到现在最新的 M3已经是第 4 个苹果了。真的算是走过了我的一路。

#创业不易 #AI #产品之路 #苹果电脑 #browserless

2个月前

想骂人有没有🤣🤣

#想骂人 #负面情绪 #表达不满

2个月前

免费用户别养、免费群别建，做了这么长时间的知识付费，也明白一个道理——别跟“白嫖型”纠缠：时间成本不在一个水平。要做，就两条路：一条是低客单价、全自动、走量。能机器就机器，能文档就文档，售前售后都别上人。另一条是高客单价、私域、极致服务。加门槛，先筛选，时间只给真正珍惜你时间的人。为什么不要“免费用户思维” 不尊重时间：动不动上来指点江山，连最基础的自测都不愿意做。没有付费意愿：就算用了也不转化，反而占带宽、踩节奏。沟通风险高：你回一句，他能回十句；你赢了，也是输了——时间被榨干。 “他们有的是时间跟你扯；你不是输在道理，是输在“每分钟的价值”。” 公域和免费群最容易掉坑。免费群就是情绪黑洞，话题乱飞、管理成本爆炸。与其守着群被薅，不如把公域内容做清楚，CTA写明白，快进快出，把人导到能转化、能沉淀的闭环里。处理这类人的方法也别复杂：不理，静默删除。不吵架，不截图，不对线。减少接触面，风险最低。做自媒体、做培训，这几年我见太多：要积分、要优惠、要资源、要“特殊照顾”的比比皆是。你要有边界感。不是所有需求都要回，不是所有人都该你服务。把精力放在产品打磨、内容生产、付费用户复购上，别被个体情绪牵着走。怎么做： 1.关免费口子：免费群不建；已有的逐步冷却或清退。 2.设门槛：小额付费试用/问卷筛选/资料审核，先过滤再服务。 3.统一回应：常见问题用文档和视频，自动回复搞定；一对一“免费咨询”一律谢绝。最后再强调一遍：做内容、做产品、做服务，本质就是分配自己的时间。把时间给愿意投入的人，其他一律按下快进键。你守住边界，业务就会更稳、更快。

独立创业者如何突破零收入困境，迈向月入1000元· 307 条信息

#知识付费 #时间管理 #用户筛选 #避免白嫖 #提升效率

2个月前

技术是杠杠，自媒体也是杠杠没有非黑即白，做了这么多年依然觉得自媒体是普通人做容易起步的没有之一

独立创业者如何突破零收入困境，迈向月入1000元· 307 条信息

#技术 #自媒体 #普通人 #起步容易 #中性

2个月前

前特斯拉AI总监Karpathy推出开源项目"nanochat"，仅用约8000行代码复现ChatGPT全流程。项目在GitHub上线不到12小时，星标数已破4.2k。用户只需一台GPU、约4小时和100美元成本，就能训练出一个能写诗、回答基础问题的“小型ChatGPT"。 nanochat的主要功能分词器训练：使用Rust语言实现训练分词器，负责将文本转换为符号码本序列。预训练：在FineWeb数据集上对Transformer架构的大语言模型进行预训练，并通过CORE指标评估模型性能。中期训练：在SmolTalk用户-助手对话数据集、多项选择题数据集、工具使用数据集上进行中期训练，使模型适应对话场景。监督微调（SFT）：在世界知识多项选择题数据集（ARC-E/C、MMLU）、数学数据集（GSM8K）、代码数据集（HumanEval）上进行监督微调，提升模型在特定任务上的表现。强化学习微调（RL）：使用“GRPO”算法在GSM8K数据集上对模型进行强化学习微调，进一步优化模型性能。推理部署：实现高效模型推理，支持KV缓存、简易预填充/解码流程、工具使用（轻量级沙箱环境中的Python解释器），并通过CLI或类ChatGPT的WebUI与模型交互。成绩单生成：生成单一的Markdown格式报告卡，总结整个训练推理流程，并以“游戏化”形式展示结果。 Github仓库：

前特斯拉AI总监推出100美元ChatGPT克隆项目引发热议· 5 条信息

#Karpathy #nanochat #开源项目 #ChatGPT复现 #AI

2个月前

Claude Haiku 4.5 刚发（小模型），但实力一点不“迷你”。性能≈五个月前的旗舰 Sonnet 4 速度翻倍（体感就是同样任务等一半时间）价格更便宜（输入 $1/百万 tokens，输出 $5/百万 tokens）有些场景甚至反超 Sonnet 4 特点： 1）性能不“迷你” 编程：Agentic coding（SWE-bench）73.3%、Terminal coding 41.0%，几乎和 Sonnet 4（72.7%、36.4%）打平。数学：Python 工具开着 96.3%，关工具 80.7%，小模型里很能打。 Computer Use（电脑操作）：OSWorld 50.7%，直接超 Sonnet 4 的 42.2%。这块确实有点惊喜。 2）速度真的快官方说 more than twice the speed。实际感觉：Claude Code 写代码、跑任务，等待时间直接砍半。如果你做 API 应用，延迟下降的价值，很多时候比省钱更关键。 3）更省钱、更好上手价位：对比 Sonnet 4，整体便宜三分之一。输入：$1 / 1M tokens 输出：$5 / 1M tokens 接入渠道：Claude API、Amazon Bedrock、Google Cloud Vertex AI、Claude Code、网页端 / App……基本能用 Claude 的地方都能切换 Haiku 4.5。模型名：claude-haiku-4-5 4）安全性更稳 Haiku 4.5 被官方评为目前最安全的 Claude 系列模型之一：自动对齐评估里，误对齐行为比例更低（比 Sonnet 4.5、Opus 4.1 还低）。 ASL-2 分级（CBRN 风险评估表现好）；而 Sonnet 4.5 / Opus 4.1 是更严格的 ASL-3。适合谁？高频调用 / 算力敏感：比如代码助手、数据处理、对话式业务逻辑，想要更低成本 + 更低延迟。需要“电脑操作”能力的自动化工作流：浏览器/系统级任务编排更稳了。团队大规模接入：同预算撑起更多调用量。一句话总结五个月前，Claude Sonnet 4 是最先进的型号。如今，Claude Haiku 4.5 提供类似的编码性能，但价格仅为其三分之一，速度却提升了一倍多。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude Haiku 4.5 #小模型 #性能提升 #速度翻倍 #低成本

2个月前

每次开发比较爽就是 Claude code 自动提示我怎么去找配置，然后直接发给他，自动配置好，真的很感动现在开发太方便了

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude #code自动提示 #开发便利 #配置 #感动

2个月前

本周被封了 4 个 Claude Max 号，不能好好写代码了

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude Max #账号封禁 #代码 #工作受阻 #负面

...