时政
财经
科技
虚拟货币
其他
登录
#自然语言生成
关注
Geek
3周前
号称是 "Chat-while-drawing" (边聊边画) 的神器 只要用自然语言描述需求,AI 就能直接生成专业的 draw . io 图表 懒人功能: 1⃣ 风格复刻 借鉴布局和风格,美工都省了 2⃣模型大乱斗 一次拉 5 个大模型出来养蛊,谁画得好选谁 3⃣PPT 生成器 Beta 使用 AI 生成 PPT FlowPilot
#AI绘图
#draw.io
#自然语言生成
#图表生成
#FlowPilot
分享
评论 0
0
GitHubDaily
1个月前
在写技术文档或梳理业务逻辑时,为了让大家更好地直观了解项目,通常会画各种流程图、架构图,但颇为耗时。 这时候,找到了 Smart Excalidraw 这款开源工具,允许我们用自然语言就能快速生成专业级、结构清晰的图表。 通过智能箭头优化算法,确保连线不交叉、布局不错乱,支持流程图、架构图、时序图、思维导图等 20 多种类型图表。 GitHub: 除此之外,还集成了 Excalidraw,在图表生成后可自由编辑样式和细节,所有数据保存在本地浏览器,隐私安全。 提供了在线演示网站,只需配置一个 AI API 密钥即可开始使用,建议用 Claude Sonnet 4.5 模型,也可以本地部署运行。
#Smart Excalidraw
#开源工具
#流程图
#架构图
#自然语言生成
分享
评论 0
0
nicekate
2个月前
Qwen 开源 Qwen3-Omni-30B-A3B-Captioner,不明白这里的 Captioner 是什么意思,让 GPT 解释了下 Captioner”指的是“音频描述生成器”——一种专门做音频描述(audio captioning)的模型:输入任意一段音频,模型用自然语言生成对声音场景的细致描述,而不是逐字把人声转成文本 举个例子: 给模型一段街头录音,ASR会输出“有人说:‘往左走’”; 而Captioner会输出“傍晚的繁忙街道上,车辆驶过伴随间歇的喇叭声,远处有人交谈”。
#Qwen3-Omni-30B-A3B-Captioner
#音频描述生成器
#audio captioning
#声音场景描述
#自然语言生成
分享
评论 0
0
马东锡 NLP
3个月前
DeepSeek V3.1 出现了 Glitch Tokens 的问题,随机高频冒出 " extreme" / "极" / "極"。 在 post-training 时代之前,Glitch Tokens 通常指的是某些在自然语料里极少/异常的 token,会扰乱本应正常的生成行为。 在 post-training 时代,大量自制 DSL / 控制标记作为 added tokens 被引入,用来更精细地驱动模型行为,例如 <Think>、<Image>、<Vision> 。这些 DSL token的初衷是提升自然语言指令的可控性和准确性。 DS 的 Glitch Tokens 问题,看着非常像把 " extreme" / "极" / "極" 这类本是自然语言token,在某些上下文里学成了 DSL token,从而被异常地高概率选中。 一些思考: 自制 DSL 的本意是增强自然语言的准确性与可控性。但当 DSL 标记越加越多,如果部分 Glitch Tokens 与这些控制语义(无论显式还是隐式)发生了错误耦合,就可能在推理时反过来干扰自然语言的正常分布,值得警惕。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#DeepSeek V3.1
#Glitch Tokens
#DSL token
#模型干扰
#自然语言生成
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞