时政
财经
科技
虚拟货币
其他
登录
karminski-牙医
关注
统计数据
64
文章
0
粉丝
0
获赞
132
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
karminski-牙医
5个月前
看到了个基于 Whisper.cpp 的转录工具SoftWhisper。 这个项目可以将音频/视频中的音频转为文字,最大的特点是使用了 Whisper.cpp,所以兼容性非常好,所有平台都能跑。另外性能也很不错,官方宣称可以在大约 2-3 分钟内转录 2 小时的音频。作为对比,Whisper API转录 20-30 分钟的音频需要大约 40 分钟。 地址:
#Whisper
#SoftWhisper
#音频转文字
#项目
#Whisper API
#转录工具
分享
评论 0
0
karminski-牙医
5个月前
刚刚 Google 的开源模型 Gemma 3 发布了! 几个关键点: - 这次放出了pt(预训练,Pre-Training)和 it (指令微调,Instruction Tuning)版本,默认用it即可。pt更多是给大家用来微调用的基座模型 - Gemma-3 是多模态的,可以处理图片输入 - 大小分别是1B,4B,12B,27B - 支持 128K 上下文 - MMLU-Pro 评分,Gemma 3-27B-it 得分为 67.5,接近 Gemini 1.5 Pro(75.8) - ChatbotArena 得分 133,超过了更大的 LLaMA 3 405B(1257)和 Qwen2.5-70B(1257) - GGUF量化版本已经放出了,包括Mac专用的mlx版本。地址我放在最下面 我正在测了!稍后给大家带来大家最关心的 Gemma-3-27B-it VS QwQ-32B-BF16 的测试结果! 顺便 Gemma-3-27B-it 是可以免费白嫖的哈,注册 Google AI Studio 就能用了 Unsloth GGUF量化版本地址: MLX量化版本:
#Google
#Gemma 3
#开源模型
#多模态
#预训练
#指令微调
分享
评论 0
0
karminski-牙医
5个月前
字节的AI代码编辑器 TRAE 国内版刚刚发布了! 地址:
#字节跳动
#AI代码编辑器
#Trae
#发布
#科技新闻
#国内版
分享
评论 0
0
karminski-牙医
5个月前
卧槽,我刚试了一下这个,SesameAILabs 实现了一个几乎无延迟的AI数字音频模型 ,应该是我体验过的最强的模型了。 我给大家录了个视频,大家可以听听看(一定要开声音,请忽略我的垃圾口语)。同时也建议直接访问试试,体验下延迟 (说实话别说延迟了,太快了,连气口都不给我)。 demo 我发下不仅可以顺畅聊天,甚至还有记忆,我跟他聊小米的车,结果我每次重新开始她就问我你的黄色车怎么样了..... 要说缺点,也不是没有,她太多俚语了,我听不懂.... (当然这其实是我的缺点... [苦涩][苦涩][苦涩]) 顺便,这个是开源的!分三个大小:1B,3B,8B。本地轻松运行。 在线地址: 开源项目地址(目前还在准备): #大模型竞技场
#SesameAILabs
#AI数字音频模型
#人工智能
#科技
#小米汽车
#延迟优化
分享
评论 0
0
karminski-牙医
6个月前
EA刚刚开源了红警1的源代码。license是GPLv3 地址:
#EA
#开源
#红警1
#源代码
#GPLv3
分享
评论 0
0
karminski-牙医
6个月前
DeepSeek 开源周的 5 号炸弹来啦!又是集束炸弹!3FS 和 smallpond! 我不敢相信DeepSeek甚至颠覆了存储架构...... 我上次为网络文件系统震惊还是HDFS和CEPH. 但这些都是面向磁盘的分布式文件系统. 现在一个真正意义上面向现代SSD和RDMA网络的文件系统诞生了! 飞火流星文件系统(3FS)- 一种利用现代 SSD 和 RDMA 网络全带宽的并行文件系统 这个文件系统可以在 180 节点集群中达到6.6 TiB/s 总读取吞吐量,每个客户端节点 KVCache 查找峰值吞吐量 40+ GiB。 另一个 smallpond(小池塘)是基于 3FS 的数据处理框架! 这个框架由 DuckDB 提供的高性能数据处理,可扩展以处理 PB 级数据集! 地址: 地址: #DeepSeek #deepseek开源周
#DeepSeek
#开源周
#集束炸弹
#3FS
#smallpond
#存储架构
#文件系统
#HDFS
#CEPH
#磁盘
#分布式文件系统
#SSD
#RDMA网络
#飞火流星
#并行文件系统
分享
评论 0
0
karminski-牙医
6个月前
DeepSeek 开源周的3号炸弹来啦!DeepGEMM! 这是个FP8 通用矩阵乘法库,该库用 CUDA 编写,安装时无需编译,并且内置了JIT(真的牛逼)!官方数据最大性能获得了2.7倍的提升。 要知道在早些年高性能的BLAS库可是要收费的,并且卖得很贵。 地址: #DeepSeek
#DeepSeek
#DeepGEMM
#FP8
#矩阵乘法
#CUDA
#JIT
#高性能计算
#开源
#BLAS
分享
评论 0
0
karminski-牙医
6个月前
看到个PDF识别大模型 olmOCR-7B-0225-preview 。我用发票试了一下,感觉效果还可以? 这个7B模型是BF16的,量化后估计能在4GB左右?普通电脑也能用。 模型地址: 在线测试地址: #大模型竞技场
#大模型竞技场
#PDF识别
#olmOCR
#量化模型
#BF16
分享
评论 0
0
karminski-牙医
6个月前
LLama-4 或许会在4月底之前发布? 昨天的消息,meta搞了个 llamaCon 大会,预计在4月29号召开,感觉4月底前应该就能发llama-4了?要不然感觉也没啥可con的.... 地址:
#Llama4
#Meta
#发布会
#AI
分享
评论 0
0
karminski-牙医
6个月前
分享反编译大模型!LLM4Decompile。反编译工作不需要苦哈哈盯着intel汇编头痛了,这个模型可以将 x86_64二进制程序反编译为C代码 我看了下模型大小从1.3B到22B都有,22B如果Q4量化的话只有10G左右,Q8大概22G。好一点的显卡就能本地用了 项目地址:
#反编译
#LLM4Decompile
#人工智能
#x86_64
#C语言
#二进制
#模型量化
#显卡
#汇编
分享
评论 0
0
karminski-牙医
6个月前
深度分析下 DeepSeek-R1 用华为昇腾,推理集群大概多大? 重磅消息,昨天的新闻,DeepSeek-R1 真的能在华为的昇腾AI加速卡上跑了。 根据华为官方,Atlas(昇腾) 300I Pro 推理卡单卡拥有 140 TOPS INT8 和 70 TFLOPS FP16这个性能足够推理用,但关键的内存则使用了LPDDR4X 24 GB,总带宽204.8 GB/s
#DeepSeek-R1
#华为昇腾
#AI加速卡
#Atlas 300I Pro
#AI推理
#深度学习
#科技新闻
分享
评论 0
0
karminski-牙医
7个月前
来了嗷!全网首测!DeepSeek 4 小时之前又发布了一个多模态模型——Janus-pro!这个模型的特点是将文生图和图生文合二为一了! 我觉得这个模型更多是方向上的验证,如果验证靠谱就会推出可以投入生产的模型了。 [1/?]
#DeepSeek
#Janus-Pro
#多模态模型
#文生图
#图生文
#模型验证
#新技术
#人工智能
分享
评论 0
0
karminski-牙医
7个月前
速报,寄了嗷,NVIDIA Project Digits 内存带宽只有 275GB/s. 意味着跑 70B-int4 速度只能到 6.8 token/s. 如果跑 DeepSeek-R1-Distill-Qwen-32B-Q5_K_M, 大概是 12.5 token/s. 就是个更便宜的 MacMini M4 Pro。 如果信了老黄的说法,用这个跑200B的大模型,一分钟也就能吐出来2句话。
#NVIDIA
#内存带宽
#Project DIGITS
#DeepSeek-R1-Distill-Qwen
#MacMini M4 Pro
#大模型
分享
评论 0
0
karminski-牙医
7个月前
kotoro-TTS 荣登 TTS Arena 排行榜第一名,录了个视频大家可以看下它中文的语音合成效果。 值得一提的是,这个模型只有 82M,树莓派都能跑。而且是 MIT 协议的。 排行榜地址: 在线测试地址:
#kotoro-TTS
#TTS Arena
#语音合成
#中文
#模型
#树莓派
#MIT 协议
分享
评论 0
0
上一页
1
2
3
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞