karminski-牙医

karminski-牙医

0 关注者

5个月前

看到个PDF识别大模型 olmOCR-7B-0225-preview 。我用发票试了一下,感觉效果还可以? 这个7B模型是BF16的,量化后估计能在4GB左右?普通电脑也能用。 模型地址: 在线测试地址: #大模型竞技场

#大模型竞技场 #PDF识别 #olmOCR #量化模型 #BF16

相关新闻

placeholder

karminski-牙医

4个月前

给大家带来全网最速 DeepSeek-V3-0324 写代码实测! 直接说结论—— 超越 DeepSeek-R1!甚至超越 Claude-3.7! 难以想象这还不是一个 Thinking 模型! DeepSeek-V3-0324 目前以 328.3 分在 KCORES 大模型竞技场排名第三 (图1),仅次于 claude-3.7-sonnet-thinking 和 claude-3.5 (没错

placeholder

勃勃OC

5个月前

DeepSeek 推出了 FlashMLA,这是一款专为 Hopper GPU 设计的新解码内核,标志着其开源周的开始。FlashMLA 旨在提高 AI 模型的效率,支持 BF16,采用 64 块大小的分页 KV 缓存,并在 H800 GPU 上实现 3000 GB/s 的内存带宽和 580 TFLOPS 的高性能。 该内核针对可变长度序列进行了优化,大幅降低计算需求,同时提升 AI 任务的速度

placeholder

Rocky

7个月前

2015年,我在同花顺总部的时候,当年我们团队打造出来的自动化交易机器人,在A股实现278%收益率,15年下半年行情有多差,肯定不少人知晓! 2025年我们将重新组建这样的部门,用于加密货币投资领域,先测试一下,用500台Mac mini 跑一下加密货币量化模型!实现多因子多模态全天候全自动交易,中低频策略!您说能实现嘛? 话说高频策略,租用集群还是自建集群,有什么好建议? 最近跟宁波的幻方

© 2025 news.news. All rights reserved. 0.0888 秒. v1.0.42
我的评论