Gorden Sun

Gorden Sun

0 关注者

6个月前

olmOCR:可能是目前最好的开源OCR模型 基于微调后的7B视觉语言模型,微调数据为260000页PDF页面,完全开源,包括模型权重、数据和训练代码、推理代码,4090可以本地运行。 Github: 模型: 在线使用:

#开源 #OCR #视觉语言模型 #模型权重 #微调 #PDF #GitHub #4090

相关新闻

placeholder

图拉鼎

6小时前

第一个因为 Liquid Glass 导致 UI 跳动的产品已经诞生了:GitHub。这类问题统一可称之为「玻璃跳动」。

placeholder

守晨💤

8小时前

花不到半天时间让Sonnet4实现了一个WebBLE网页控制台,做了个简易的电子吧唧,项目源码等再完善些就开源出来分享给大家

placeholder

花果山大圣

2天前

npm github上都是预制代码 这样很好 但是你非说都是自己写的 没必要

placeholder

GitHubDaily

3天前

GitHub 上一份精心收集整理了 Web 开发资源的合集:Web-Dev-Resources,相当全面且很实用。 涵盖了免费 API、托管平台、速查表、CSS 生成器、图标库、字体、常用组件以及学习资源等十几个分类。 GitHub: 主要内容: - 精选 API 接口:包括 GitHub API、天气 API、电影数据库等实用接口 - 设计资源大全:颜色工具、字体库、图标集合、矢量图库等

placeholder

Gorden Sun

3天前

SPRO:扩散模型优化 腾讯混元开源的训练方法。能优化扩散模型生成图片的质量和偏好。优点是计算量小、训练速度快、没有过拟合的问题。 项目地址: Github:

© 2025 news.news. All rights reserved. 0.16452 秒. v1.0.46
我的评论