时政
财经
科技

#OCR

Geek
Geek
2025-05-27 08:49:18

Extract2MDPublic PDF 到 Markdown 转换解决方案,结合传统文本提取、OCR 技术和现代 AI 增强功能。项目采用场景化的 API 设计,让开发者可以根据具体需求选择最适合的转换方法。 提供 5 种:快速转换 、高精度、转换 + LLM 增强、高精度 + LLM 增强、综合转换 + LLM(推荐)

#PDF转换#Markdown#OCR
AIGCLINK
AIGCLINK
2025-03-07 10:44:31

牛,Mistral刚刚发布了号称地表最强OCR,给文档理解设立了新标准! Mistral OCR具备强大认知能力,能准确理解文档中包括文本、图像、表格、公式等在内的每个元素 特点: 1、原生多语言和多模态,支持数千种文字、字体以及语言 2、能准确理解复杂的文档元素,包括图像、数学公式、表格以及 LaTeX 格式等,尤其擅长处理包含图表、图形、公式和插图的科学论文等富文档 3、在多个文档分析

#Mistral#OCR#科技创新
Gorden Sun
Gorden Sun
2025-03-02 21:57:18

olmOCR:可能是目前最好的开源OCR模型 基于微调后的7B视觉语言模型,微调数据为260000页PDF页面,完全开源,包括模型权重、数据和训练代码、推理代码,4090可以本地运行。 Github: 模型: 在线使用:

#开源#OCR#视觉语言模型
GitHubDaily
GitHubDaily
2024-12-28 12:23:54

一款开箱即用的翻译和 OCR 工具:STranslate。 - 支持划词、截图、鼠标划词等多种翻译方式 - 支持离线使用 OCR,效果好且响应迅速 - 支持 OpenAI、DeepL、Google 等 10 多家翻译服务 - 支持全局 TTS、写作、自定义 Prompt 等 GitHub: 看起来挺不错的,值得安装试用下。

#STranslate#翻译工具#OCR
一款开箱即用的翻译和 OCR 工具:STranslate。

- 支持划词、截图、鼠标划词等多种翻译方式
- 支持离线使用 OCR,效果好且响应迅速
- 支持 OpenAI、DeepL、Google 等 10 多家翻译服务
- 支持全局 TTS、写作、自定义 Prompt 等

GitHub: 

看起来挺不错的,值得安装试用下。
没有更多了 🤐