Yinsen2025-06-16 10:58:19🎉 Cherry Studio 官宣与领先的文档预处理服务 MinerU 达成官方合作!MinerU 强大的文档解析能力已深度集成至知识库,能精准解析 PDF、图表、公式等复杂文档,显著提升 AI 问答质量。为庆祝合作,每位用户每日可享 500 页免费处理额度!立即体验智能文档处理新高度!
Geek2025-05-27 08:49:18Extract2MDPublic PDF 到 Markdown 转换解决方案,结合传统文本提取、OCR 技术和现代 AI 增强功能。项目采用场景化的 API 设计,让开发者可以根据具体需求选择最适合的转换方法。 提供 5 种:快速转换 、高精度、转换 + LLM 增强、高精度 + LLM 增强、综合转换 + LLM(推荐)
AIGCLINK2025-03-07 10:44:31牛,Mistral刚刚发布了号称地表最强OCR,给文档理解设立了新标准! Mistral OCR具备强大认知能力,能准确理解文档中包括文本、图像、表格、公式等在内的每个元素 特点: 1、原生多语言和多模态,支持数千种文字、字体以及语言 2、能准确理解复杂的文档元素,包括图像、数学公式、表格以及 LaTeX 格式等,尤其擅长处理包含图表、图形、公式和插图的科学论文等富文档 3、在多个文档分析
Gorden Sun2025-03-02 21:57:18olmOCR:可能是目前最好的开源OCR模型 基于微调后的7B视觉语言模型,微调数据为260000页PDF页面,完全开源,包括模型权重、数据和训练代码、推理代码,4090可以本地运行。 Github: 模型: 在线使用:
GitHubDaily2024-12-28 12:23:54一款开箱即用的翻译和 OCR 工具:STranslate。 - 支持划词、截图、鼠标划词等多种翻译方式 - 支持离线使用 OCR,效果好且响应迅速 - 支持 OpenAI、DeepL、Google 等 10 多家翻译服务 - 支持全局 TTS、写作、自定义 Prompt 等 GitHub: 看起来挺不错的,值得安装试用下。