Gorden Sun2025-03-02 21:57:18olmOCR:可能是目前最好的开源OCR模型 基于微调后的7B视觉语言模型,微调数据为260000页PDF页面,完全开源,包括模型权重、数据和训练代码、推理代码,4090可以本地运行。 Github: 模型: 在线使用: #开源#OCR#视觉语言模型
Gantrol2025-02-19 14:11:30如果一个页面,有很多自己想下载的东西,又不想一个个点,怎么办?一个方案是,让大模型写爬虫 比方说,要下载 上的所有PDF跟pptx,保存到references目录。其他要求: 1️⃣并发下载 2️⃣如果链接对应PDF格式文件,而HTML链接元素文本(link.text)是pdf,那么不要下载;否则用`${原pdf名称}${link.text}`作为文件标题;注意替换掉不适合作为标题的字符 3️#爬虫#并发下载#PDF
洺熙2025-02-15 01:42:22去年我说市面上大多数资料都是在营销,没有新意,打算自己写一本指南出来,从去年12月开始,到春节结束,总算把原定设计思路初步写完,本次《Ai迷思录(应用与安全指南)》第一版与大家见面,223页PDF,0基础带你入门,配备相关资料助你上手当前Ai生态,有反馈可与我进行联系, #AI#指南#应用与安全