时政
财经
科技

#PDF

Geek
Geek
2025-05-29 16:41:17

PDF to Markdown and Word 转换工具

#PDF#Markdown#word
Xiao Hanyu
Xiao Hanyu
2025-05-23 16:38:01

YAMLResume 300 star 了,写了篇新的 blog 简单讲了下设计实现中的一些技术决策,主要包括几点:1) 为什么选 YAML 而不是 JSON;2) 为什么不选 markdown;3) 为什么仍然选 LaTeX 作为 PDF 输出引擎;4) summary field 中的富文本支持。

#yamlresume#技术决策#YAML
宝玉
宝玉
2025-04-14 23:39:19

我是如何高效翻译 65 页 Google 官方提示工程白皮书 PDF 文件的 前几天翻译 Google 官方提示工程白皮书 PDF Google 官方提示工程 (Prompt Engineering)白皮书完整翻译和 PDF 下载 的时候,尝试了一些自动化的方法来提升效率,分享一些我翻译 PDF 的经验和心得。 首先我个人比较排斥保持排版的翻译方式,因为 PDF 在翻译后,文字长度不一致会导致

#翻译#Google#提示工程
歸藏(guizang.ai)
歸藏(guizang.ai)
2025-03-28 16:53:27

没想到藏师傅的网页提示词还能用来吃瓜 群友觉得今天早上那个 PDF 太难读就用我那套提示词做了一个网页 甚至还有时间线之类的,这下确实直观

#藏师傅#提示词#吃瓜
歸藏(guizang.ai)
歸藏(guizang.ai)
2025-03-10 15:22:50

新玩法 get,一套提示词将任何文档变成可视化网页 这不比 PPT 和 PDF 更方便传播和理解? 比如这个全是文字的 Stripe 年度报告 PDF 文件 - 支持响应式设计、夜间模式切换 - 一次成功无需调整 以后随着模型能力增强估计内容展示方式也需要变化

#新玩法#提示词#可视化网页
Gorden Sun
Gorden Sun
2025-03-02 21:57:18

olmOCR:可能是目前最好的开源OCR模型 基于微调后的7B视觉语言模型,微调数据为260000页PDF页面,完全开源,包括模型权重、数据和训练代码、推理代码,4090可以本地运行。 Github: 模型: 在线使用:

#开源#OCR#视觉语言模型
凤凰网-新时代干部
凤凰网-新时代干部
2025-02-26 19:38:36

太炸裂!继南师大后,中国药科大学PDF又闪亮登场

#南师大#PDF#中国药科大学
太炸裂!继南师大后,中国药科大学PDF又闪亮登场
Gantrol
Gantrol
2025-02-19 14:11:30

如果一个页面,有很多自己想下载的东西,又不想一个个点,怎么办?一个方案是,让大模型写爬虫 比方说,要下载 上的所有PDF跟pptx,保存到references目录。其他要求: 1️⃣并发下载 2️⃣如果链接对应PDF格式文件,而HTML链接元素文本(link.text)是pdf,那么不要下载;否则用`${原pdf名称}${link.text}`作为文件标题;注意替换掉不适合作为标题的字符 3️

#爬虫#并发下载#PDF
洺熙
洺熙
2025-02-15 01:42:22

去年我说市面上大多数资料都是在营销,没有新意,打算自己写一本指南出来,从去年12月开始,到春节结束,总算把原定设计思路初步写完,本次《Ai迷思录(应用与安全指南)》第一版与大家见面,223页PDF,0基础带你入门,配备相关资料助你上手当前Ai生态,有反馈可与我进行联系,

#AI#指南#应用与安全
没有更多了 🤐