时政

财经

科技

#PDF

2025-05-29 16:41:17

PDF to Markdown and Word 转换工具

#PDF #Markdown #word

2025-05-23 16:38:01

YAMLResume 300 star 了，写了篇新的 blog 简单讲了下设计实现中的一些技术决策，主要包括几点：1) 为什么选 YAML 而不是 JSON；2) 为什么不选 markdown；3) 为什么仍然选 LaTeX 作为 PDF 输出引擎；4) summary field 中的富文本支持。

#yamlresume #技术决策 #YAML

2025-04-14 23:39:19

我是如何高效翻译 65 页 Google 官方提示工程白皮书 PDF 文件的前几天翻译 Google 官方提示工程白皮书 PDF Google 官方提示工程 (Prompt Engineering)白皮书完整翻译和 PDF 下载的时候，尝试了一些自动化的方法来提升效率，分享一些我翻译 PDF 的经验和心得。首先我个人比较排斥保持排版的翻译方式，因为 PDF 在翻译后，文字长度不一致会导致

#翻译 #Google #提示工程

歸藏(guizang.ai)

2025-03-28 16:53:27

没想到藏师傅的网页提示词还能用来吃瓜群友觉得今天早上那个 PDF 太难读就用我那套提示词做了一个网页甚至还有时间线之类的，这下确实直观

#藏师傅 #提示词 #吃瓜

歸藏(guizang.ai)

2025-03-10 15:22:50

新玩法 get，一套提示词将任何文档变成可视化网页这不比 PPT 和 PDF 更方便传播和理解？比如这个全是文字的 Stripe 年度报告 PDF 文件 - 支持响应式设计、夜间模式切换 - 一次成功无需调整以后随着模型能力增强估计内容展示方式也需要变化

#新玩法 #提示词 #可视化网页

2025-03-02 21:57:18

olmOCR：可能是目前最好的开源OCR模型基于微调后的7B视觉语言模型，微调数据为260000页PDF页面，完全开源，包括模型权重、数据和训练代码、推理代码，4090可以本地运行。 Github：模型：在线使用：

#开源 #OCR #视觉语言模型

凤凰网-新时代干部

2025-02-26 19:38:36

太炸裂！继南师大后，中国药科大学PDF又闪亮登场
#南师大 #PDF #中国药科大学

2025-02-19 14:11:30

如果一个页面，有很多自己想下载的东西，又不想一个个点，怎么办？一个方案是，让大模型写爬虫比方说，要下载上的所有PDF跟pptx，保存到references目录。其他要求: 1️⃣并发下载 2️⃣如果链接对应PDF格式文件，而HTML链接元素文本（link.text）是pdf，那么不要下载；否则用`${原pdf名称}${link.text}`作为文件标题；注意替换掉不适合作为标题的字符 3️

#爬虫 #并发下载 #PDF

2025-02-15 01:42:22

去年我说市面上大多数资料都是在营销，没有新意，打算自己写一本指南出来，从去年12月开始，到春节结束，总算把原定设计思路初步写完，本次《Ai迷思录（应用与安全指南）》第一版与大家见面，223页PDF,0基础带你入门，配备相关资料助你上手当前Ai生态，有反馈可与我进行联系，

#AI #指南 #应用与安全

没有更多了 🤐