时政
财经
科技
登录
#PDF
关注
Geek
1个月前
PDF to Markdown and Word 转换工具
#PDF
#Markdown
#word
#转换工具
分享
评论 0
0
Xiao Hanyu
1个月前
YAMLResume 300 star 了,写了篇新的 blog 简单讲了下设计实现中的一些技术决策,主要包括几点:1) 为什么选 YAML 而不是 JSON;2) 为什么不选 markdown;3) 为什么仍然选 LaTeX 作为 PDF 输出引擎;4) summary field 中的富文本支持。
#yamlresume
#技术决策
#YAML
#JSON
#Markdown
#LaTeX
#PDF
#博客
分享
评论 0
0
宝玉
2个月前
我是如何高效翻译 65 页 Google 官方提示工程白皮书 PDF 文件的 前几天翻译 Google 官方提示工程白皮书 PDF Google 官方提示工程 (Prompt Engineering)白皮书完整翻译和 PDF 下载 的时候,尝试了一些自动化的方法来提升效率,分享一些我翻译 PDF 的经验和心得。 首先我个人比较排斥保持排版的翻译方式,因为 PDF 在翻译后,文字长度不一致会导致排版很难看,忽大忽小;另外翻译的时候由于布局导致的文字被强行分割,导致上下文不完整会影响翻译质量。 我在翻译 PDF 时,会把 PDF 先转成 Markdown,再基于 Markdown 去翻译,翻译好了基于翻译好的 Markdown 再去重新生成 PDF,对于文字、表格、图片都能很好的保留,主要缺点是布局格式保留的不是很好,不过我翻译的通常是文字图表为主的,所以影响不大。 🧵
#翻译
#Google
#提示工程
#PDF
#自动化
分享
评论 0
0
歸藏(guizang.ai)
3个月前
没想到藏师傅的网页提示词还能用来吃瓜 群友觉得今天早上那个 PDF 太难读就用我那套提示词做了一个网页 甚至还有时间线之类的,这下确实直观
#藏师傅
#提示词
#吃瓜
#PDF
#网页
#时间线
分享
评论 0
0
歸藏(guizang.ai)
3个月前
新玩法 get,一套提示词将任何文档变成可视化网页 这不比 PPT 和 PDF 更方便传播和理解? 比如这个全是文字的 Stripe 年度报告 PDF 文件 - 支持响应式设计、夜间模式切换 - 一次成功无需调整 以后随着模型能力增强估计内容展示方式也需要变化
#新玩法
#提示词
#可视化网页
#PPT
#PDF
#文档
#Stripe
#年度报告
#响应式设计
#夜间模式
#模型能力
#内容展示
分享
评论 0
0
Gorden Sun
3个月前
olmOCR:可能是目前最好的开源OCR模型 基于微调后的7B视觉语言模型,微调数据为260000页PDF页面,完全开源,包括模型权重、数据和训练代码、推理代码,4090可以本地运行。 Github: 模型: 在线使用:
#开源
#OCR
#视觉语言模型
#模型权重
#微调
#PDF
#GitHub
#4090
分享
评论 0
0
凤凰网-新时代干部
4个月前
太炸裂!继南师大后,中国药科大学PDF又闪亮登场
#南师大
#PDF
#中国药科大学
分享
评论 0
0
Gantrol
4个月前
如果一个页面,有很多自己想下载的东西,又不想一个个点,怎么办?一个方案是,让大模型写爬虫 比方说,要下载 上的所有PDF跟pptx,保存到references目录。其他要求: 1️⃣并发下载 2️⃣如果链接对应PDF格式文件,而HTML链接元素文本(link.text)是pdf,那么不要下载;否则用`${原pdf名称}${link.text}`作为文件标题;注意替换掉不适合作为标题的字符 3️⃣对pptx格式文件,不用改动标题 网页可以作为附件上传,作为上下文。但有时不必要 有的浏览器插件也可以做,优势是足够简单,劣势是没有爬虫脚本灵活
#爬虫
#并发下载
#PDF
#文件命名
#自动化
分享
评论 0
0
洺熙
4个月前
去年我说市面上大多数资料都是在营销,没有新意,打算自己写一本指南出来,从去年12月开始,到春节结束,总算把原定设计思路初步写完,本次《Ai迷思录(应用与安全指南)》第一版与大家见面,223页PDF,0基础带你入门,配备相关资料助你上手当前Ai生态,有反馈可与我进行联系,
#AI
#指南
#应用与安全
#入门教程
#PDF
#生态
#反馈
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞