2022-12-07 08:22:21
word转化成pdf
pdf已经是图片格式了 要转word只能如下
一、"选择文字工具,选好了贴到word里"
如果你的pdf文件是用文字制做而不是图片制做的,可以"在adobe acrobat 7.0中有选择文字的工具,可以选好了贴到word里"。但是根据你介绍的情况,你的pdf文件是用图片做的,所以不能用这种方法。
二、批量截图
截图的办法对于不是很清楚的图片来说,并不可取,因为它要么会损失信息,要么会如楼主所说加大工作量。
我建议你先用adobe acrobat中的导出功能,将这个文件导出为图像。做法:在上面菜单上选文件 导出 提取图像为 jpeg文件(其他二种也行,jpeg文件比较小),再按提示,选择一个适当的文件夹,保存图像 。
这种方法保存下来的一张张图片,比你一页页截图省力多了,而且保留了原文件的全部信息。不过500页可不一个小数,会很慢,但至少不用你亲自动手干预了。
三、批量识别
如果你想进行编辑,就必须进行ocr识别。关键在于你如何能够批量进行这个工作。
好一点的ocr软件都可以一次导入多幅图片进行识别,然后输出。不过,好像500页的确有点多了,我从来也没有超过50页的记录,通常也就是二、三十页。就算50页,也比一页一页强,是吧?
我用过不少ocr软件,觉得汉王文本王、清华紫光th比较好用。它们的识别率都非常高,还可以识别表格、繁体字、英文、竖排文字等;输出方式也很灵活,可以只输出文字,也可以按原稿排版格式输出word文件;使用起来也都不复杂。 不知你用的是什么版本的汉王,识别率会那么低。我有的时候识别质量很次的报纸上的文章,它的识别率也还是可以接受的。
四、提高识别率
如果你的底图质量非常差的话,建议你先在图片处理软件中将导出的图片进行放大、去点、锐化等处理,然后再送到ocr中识别。
我估计,你可能还是送入ocr的图片损失了部分原文的信息,造成识别率下降。因为你既然能放大,放大后截图的识别率还可以,那就说明原图的信息足够ocr识别了。只是你在操作过程中损失了部分东西。
所以,我建议你:
1)先将你的pdf文件导出5-10页图片出来
2)用汉王等ocr软件进行批量识别(识别中注意将不规则的部分框除)
3)输出成word文档
如果它们能很顺利地被识别出来,那后面的事就不用我说了。如果不行,那就真的是你的底图的问题了,这就需要对导出的图片进行批量修正处理。
如何在不借助工具的情况下把word转成pdf?
可以,上adobe网站就能实现了。
https://createpdf.adobe.com/
先注册一个帐号。然后按照抄作一步一步来就行了。
simplify your work with create adobe pdf online:
create and publish reports, spreadsheets, and resumes for distribution to colleagues or clients
distribute schedules, maps, and calendars as pdf files
archive web sites for easy reference and research
turn scanned paper documents into searchable adobe pdf files
add create adobe pdf online to your list of printers. convert documents to adobe pdf right from your desktop.
supports many file types, including microsoft office documents, graphics files, and web pages.
怎么把word文档转化成pdf文档?
虚拟打印机pdffactory pro (下载地址:
http://www.onlinedown.net/soft/3353.htm
)
利用pdffactory可以轻松的把文档“打印”成pdf格式,只要其关联程序提供打印功能。安装完毕,会自动生成一个名为“pdffactory pro”的打印机。打开一个文档(如doc文档),单击“文件→打印”,打印机选择“pdffactory pro”
单击“确定”即开始打印,出现打印机窗口,单击下面的“查看pdf”按钮,可调用acrobat reader进行预览;单击“保存”即可把打印结果保存为pdf文档;单击“发送”则是用电子邮件把打印结果发送出去。
pdffactory是一个面向非专业用户的pdf文档制作工具,可以轻松创建pdf文档,或是把其他格式的文档转换成pdf格式。例如:可以利用这一虚拟打印机把超星图书“打印”成pdf文件,从而摆脱其一年借书期限的限制。
如何将word文件转换成pdf文件
doc文件向pdf格式转换还是比较容易的,主要通过adobe 公司提供的adobe distiller虚拟服务器实现的,在安装了adobe acrobat完全版后,在windows系统的打印机任务中就会添加一个acrobat distiller打印机。
http://www.yesky.com/image20010518/141935.jpg
现在比较流行的doctopdf类软件如pdfprint等的机理都是调用adobe distiller打印机实现的,如果想把一个doc文件转换为pdf文件,只要用office word打开该doc文件,然后在“文件”―>“打印”中选择acrobat distiller打印机即可,如图2所示:
http://www.yesky.com/image20010518/141936.jpg