2022-11-28 18:57:49
pdf格式怎么转化成word格式?
有的pdf里面的文字是可选择的,有些pdf里面的文字是不可选择的,还有些pdf是有加保护的,需要区别对待~
先安装一个adobe acrobat professional和orc软件,软件q里面传给你!
对于文字可选择的pdf文件,用acrobat打开,然后另存为,可以直接存储为doc格式的word文档,然后再在word里面进行排版或者贴到其它图文处理软件中排版,排好之类再转成pdf文件!
对于文字不能选择的pdf文件,编辑起来较费劲,用acrodat打开,然后另存为jpg格式的图片,之类用orc类的软件识别,校正输出,再用图文排版系统进行排版,最后转换为pdf文件!
对于有些带有密码保护的pdf,可以用pdf password remover v2.2 汉化版去密码,之类再重复以上的方法即可!
这是我在百度回答的!你可以参考一下!
http://zhidao.baidu.com/question/7677708.html
请问,如何能把\"pdf\"格式转成word格式,并能用word...
pdf-to-word 是一款转换 adobe pdf 文档到 microsoft word 格式的程序。该转换工具具有简单易用的向导界面,即使是新手也可以轻松完成转换,并且可以最大限度的保留原有的版面布局和图像,支持转换文档中的中文等东亚语言,无需安装 adobe acrobat reader。同时,它也支持命令行操作,方便高手使用
http://www.greendown.cn/soft/4270.html
一款非常有用的pdf转换工具,可以快速的将pdf文档转换为word rtf文件,允许你保留全部特性包括文字、图片、表格、链接等,同时也支持批量转换。转换速度快,精确,易于使用,支持unicode和亚洲字体编码。无需安装microsoft word, acrobat reader。
http://www.greendown.cn/soft/3756.html
霏凡软件绿色下载站
pdf转word工具哪个更好?每种软件的优势和不足之处在...
adobe acrobat 7.0中已经带有pdf转word文档的功能,而且对保持原格式支持良好。采用该软件,打开一份pdf文件,然后“另存为”word文档即可。在baidu中输入“adobe acrobat 7.0注册下载”搜索即可找到破解版的adobe acrobat 7.0下载。
另外,可以用scansoft pdf converter效果也不错。solid converter pdf也可以。
这三个软件我都实际用过,对中文支持好些的还是adobe acrobat 7.0。但对格式支持好点的是scansoft pdf converter。
这几个软件都可以在baidu里搜索到注册版,你都可以安装试用,对不同文件转换的效果略有不同,根据你的pdf文件中图片多少选用最合适的软件即可。
http://www.baidu.com/s?tn=baidu&ie=gb2312&bs=pdf%d7%aaword+%c8%ed%bc%fe&sr=&z=&cl=3&f=8&wd=adobe+acrobat+7.0%d7%a2%b2%e1%cf%c2%d4%d8&ct=0
怎么把.pdf的文件复制到word文件中,急急!!
office 2003 里的 document image writer 虚拟打印机
(an translated english version of this article is provided here.)
安装完 office 2003 之后,你会发现“打印对话框”中的打印机列表多了一个“microsoft office document image writer”的打印机,如果选中此项来打印的话,你会得到一个扩展名为 mdi 的文件。
这个虚拟打印机本来用处是不大的,也很少有文章介绍它。但以下介绍一个很好的 microsoft office document image writer 虚拟打印功能的应用场景:
(1) 我们可以通过 microsoft office document image writer 将 word,excel,powerpoint,记事本,internet explorer 等浏览器,photoshop,outlook express 中的 email ……各种可以打印输出的文件,打印输出为 mdi 这一通用格式,用于存档。
(2) office 2003 中提供的 microsoft office document imaging 功能,同时提供了编程接口,可以很方便的从 mdi 文件中提取其中包含的文本,图片等内容,通过相应的索引模块,可以很方便的为不同格式的文档建立索引。
(3) office 2003 同时提供了可以查看 mdi 文件内容的 activex 控件,我们可以把该控件放置到我们的 windows forms 中,用于查看 mdi 文件的内容。
这样,一个通用性很高的文档管理系统就很容易创建出来了。
也许你安装有 adobe acrobat 系列的软件(注意此处不包括 adobe acrobat reader)的话,你会知道你的打印机列表中也是有一个可以打印 pdf 格式的虚拟打印机(而 acrobat reader 只能读 pdf,不能写)。这里,microsoft office document image writer 的作用大致和 adobe acrobat 的虚拟打印机类似。
通过 pdf 这一通用格式,我们也可以实现上面 mdi 实现的功能。但 mdi 的优势是明显的:
office 2003 已经是很多客户已经购买或者计划购买中的软件,为实现文档管理功能而另外购买 acrobat 的 licences 显然要额外花费很多成本。
(当然还有个因素,大多数人都相信,微软自己的东西兼容性要相对好一些。)
如何将图片格式的pdf转化为word?
批量处理是有办法的
一、“选择文字工具,选好了贴到word里”
如果你的pdf文件是用文字制做而不是图片制做的,可以“在adobe acrobat 7.0中有选择文字的工具,可以选好了贴到word里”。但是根据你介绍的情况,你的pdf文件是用图片做的,所以不能用这种方法。
二、批量截图
截图的办法对于不是很清楚的图片来说,并不可取,因为它要么会损失信息,要么会如楼主所说加大工作量。
我建议你先用adobe acrobat中的导出功能,将这个文件导出为图像。做法:在上面菜单上选文件>导出>提取图像为>jpeg文件(其他二种也行,jpeg文件比较小),再按提示,选择一个适当的文件夹,保存图像 。
这种方法保存下来的一张张图片,比你一页页截图省力多了,而且保留了原文件的全部信息。不过500页可不一个小数,会很慢,但至少不用你亲自动手干预了。
三、批量识别
如果你想进行编辑,就必须进行ocr识别。关键在于你如何能够批量进行这个工作。
好一点的ocr软件都可以一次导入多幅图片进行识别,然后输出。不过,好像500页的确有点多了,我从来也没有超过50页的记录,通常也就是二、三十页。就算50页,也比一页一页强,是吧?
我用过不少ocr软件,觉得汉王文本王、清华紫光th比较好用。它们的识别率都非常高,还可以识别表格、繁体字、英文、竖排文字等;输出方式也很灵活,可以只输出文字,也可以按原稿排版格式输出word文件;使用起来也都不复杂。 不知你用的是什么版本的汉王,识别率会那么低。我有的时候识别质量很次的报纸上的文章,它的识别率也还是可以接受的。
四、提高识别率
如果你的底图质量非常差的话,建议你先在图片处理软件中将导出的图片进行放大、去点、锐化等处理,然后再送到ocr中识别。
我估计,你可能还是送入ocr的图片损失了部分原文的信息,造成识别率下降。因为你既然能放大,放大后截图的识别率还可以,那就说明原图的信息足够ocr识别了。只是你在操作过程中损失了部分东西。
所以,我建议你:
1)先将你的pdf文件导出5-10页图片出来
2)用汉王等ocr软件进行批量识别(识别中注意将不规则的部分框除)
3)输出成word文档
如果它们能很顺利地被识别出来,那后面的事就不用我说了。如果不行,那就真的是你的底图的问题了,这就需要对导出的图片进行批量修正处理。
如果还不行,那、那……我也没辙了。