帮别人就是帮助自己,下面是我整理的相关资料,希望对你有所帮助。
pdf to word(txt)和pdf格式编辑软件很多:
1.abbyy finereader,最好的pdf转换成word的软件,也可以进行ocr识别成word格式,识别率高,网上有pj。
2.汉王hw_pdf_ocr_80可以转换成word或txt,免费软件,也可以进行ocr识别成txt;
3.用solid converter pdf professional 可以在pdf与word互相转换,也就可以编辑了;
4.用adreamsoft_pdf_toword以转换成word,就可以编辑了;
5.汉王pdf_converter,免费软件,可以让pdf转换成word或txt;
6.用foxit pdf editor可以直接编辑了,网上有pj的软件;
7.用foxit phantom可以直接编辑了,网上有pj的软件。
8.abobe acrobat professional 也有部分编辑功能,网上有pj的软件。
9.anybizsoft pdf to word是一款专业的
pdf转word格式的免费转换软件。
10.小丑鱼pdf转换器,免费软件。
pdf文件如果加密了:对于一些不允许做修改、复制、打印等的pdf文件(就是加密加了权限的pdf),那么就先要去除密码或者去除数字证书,软件有:
1.pdf password remover
2.adult pdf password recovery
如果不是图片类做成的pdf 你可以转换成word格式后进行编辑, 但是如果是内嵌了字体的,那么就要看情况了,因为有的字体你系统里面有,转出来就没有问题,如果系统里面没有,那么转出来就是一堆乱码;一些用户为了避免别人转换,特意引入了一些特殊字体,复制和转换出来都是乱码。对于是图片和没有字体(乱码)做成的pdf文件,那么我们就需要用ocr类软件进行识别了,软件有:清华紫光ocr;尚书七号;leadtools ocr;赛酷ocr;汉王文豪7600(图形ocr识别成word或excel);汉王hw_pdf_ocr_81(推荐:pdf文件、图形,ocr识别成word或excel);abbyy finereader(推荐)
我用汉王hw_pdf_ocr_81,可在汉王官方网站 主页右下角有免费的正版下载,下载地址:
www.hw99.com/
不明白时,在百度hi中联系
office 2003中的虚拟打印机 office 2003自带了一个虚拟打印机,如果没有安装,请运行office 2003的安装程序,利用其“添加或删除功能”中的“高级自定义”将组件microsoft office document imaging writer安装到系统中即可。利用office 2003的这一虚拟打印机,任何加密的文档都可以把其中的文字提取到word文档中,只要其提供了打印功能,甚至包括tif图像中的文字;实现文字到图像的转换。
下面利用这一方法来提取加密pdf文档中的文字:
运行acrobat reader,打开要提取文字的pdf文档,单击菜单“文件→打印”,在出现的“打印”窗口中,打印机名称一定要选择“microsoft office document imaging writer”,单击后面的“属性”按钮,可以设置页面大小、输出文件格式(包括mdi和tiff两种格式,默认为msi)及默认保存位置。设置好“打印”窗口中的其他相关参数后,单击“确定”按钮,出现“另存为”窗口,在此即可把页面“打印”成一个mdi文件,同时系统会自动启动“microsoft office document imaging”并显示出刚刚保存的mdi文件。
在microsoft office document imaging的窗口中,单击菜单“工具→将文本发送到word”,在弹出的窗口中单击“确定”,系统会自动对整个页面进行ocr识别,识别完毕之后,会自动启动word,并把识别出来的文字显示在word文档中,识别效果非常不错。如果只需要页面中的部分文字,可单击标准工具栏中的“使用ocr识别文本”,先进行文字识别,然后用鼠标框选出需要的部分,再执行“将文本发送到word”,选中“当前选中范围”即可。(图6)
图6
在word中适当对文字及格式进行修改,即可将其保存成doc文档。到此pdf文档中的文字已经提取到了word中了。
提示:如果上面“打印”成的格式是tif,则需要手动从“开始”菜单“microsoft office 工具”中启动microsoft office document imaging,然后再“打开”tif文件,同样可以把文字识别到word中。