2023-01-12 04:11:58
哪位大神有pdf转word软件,300多页,100分悬赏,有的请...
![哪位大神有pdf转word软件,300多页,100分悬赏,有的请...](https://www.llpdf.com/upload/editor/textimg/20230112/1673467918351.jpg)
能不能转换主要看该
pdf文件是否原为文本格式的文件转换而成的,如果是的话用adobe acrobat直接转回文本格式,如果不是的话,只能用adobe acrobat转为图片格式,再用尚书七号等文字识别软件识别(正规字体的话,识别率挺高的)导出。
pdf转word格式
![pdf转word格式](https://www.llpdf.com/upload/editor/textimg/20230112/1673467918474.jpg)
──────────────────────────────────────────────────────────
一)pdf转其它文档
1. pdf转txt
1)pdf 是否为图片,如果是就不能直接转,得通过ocr识别成文字,abbyy finereader ocr pro 10 简体中文破解版、readiris pro 12(emule xtreme下载),这两款都比汉王ocr强,可转换成带排版的doc文档;当然ocr也可以识别文本的pdf文档。
2)如果 pdf 不是图片,转单个的 pdf 最好用的是福昕阅读器 foxit reader(adobe的转换有问题),界面下,文件>另存为,选txt格式,阅读器版本要高一点的,低版本不能转存;
3)有密码或受保护的文档,pdfdecrypt 或 pdf password cracker v3.1非pro版,解密后再转换;不行的话,截图(用snagit之类)+ocr,图片分辨率转换到 300dpi 再识别;
4)批量转txt,下载 atrise totxt 或者 anybizsoft pdf to txt,这两个软件很好用,其它的软件很多转出来会乱码。
──────────────────────────────────────────────────────────
2. pdf 转图片
1) pdf image extraction wizard 3.0汉化版,保持原图质量,不重采样.
2) 用 zan image printer破解版,虚拟打印机转会降低图像质量,但方便。
──────────────────────────────────────────────────────────
3. pdf 转 office 文档
用 nitro pdf professional 6.4(
http://yunpan.cn/qxwsrmpurs3be
我的分享下载),牛的软件,按原样转换,有强大功能,完成多种格式doc、ppt、xls、jpg……与 pdf 的互转、pdf 的修改。
──────────────────────────────────────────────────────────
二)其它文档转pdf
1. 任意可打印的文档转pdf
可以通过虚拟打印机转换成 pdf,比较好用的虚拟打印机 pdf factory.
2. 图片转pdf
freepic2pdf,不降低图像质量,快速转换,可指定版面宽度.
──────────────────────────────────────────────────────────
三)pdf 文档修改
foxit reader 自带的 pdfedit.exe 可以做简单的局部修改。
adobe acrobat professional 9 兼容性比较好。
──────────────────────────────────────────────────────────
我有一篇pdf格式的文章,谁能帮我把它转换成word文档...
![我有一篇pdf格式的文章,谁能帮我把它转换成word文档...](https://www.llpdf.com/upload/editor/textimg/20230112/1673467918310.jpg)
下面介绍三种将pdf格式文件转换为microsoft word“doc”文档格式 或纯文本文件的方法:
一、文字内容的直接识别
如果是文本内容直接生成的pdf文件,可以采用以下最简单的两种办法实现文字识别。
1、在“adobe reader”或“adobe acrobat”软件显示窗口中先用“文本选择工具”选中要编辑的文本内容,再用复制键“ctrl+c”把选中的文本内容复制到剪贴板中,然后,就可以在文本编辑软件中直接粘贴后编辑了。
2、在 “adobe acrobat”中将整个pdf文件“另存为”rtf文件格式,这样,就可以用“word”直接编辑了。
二、使用工具软件进行转换
如果pdf文件中包含有非标准编码,使用上述方法未必能够完全正确地被转换,或者转化过来的是乱码,而不能被文本编辑软件所直接使用。对于这种pdf文件,一般使用工具软件转换比较方便。这类的软件很多,而且多可以作为office文档编辑软件的插件使用,直接导入pdf文件进行编辑。比如: 美国scansoft公司的“scansoft pdf converter for microsoft office”软件,能够在microsoft office中直接打开pdf文件,并且保留原来的格式和版面设计。 美国voyagersoft llc 公司的“solid converter pdf”软件, 可以将pdf 文件转换成可能被编辑的充分格式化和版面设置的microsoft word 文件, 保存文本、布局和图象等。 德国pixelplanet ltd 公司的“pdfgrabber”软件,可以将pdf文件格式转换成excel、rtf或者word格式。 除此之外,还有“pdf to word”、“pdf2office ”等等软件,都是可以直接将pdf格式转换为doc、rtf或txt等格式的工具软件。使用起来非常方便,而且多可以保留pdf文件原来的格式和版面设计。
三、使用ocr方法进行识别
如果pdf格式源文件为扫描产生的文件,则文件为图像组成。对于图像中的文字内容即使使用了前面两种识别转换方法,也无法作为文本内容在文档编辑软件中直接使用。所以,需要使用ocr方法进行识别。通常也有两种方法:
1、使用万方数据文字识别插件。该插件是北京万方数据股份有限公司研制的专用于acrobat reader 4.0 以上版本软件的一个ocr工具,能够对pdf文件进行ocr整页识别或选择部分区域运行识别,并将识别结果保存为文本文件。
当插件安装成功后,启动acrobat reader,在“工具”菜单中会出现一个“万方ocr识别工具”选项,在快速工具栏上也会显示两个“万方ocr识别工具” 按钮,一个提供整页识别功能,一个提供选择部分区域识别功能。例如:单击ocr整页识别按钮后进入ocr识别准备状态,鼠标指针将转变为ocr字样。在pdf文件浏览窗口点击所显示的pdf文件内容,出现提示框询问是否把当前页保存为tiff图像文件,单击[是]按钮,将弹出文件保存对话框,输入要保存的文件名,单击[确定]按钮即可将当前页保存到磁盘。单击[否]按钮会对当前页进行识别,并弹出识别窗口,识别窗口内的文字部分即为识别的结果。单击[保存]按钮以文本文件的形式把识别结果保存到磁盘。
万方数据文字识别插件主要对数字复印机产品所加工的pdf文件进行ocr识别,对于其他图像文字识别效果就不理想了。
图 2 “万方ocr识别工具” 按钮
2、 使用第三方ocr软件识别。现国内比较流行的有清华紫光、北大、汉王、尚书等ocr软件,通常对汉字的识别能力都不错。
第一步,需要将pdf格式文件转换为图像文件。可以采用屏幕图像掠取软件,将屏幕显示的pdf文件中的文字抓取下来的办法,然后将其保存为图像文件。也可以直接利用“adobe acrobat“软件中的文件“另存为”功能,将pdf格式文件分页保存为tiff格式图像文件。不过,要注意的是要选择单色、300dpi以上精度保存图像文件才能提高ocr识别精度。
图 3 设置tiff文件的精度
第二步,进行ocr文字识别。下面以“清华th-ocr 2000 千禧板”为例。
操作步骤为:
(1)“文件”菜单下,“打开”图像文件(可以一次识别多个图像文件内容);
(2)逐个图像文件内容进行ocr识别(个别图像在识别时需要进行倾斜校正、文稿校对等处理);
(3)识别完毕,自动生成与图像文件名相同,扩展文件名为txt的文本文件,就可以对它们进行编辑了。
如何把扫描的pdf文件转换成word可以编辑的word文档 ...
![如何把扫描的pdf文件转换成word可以编辑的word文档 ...](https://www.llpdf.com/upload/editor/textimg/20230112/1673467918712.jpg)
泰比光学ocr识别软件,感觉比较好用,但再好用的ocr,说实在,如果文件页数不多,那就用用可以,如果很多页,我看还是不要搞了,光里面的错字,你挑一遍修改,也够你打一篇文章了,还不包括后期的排版,校对!
慎重,慎重!
如果其他同学是单页清晰版pdf,这里求转没有问题,如果是图片版的整本书,对不起,还是不要折磨这里的同学了!
good luck!