2022-11-23 22:11:32
如果
pdf是图片转化来的,就不会识别的。你还不如直接把pdf保存成jpg图片,然后用ocr软件直接识别。再一个如果pdf底纹太重的话,也识别不了的。
pdf有一种是word文本直接转成pdf的,这种方法的pdf再软化成word就非常方便。还有一种pdf是photoshop之类的图像软件制作的,这种方式制作的pdf只能再转换成图片,然后再用ocr识别。
方正ocr是一个比较好用的,我的印刷厂经常会排人家拿现成的书,我就让打字员用扫描仪扫描,保存成jpg格式的图片,然后就用方正ocr识别。
另外office 2003及以后的所有版本,只要是安装企业完全版,并且在安装时选择自定义,就都有图像识别成word文档的功能。这个功能在开始-程序-office -office 工具中。
如何将pdf文件转换成word文件,有的转换工具转换后出...
这个有几种情况
pdf本身就是扫描的,这个就要看扫描分辨率了,高的话会好些
还有一种是文字版本,这个就好说了
推荐一个软件
abbyy.finereader.10多国语言企业版
该软件是俄罗斯开发的,功能强大
我的pdf文件转换成word之后都是乱码,这是怎么回事呀...
不知用的是什么软件?
一、pdf原文件格式不清晰、杂点多,可以重新处理原稿,重新扫描生成或找寻其它清晰版本;
二、页面倾斜角度过大,在转换识别软件中一般会有页面倾斜校正一项;
三、转换识别时语言要根据内容时行设置,如英语或简体中文。
为什么从pdf上粘贴到word中的文字是乱码
问题是多种多样的:
(1). 和您用的pdf转word的软件的能力有关。但情况难以一概而论。(我曾经试过把一篇下载的文字用不同软件转换成word,一向效果最理想的软件,反而莫名其妙地完全不懂辨认,其他的则反而给出不错的效果。)
(2). pdf的内容如果写有保护(有版权的,如我的sony数码相机的说明书便是),某些软件便可能出现word的结果是乱码的情况,但有些则索性说有版权保护,不能转换成word。
(3). 有时,不乱码,但段落、内容等也可能出现或多或少的问题。
我建议您到“电驴”(verycd.com)去下载多几款软件试试,然后保留结果比较让您满意的一两款。
为何pdf转换成word是乱码,请问如何解决
楼主你好,有很多方法的,下面给您介绍几款:
1.用solid converter pdf professional 可以在pdf与word互相转换,也就可以编辑了;
2.用adreamsoft_pdf_toword以转换成word,就可以编辑了;
3.汉王pdf_converter,免费软件,可以让pdf转换成word或txt;
4.用foxit pdf editor可以直接编辑了,网上有pj的软件;
5.用foxit phantom可以直接编辑了,网上有pj的软件。
6.abobe acrobat professional 也有部分编辑功能,网上有pj的软件。
7.汉王hw_pdf_ocr_80可以转换成word或txt,免费软件,也可以进行ocr识别。
pdf文件如果加密了:对于一些不允许做修改、复制、打印等的pdf文件(就是加密加了权限的pdf),那么就先要去除密码或者去除数字证书,软件有:
1.pdf password remover
2.adult pdf password recovery