2022-11-24 02:11:10
如果
pdf是图片转化来的,就不会识别的。你还不如直接把pdf保存成jpg图片,然后用ocr软件直接识别。再一个如果pdf底纹太重的话,也识别不了的。
pdf有一种是word文本直接转成pdf的,这种方法的pdf再软化成word就非常方便。还有一种pdf是photoshop之类的图像软件制作的,这种方式制作的pdf只能再转换成图片,然后再用ocr识别。
方正ocr是一个比较好用的,我的印刷厂经常会排人家拿现成的书,我就让打字员用扫描仪扫描,保存成jpg格式的图片,然后就用方正ocr识别。
另外office 2003及以后的所有版本,只要是安装企业完全版,并且在安装时选择自定义,就都有图像识别成word文档的功能。这个功能在开始-程序-office -office 工具中。
pdf转换成word之后都是都乱码怎么弄啊~~!
pdf转换成word出现乱码的主要原因的,在制作pdf的时候用了好多的字体来制作这个pdf文档,所以你pdf转换成word的时候会出现大量的乱码,是因为你的文字库不识别这些文字!
如果转换的话,首先转换成jpg格式然后用ocr文字识别这些就都能搞定了,比较麻烦,你可以自己去尝试下,实在不行我给你推荐一个转换团队,叫易捷pdf转换。转换效果不错你去试试,不用你这么麻烦了,专业负责转换pdf,而且专治各种转换中的疑难杂症,呵呵,百度搜索易捷pdf转换就好了,感觉可以就来个最佳答案吧~~!
如何将pdf文件转换成word文件,有的转换工具转换后出...
这个有几种情况
pdf本身就是扫描的,这个就要看扫描分辨率了,高的话会好些
还有一种是文字版本,这个就好说了
推荐一个软件
abbyy.finereader.10多国语言企业版
该软件是俄罗斯开发的,功能强大