网络上面有一些pdf资料你可以对其内容复制,但是粘贴到word或者文本中就是一堆乱码,你用转换软件转换出来,有一些文件不会是乱码,但是还有一些文件依旧是乱码,怎么办呢?我们现在就讲怎么处理
pdf转word成乱码的问题。
工具/原料
adobe reader / adobe acrobat pro 软件
solid converter pdf 6 / 7 软件
abbyy finereader 9 /10 软件
步骤/方法
首先我们要明白这个转换出乱码是怎么回事?
我们先用adobe reader 或者adobe acrobat pro软件打开我们会出现乱码的pdf文件,
然后,菜单栏,文件--------属性--------字体项 我们可以看到是不是文件内嵌了很多字体。
我们这里找了一个文件为例:
的时候是先读取内嵌的字体,如果内嵌的字体没有,那么再读取你系统中的字体来显示,然而word
文件是直接读取系统中的字体的,那么如果你pdf文件中内嵌的某个或者某些字体在你的操作系统中
没有,那么转换出来的word文件一般都会出现乱码。
图中本文档中使用的字体就是文件内嵌的字体,由于pdf文件是可以内嵌字体的,所以你打开pdf文件
pdf转word乱码怎么办
知道了转换后为什么会出现乱码以后, 现在我们找一个转换软件来测试转换结果,这里我们用anybizsoft pdf converter 2.5 测试。
转换完毕后我们打开得到的word文件看看会不会是乱码?
我截取了其中一个典型的页面,大家可以看看和pdf原文的对比,转换成word后是一堆乱码。
pdf转word乱码怎么办
pdf转word乱码怎么办
接下来我们换一个转换软件,我们使用solid converter pdf 6 / 7 软件。
这款转换软件是灰常强大的一个pdf转换软件,转换效果很好,而且版面也保持的很好。而且在以前
转换的使用过程中发现这个软件可以自动替换一部分pdf内嵌的字体,从而达到解决一些转换文件的
乱码问题,但是这个软件不是能够解决所有的乱码问题,有时候转换出来的还会是乱码。
比较惊喜的发现,用这个软件转换出来的虽然没有原文那样整齐,但是确实已经不是乱码了。
如果你用这个软件处理出来不是乱码了,那么我们的目的就达到了,如果用这个软件转换出来还是乱码
那么我们接着往下看。
pdf转word乱码怎么办
如果solid converter pdf 搞不定的话, 那么我们就只能用abbyy finereader 这个软件对这个pdf进行ocr识别处理了。
软件界面的设置如下图:
转换的过程:
如果中间出现错误什么的,会有提示的。
转换完毕后我们打开转换好的word,截图,大家看效果:
效果还是相当不错的~~~ 乱码解决了~~~ 效果甚至比solid converter pdf还好。
pdf转换成word是乱码z这是由于你的pdf文档是由扫描图像文件制作成的,pdf转换器无法识别这些图像文件,是由成为乱码。你必须使用ocr文字识别软件来转换才能解决问题。当然并不是所有ocr软件都能识别图像文件。建议你到网上搜索下载“abbyy finereader 10 corporate edition ”或“wondershare.pdf.converter_portablesoft”这两款软件能很好的解决转换时出现乱码问题。