开通会员
  • 尊享所有功能
  • 文件大小最高200M
  • 文件无水印
  • 尊贵VIP身份
  • VIP专属服务
  • 历史记录保存30天云存储
开通会员
您的位置:首页 > 帮助中心 > pdf转换到word乱码-为什么pdf文件转换word打开是乱码
默认会员免费送
帮助中心 >

pdf转换到word乱码-为什么pdf文件转换word打开是乱码

2022-12-14 09:12:52

为什么pdf文件转换word打开是乱码

为什么pdf文件转换word打开是乱码
网络上面有一些pdf资料你可以对其内容复制,但是粘贴到word或者文本中就是一堆乱码,你用转换软件转换出来,有一些文件不会是乱码,但是还有一些文件依旧是乱码,怎么办呢?我们现在就讲怎么处理pdf转word成乱码的问题。
工具/原料
adobe reader / adobe acrobat pro 软件
solid converter pdf 6 / 7 软件
abbyy finereader 9 /10 软件
步骤/方法
首先我们要明白这个转换出乱码是怎么回事?
我们先用adobe reader 或者adobe acrobat pro软件打开我们会出现乱码的pdf文件,
然后,菜单栏,文件--------属性--------字体项 我们可以看到是不是文件内嵌了很多字体。
我们这里找了一个文件为例:
的时候是先读取内嵌的字体,如果内嵌的字体没有,那么再读取你系统中的字体来显示,然而word
文件是直接读取系统中的字体的,那么如果你pdf文件中内嵌的某个或者某些字体在你的操作系统中
没有,那么转换出来的word文件一般都会出现乱码。

图中本文档中使用的字体就是文件内嵌的字体,由于pdf文件是可以内嵌字体的,所以你打开pdf文件
pdf转word乱码怎么办
知道了转换后为什么会出现乱码以后, 现在我们找一个转换软件来测试转换结果,这里我们用anybizsoft pdf converter 2.5 测试。
转换完毕后我们打开得到的word文件看看会不会是乱码?
我截取了其中一个典型的页面,大家可以看看和pdf原文的对比,转换成word后是一堆乱码。

pdf转word乱码怎么办

pdf转word乱码怎么办
接下来我们换一个转换软件,我们使用solid converter pdf 6 / 7 软件。
这款转换软件是灰常强大的一个pdf转换软件,转换效果很好,而且版面也保持的很好。而且在以前
转换的使用过程中发现这个软件可以自动替换一部分pdf内嵌的字体,从而达到解决一些转换文件的
乱码问题,但是这个软件不是能够解决所有的乱码问题,有时候转换出来的还会是乱码。
比较惊喜的发现,用这个软件转换出来的虽然没有原文那样整齐,但是确实已经不是乱码了。
如果你用这个软件处理出来不是乱码了,那么我们的目的就达到了,如果用这个软件转换出来还是乱码
那么我们接着往下看。

pdf转word乱码怎么办
如果solid converter pdf 搞不定的话, 那么我们就只能用abbyy finereader 这个软件对这个pdf进行ocr识别处理了。
软件界面的设置如下图:
转换的过程:
如果中间出现错误什么的,会有提示的。
转换完毕后我们打开转换好的word,截图,大家看效果:
效果还是相当不错的~~~ 乱码解决了~~~ 效果甚至比solid converter pdf还好。

pdf转换成word乱码

pdf转换成word乱码
打开word出现提示转换文档打开是乱码的原因:
1.可能是低版本打开高版本。或者是格式不相同。
2.文档损坏了。
解决办法:
方法一:利用word2002/2003的“打开并修复”功能来修复文挡。

(1)启动word2002/2003,单击“文件-----打开”,在“打开”对话框中选重要修复的word文挡。

(2)单击“打开”按钮右边的下三角按钮,在弹出的下拉菜单中选中“打开并修复”选项,即可对损坏的文挡进行修复,修复完成后,显示文挡内容。

提示:“打开并修复”是只有word2002以上的版本才具有的功能。

方法二:转换文挡格式来修复文挡。

如果使用的是word2002以下的版本(如word2000),可以用此方法来修复文挡。

(1)启动word2000后单击“工具------选项-------常规”。在该选项卡中选中“打开时确认转换”复选框,并单击“确定”按钮。

(2)单击“文件---打开”,在弹出的“打开”对话框中选中要恢复的文件,并在“文件类型”框中选中“从任意文件中恢复文本”。

(3)单击“打开“按钮自动对孙换文挡进行转换修复。

(4)如果显示的文挡内容混乱,单击“文件---另存为”,将文挡保存为“rtf格式”或其他word所识别的格式。

(5)保存后关闭文挡,再次打开以“rtf格式”保存的文挡即可看到完整的文挡。

(6)再将文挡保存为“doc格式”即可,这样就完成了对孙换文挡的修复操作。

提示:此方法也同样只可以在word2002以上的版本中使用。

方法三:重设格式法

word用文档中的最后一个段落标记关联各种格式设置信息,特别是节与样式的格式设置。这样我们就可以将最后一个段落标记之外的所有内容复制到新文档,就有可能将损坏的内容留在原始文档中。步骤如下:

①在word中打开损坏的文档,选择“工具→选项”然后选择“编辑”选项卡,取消“使用智能段落选择范围”复选框前的勾。取消选中该复选框,选定整个段落时,word将不会自动选定段落标记,然后单击“确定”按钮。

②选定最后一个段落标记之外的所有内容,方法是:按“ctrl+end”组合键,然后按“ctrl+shift+home”组合键。

③在常用工具栏中,依次单击“复制”、“新建”和“粘贴”按钮。

方法四:禁止自动宏的运行

如果某个word文档中包含有错误的自动宏代码,那么当你试图打开该文档时,其中的自动宏由于错误不能正常运行,从而引发不能打开文档的错误。此时,请在“windows资源管理器”中,按住shift键,然后再双击该word文档,则可阻止自动宏的运行,从而能够打开文档。
方法五:
用修复软件,如docrepair。
,1.可能是低版本打开高版本。或者是格式不相同。,2.文档损坏了

pdf转成word 乱码

pdf转成word 乱码
我也留个邮箱,但既然你都是乱码,我的也可能都是,如果我的也是的话,我就不回你了。 wangweiipp@126.com
你这pdf是因为为了保护版权,里面的字体是特有的,一般的电脑系统里面没有,我用pitstop替换,也没有找到好的字体可以识别的,pitstop这是个adobe acrobat的插件。因为没有字体所以直接复制出来都不行,是乱码,pdf转换软件并没有转错,只是我们的电脑没有那种字体所以显示不出来,要改变字体也很难,反正我没有找到,然后我试了一下orc,结果识别率并不高,有的识别能出来。如果你有耐心的话,建议你orc后自己一个个的改过来。

我的pdf转word也是乱码!怎么解决呢?

我的pdf转word也是乱码!怎么解决呢?
如果pdf是图片转化来的,就不会识别的。你还不如直接把pdf保存成jpg图片,然后用ocr软件直接识别。再一个如果pdf底纹太重的话,也识别不了的。
pdf有一种是word文本直接转成pdf的,这种方法的pdf再软化成word就非常方便。还有一种pdf是photoshop之类的图像软件制作的,这种方式制作的pdf只能再转换成图片,然后再用ocr识别。
方正ocr是一个比较好用的,我的印刷厂经常会排人家拿现成的书,我就让打字员用扫描仪扫描,保存成jpg格式的图片,然后就用方正ocr识别。
另外office 2003及以后的所有版本,只要是安装企业完全版,并且在安装时选择自定义,就都有图像识别成word文档的功能。这个功能在开始-程序-office -office 工具中。
您已连续签到 0 天,当前积分:0
  • 第1天
    积分+10
  • 第2天
    积分+10
  • 第3天
    积分+10
  • 第4天
    积分+10
  • 第5天
    积分+10
  • 第6天
    积分+10
  • 第7天

    连续签到7天

    获得积分+10

获得10积分

明天签到可得10积分

咨询客服

扫描二维码,添加客服微信