2023-01-12 23:01:20
为什么由pdf转换成word后出现乱七八糟的字
出现乱码是由于你的pdf文档是由扫描图片制作而成的,转换软件不能识别这些图片,所以转换后出现乱码。你必须使用ocr文字识别工具才能解决这一问题。
abbyy finereader 10 corporate edition 就是一款很好的ocr工具,你到网上搜索这个软件的破解版或者绿色版,可以找到下载地址。
求救!!!pdf转word全是乱码,用过各种软件,能力有限,...
不是所有的pdf文档都能正确转换成word文字版的文档。原因大概有以下几个:
1)编码不同,可能是人为设置的,这种情况下需要解码,这个难度还不如重新输入;
2)pdf文档中显示的是图片,图片的背后有文字,但对应的文字编码不同,同上1);
3)转换时的其他因素,使编码类型不能正确对应。
不管是以上哪种原因,统一解决的方法也有:
1)比如用photoshop打开该pdf文档,按合适的精度(如300dpi)进行栅格化处理,之后将其存为某种格式的图片,如jpg;再用文字识别程序(ocr)将图片转换成文字即可。当然,转换过程可能会有部分错误,再校对一下就行了。
2)安装adobe的acrobat程序,启用其“高级编辑工具”中的“文本工具”来复制文本,前提是你的pdf文档确实是文字版,当然,也有可能编码格式不对。
总之,办法是有的,最合适的方法取决你的文档本身。在没有看到你文档之前,以上建议应有帮助。以上提及的photoshop和acrobat是adobe公司的产品,ocr好多公司开发的多种版本,直接到网上下来就可以用了。其使用方法不再赘述了。祝好运!
pdf转换成word怎么回乱码?
打开word出现提示转换文档打开是乱码的原因:
1.可能是低版本打开高版本。或者是格式不相同。
2.文档损坏了。
解决办法:
方法一:利用word2002/2003的“打开并修复”功能来修复文挡。
(1)启动word2002/2003,单击“文件-----打开”,在“打开”对话框中选重要修复的word文挡。
(2)单击“打开”按钮右边的下三角按钮,在弹出的下拉菜单中选中“打开并修复”选项,即可对损坏的文挡进行修复,修复完成后,显示文挡内容。
提示:“打开并修复”是只有word2002以上的版本才具有的功能。
方法二:转换文挡格式来修复文挡。
如果使用的是word2002以下的版本(如word2000),可以用此方法来修复文挡。
(1)启动word2000后单击“工具------选项-------常规”。在该选项卡中选中“打开时确认转换”复选框,并单击“确定”按钮。
(2)单击“文件---打开”,在弹出的“打开”对话框中选中要恢复的文件,并在“文件类型”框中选中“从任意文件中恢复文本”。
(3)单击“打开“按钮自动对孙换文挡进行转换修复。
(4)如果显示的文挡内容混乱,单击“文件---另存为”,将文挡保存为“rtf格式”或其他word所识别的格式。
(5)保存后关闭文挡,再次打开以“rtf格式”保存的文挡即可看到完整的文挡。
(6)再将文挡保存为“doc格式”即可,这样就完成了对孙换文挡的修复操作。
提示:此方法也同样只可以在word2002以上的版本中使用。
方法三:重设格式法
word用文档中的最后一个段落标记关联各种格式设置信息,特别是节与样式的格式设置。这样我们就可以将最后一个段落标记之外的所有内容复制到新文档,就有可能将损坏的内容留在原始文档中。步骤如下:
①在word中打开损坏的文档,选择“工具→选项”然后选择“编辑”选项卡,取消“使用智能段落选择范围”复选框前的勾。取消选中该复选框,选定整个段落时,word将不会自动选定段落标记,然后单击“确定”按钮。
②选定最后一个段落标记之外的所有内容,方法是:按“ctrl+end”组合键,然后按“ctrl+shift+home”组合键。
③在常用工具栏中,依次单击“复制”、“新建”和“粘贴”按钮。
方法四:禁止自动宏的运行
如果某个word文档中包含有错误的自动宏代码,那么当你试图打开该文档时,其中的自动宏由于错误不能正常运行,从而引发不能打开文档的错误。此时,请在“windows资源管理器”中,按住shift键,然后再双击该word文档,则可阻止自动宏的运行,从而能够打开文档。
方法五:
用修复软件,如docrepair。
,1.可能是低版本打开高版本。或者是格式不相同。,2.文档损坏了。,解决办法:,
pdf转换word时为什么出现乱码
出现乱码主要是你的pdf文档是扫描图像制作成pdf文档的,这些图像文件,一般的pdf转换软件无法识别,使用出现乱码。现在能辨别图像上文字的识别工具只要ocr软件即文字识别软件。也不是所有的ocr软件都能识别图片上的文字,比较好的还是“abbyy finereader 10 corporate edition”,这是一款美国的文字识别软件,也能够识别中文,功能非常强大。
pdf转成word 乱码
我也留个邮箱,但既然你都是乱码,我的也可能都是,如果我的也是的话,我就不回你了。 wangweiipp@126.com
你这pdf是因为为了保护版权,里面的字体是特有的,一般的电脑系统里面没有,我用pitstop替换,也没有找到好的字体可以识别的,pitstop这是个adobe acrobat的插件。因为没有字体所以直接复制出来都不行,是乱码,pdf转换软件并没有转错,只是我们的电脑没有那种字体所以显示不出来,要改变字体也很难,反正我没有找到,然后我试了一下orc,结果识别率并不高,有的识别能出来。如果你有耐心的话,建议你orc后自己一个个的改过来。