2022-11-28 13:11:15
是因为
pdf转换工具对pdf的识别效果不好,现在转换效果最好的还是adobe acrobat professional,里面有一个功能是ocr文本识别,在菜单栏中的“文本”-“ocr文本识别”。通过识别后再转换,这样出现乱码的情况就可以减少很多。
我的pdf转word也是乱码!怎么解决呢?
如果pdf是图片转化来的,就不会识别的。你还不如直接把pdf保存成jpg图片,然后用ocr软件直接识别。再一个如果pdf底纹太重的话,也识别不了的。
pdf有一种是word文本直接转成pdf的,这种方法的pdf再软化成word就非常方便。还有一种pdf是photoshop之类的图像软件制作的,这种方式制作的pdf只能再转换成图片,然后再用ocr识别。
方正ocr是一个比较好用的,我的印刷厂经常会排人家拿现成的书,我就让打字员用扫描仪扫描,保存成jpg格式的图片,然后就用方正ocr识别。
另外office 2003及以后的所有版本,只要是安装企业完全版,并且在安装时选择自定义,就都有图像识别成word文档的功能。这个功能在开始-程序-office -office 工具中。
为什么由pdf转换成word后出现乱七八糟的字
出现乱码是由于你的pdf文档是由扫描图片制作而成的,转换软件不能识别这些图片,所以转换后出现乱码。你必须使用ocr文字识别工具才能解决这一问题。
abbyy finereader 10 corporate edition 就是一款很好的ocr工具,你到网上搜索这个软件的破解版或者绿色版,可以找到下载地址。
pdf转换成word乱码
打开word出现提示转换文档打开是乱码的原因:
1.可能是低版本打开高版本。或者是格式不相同。
2.文档损坏了。
解决办法:
方法一:利用word2002/2003的“打开并修复”功能来修复文挡。
(1)启动word2002/2003,单击“文件-----打开”,在“打开”对话框中选重要修复的word文挡。
(2)单击“打开”按钮右边的下三角按钮,在弹出的下拉菜单中选中“打开并修复”选项,即可对损坏的文挡进行修复,修复完成后,显示文挡内容。
提示:“打开并修复”是只有word2002以上的版本才具有的功能。
方法二:转换文挡格式来修复文挡。
如果使用的是word2002以下的版本(如word2000),可以用此方法来修复文挡。
(1)启动word2000后单击“工具------选项-------常规”。在该选项卡中选中“打开时确认转换”复选框,并单击“确定”按钮。
(2)单击“文件---打开”,在弹出的“打开”对话框中选中要恢复的文件,并在“文件类型”框中选中“从任意文件中恢复文本”。
(3)单击“打开“按钮自动对孙换文挡进行转换修复。
(4)如果显示的文挡内容混乱,单击“文件---另存为”,将文挡保存为“rtf格式”或其他word所识别的格式。
(5)保存后关闭文挡,再次打开以“rtf格式”保存的文挡即可看到完整的文挡。
(6)再将文挡保存为“doc格式”即可,这样就完成了对孙换文挡的修复操作。
提示:此方法也同样只可以在word2002以上的版本中使用。
方法三:重设格式法
word用文档中的最后一个段落标记关联各种格式设置信息,特别是节与样式的格式设置。这样我们就可以将最后一个段落标记之外的所有内容复制到新文档,就有可能将损坏的内容留在原始文档中。步骤如下:
①在word中打开损坏的文档,选择“工具→选项”然后选择“编辑”选项卡,取消“使用智能段落选择范围”复选框前的勾。取消选中该复选框,选定整个段落时,word将不会自动选定段落标记,然后单击“确定”按钮。
②选定最后一个段落标记之外的所有内容,方法是:按“ctrl+end”组合键,然后按“ctrl+shift+home”组合键。
③在常用工具栏中,依次单击“复制”、“新建”和“粘贴”按钮。
方法四:禁止自动宏的运行
如果某个word文档中包含有错误的自动宏代码,那么当你试图打开该文档时,其中的自动宏由于错误不能正常运行,从而引发不能打开文档的错误。此时,请在“windows资源管理器”中,按住shift键,然后再双击该word文档,则可阻止自动宏的运行,从而能够打开文档。
方法五:
用修复软件,如docrepair。
,1.可能是低版本打开高版本。或者是格式不相同。,2.文档损坏了