2022-12-11 06:09:46
pdf转成word 乱码
我也留个邮箱,但既然你都是乱码,我的也可能都是,如果我的也是的话,我就不回你了。 wangweiipp@126.com
你这pdf是因为为了保护版权,里面的字体是特有的,一般的电脑系统里面没有,我用pitstop替换,也没有找到好的字体可以识别的,pitstop这是个adobe acrobat的插件。因为没有字体所以直接复制出来都不行,是乱码,pdf转换软件并没有转错,只是我们的电脑没有那种字体所以显示不出来,要改变字体也很难,反正我没有找到,然后我试了一下orc,结果识别率并不高,有的识别能出来。如果你有耐心的话,建议你orc后自己一个个的改过来。
pdf转换成word乱码
打开word出现提示转换文档打开是乱码的原因:
1.可能是低版本打开高版本。或者是格式不相同。
2.文档损坏了。
解决办法:
方法一:利用word2002/2003的“打开并修复”功能来修复文挡。
(1)启动word2002/2003,单击“文件-----打开”,在“打开”对话框中选重要修复的word文挡。
(2)单击“打开”按钮右边的下三角按钮,在弹出的下拉菜单中选中“打开并修复”选项,即可对损坏的文挡进行修复,修复完成后,显示文挡内容。
提示:“打开并修复”是只有word2002以上的版本才具有的功能。
方法二:转换文挡格式来修复文挡。
如果使用的是word2002以下的版本(如word2000),可以用此方法来修复文挡。
(1)启动word2000后单击“工具------选项-------常规”。在该选项卡中选中“打开时确认转换”复选框,并单击“确定”按钮。
(2)单击“文件---打开”,在弹出的“打开”对话框中选中要恢复的文件,并在“文件类型”框中选中“从任意文件中恢复文本”。
(3)单击“打开“按钮自动对孙换文挡进行转换修复。
(4)如果显示的文挡内容混乱,单击“文件---另存为”,将文挡保存为“rtf格式”或其他word所识别的格式。
(5)保存后关闭文挡,再次打开以“rtf格式”保存的文挡即可看到完整的文挡。
(6)再将文挡保存为“doc格式”即可,这样就完成了对孙换文挡的修复操作。
提示:此方法也同样只可以在word2002以上的版本中使用。
方法三:重设格式法
word用文档中的最后一个段落标记关联各种格式设置信息,特别是节与样式的格式设置。这样我们就可以将最后一个段落标记之外的所有内容复制到新文档,就有可能将损坏的内容留在原始文档中。步骤如下:
①在word中打开损坏的文档,选择“工具→选项”然后选择“编辑”选项卡,取消“使用智能段落选择范围”复选框前的勾。取消选中该复选框,选定整个段落时,word将不会自动选定段落标记,然后单击“确定”按钮。
②选定最后一个段落标记之外的所有内容,方法是:按“ctrl+end”组合键,然后按“ctrl+shift+home”组合键。
③在常用工具栏中,依次单击“复制”、“新建”和“粘贴”按钮。
方法四:禁止自动宏的运行
如果某个word文档中包含有错误的自动宏代码,那么当你试图打开该文档时,其中的自动宏由于错误不能正常运行,从而引发不能打开文档的错误。此时,请在“windows资源管理器”中,按住shift键,然后再双击该word文档,则可阻止自动宏的运行,从而能够打开文档。
方法五:
用修复软件,如docrepair。
,1.可能是低版本打开高版本。或者是格式不相同。,2.文档损坏了
如果pdf是图片转化来的,就不会识别的。你还不如直接把pdf保存成jpg图片,然后用ocr软件直接识别。再一个如果pdf底纹太重的话,也识别不了的。
pdf有一种是word文本直接转成pdf的,这种方法的pdf再软化成word就非常方便。还有一种pdf是photoshop之类的图像软件制作的,这种方式制作的pdf只能再转换成图片,然后再用ocr识别。
方正ocr是一个比较好用的,我的印刷厂经常会排人家拿现成的书,我就让打字员用扫描仪扫描,保存成jpg格式的图片,然后就用方正ocr识别。
另外office 2003及以后的所有版本,只要是安装企业完全版,并且在安装时选择自定义,就都有图像识别成word文档的功能。这个功能在开始-程序-office -office 工具中。
本人遇到要将pdf格式转化成word格式 乱码问题 尝试...
汉王pdf_converter能很快而且准确地将pdf文件转换成用word打开的rtf文件,并且是免费版的
下载网址
http://xiazai.zol.com.cn/detail/33/326858.shtml
如果转换后全是扫描图片,用汉王文豪7600进行识别