2022-12-16 09:30:57
为什么我的电脑上pdf文档用word文档打开就是乱码,如...
word不能打开pdf文件:
pdf全称portable document format,译为可移植文档格式,是一种电子文件格式。这种文件格式与操作系统平台无关,也就是说,pdf文件不管是在windows,unix还是在苹果公司的mac os操作系统中都是通用的。这一特点使它成为在internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用pdf格式文件。pdf格式文件目前已成为数字化信息事实上的一个工业标准。
如果要打开它请下载一个pdf阅读器软件.
如果pdf是图片转化来的,就不会识别的。你还不如直接把pdf保存成jpg图片,然后用ocr软件直接识别。再一个如果pdf底纹太重的话,也识别不了的。
pdf有一种是word文本直接转成pdf的,这种方法的pdf再软化成word就非常方便。还有一种pdf是photoshop之类的图像软件制作的,这种方式制作的pdf只能再转换成图片,然后再用ocr识别。
方正ocr是一个比较好用的,我的印刷厂经常会排人家拿现成的书,我就让打字员用扫描仪扫描,保存成jpg格式的图片,然后就用方正ocr识别。
另外office 2003及以后的所有版本,只要是安装企业完全版,并且在安装时选择自定义,就都有图像识别成word文档的功能。这个功能在开始-程序-office -office 工具中。
为什么从pdf上粘贴到word中的文字是乱码
问题是多种多样的:
(1). 和您用的pdf转word的软件的能力有关。但情况难以一概而论。(我曾经试过把一篇下载的文字用不同软件转换成word,一向效果最理想的软件,反而莫名其妙地完全不懂辨认,其他的则反而给出不错的效果。)
(2). pdf的内容如果写有保护(有版权的,如我的sony数码相机的说明书便是),某些软件便可能出现word的结果是乱码的情况,但有些则索性说有版权保护,不能转换成word。
(3). 有时,不乱码,但段落、内容等也可能出现或多或少的问题。
我建议您到“电驴”(verycd.com)去下载多几款软件试试,然后保留结果比较让您满意的一两款。