2022-12-15 05:12:05
为什么我的电脑上pdf文档用word文档打开就是乱码,如...
word不能打开pdf文件:
pdf全称portable document format,译为可移植文档格式,是一种电子文件格式。这种文件格式与操作系统平台无关,也就是说,pdf文件不管是在windows,unix还是在苹果公司的mac os操作系统中都是通用的。这一特点使它成为在internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用pdf格式文件。pdf格式文件目前已成为数字化信息事实上的一个工业标准。
如果要打开它请下载一个pdf阅读器软件.
pdf转换成word文档后,数字字母均变成乱码?
如何把pdf文档转换成word文档 先了解一下: pdf文档到底是什么?
pdf是出版和图形领域的软件厂商adobe制定的电子文档格式标准。adobe为之提供了免费的文档浏览器--adobe acrobat reader以及相应的编辑软件--adobe acrobat,后者可以对pdf文档中页面的组织、链接进行编辑,对文档进行批注等等。而adobe的另外一款软件--illustrator则可以从各个细致入微处修整pdf文件。与普通格式的电子文档(如纯文本、超文本、rtf格式以及word文档等)相比,pdf文档具有能够完善保持版面样式、跨平台等优越性,所以国外许多组织机构在发放无需再次编辑的文件时通常选择使用pdf格式。在我国,许多电子书籍也开始采用pdf格式。
创建pdf文件的典型方法并不是使用illustrator等软件来编辑,而是先用普通的文字处理和桌面排版软件如word、wordperfect和pagemaker等编排好文档,然后通过adobe的pdf distiller或者pdf writer等仿打印机引擎制作pdf文件。另外也有一些pdf文档是直接使用adobe acrobat配合扫描仪将原书稿扫描制作完成的,虽然该软件配有支持对多种西方文字进行光学字符识别(ocr)的插件,但是为了保证文字的可靠性,多数情况下采用这种方法制作的pdf文件没有进行字符识别。
如何把pdf文档转换成word文档
一款非常好的pdf向doc格式转换的工具,scansoft pdf converter for microsoft word v1.0。它是由scansoft公司同微软共同组队开发了一个全新的office 2003 插件。该插件可以帮助你通过word直接将pdf文档转换为word文档,并且完全保留原来的格式和版面设计。
这个名为 scansoft pdf converter for microsoft word 的插件是首先捕获pdf文档中的信息,分离文字同图片,表格和卷,再将其统一到word格式。现在你可以重新利用早先你从网络上下载或email中收到的pdf文件中的信息,而无需添加任何其他软件。
scansoft pdf converter for microsoft 已经非常紧密的同office 2003整合在一起了,有两种方式可以将pdf格式转换成doc文件。
第一种方式,在microsoft word 2003中你可以直接通过“文件”―>“打开”来打开pdf文件。scansoft pdf converter for microsoft word插件会自动弹出了,经过转换后我们就可以得到想要的doc文件。
第二种方式,scansoft公司也已经开发了基于此的smart tag(office 2003中重要的功能元件)能够轻松的通过右键来将pdf文件转换成为 microsoft word 文件。
===========================
pdf文件中的文字存在两种可能性: 其一,可能是以计算机字符代码的形式被包裹在文件中; 其二,也可能只是一个页面图像中的像素组成的线条,没有字符代码信息。很明显,只有第一种pdf文档可以通过word打开和编辑。
如何让word读取包含字符信息的pdf文档。由于adobe公司在2000年就发布了4.x版本的acrobat reader,比以往的版本功能有所增强,所以我们就以这个版本为例来讨论。
实际上,word至今也没有pdf文档的转换器,因而无法对其直接读取。我们采用的还是"剪刀+浆糊"的办法。
1.拷贝文字
通常情况下,如果需要拷贝pdf中某一页面上的所有文字,您可以进行如下操作。
定位页面。
单击工具栏上的"text select tool"按钮。
选择"edit"*"select all",再选择"copy"。
切换到word,按"粘贴"按钮(或ctrl+v)把内容贴到word文档中。
如果需要拷贝的是整篇pdf文档,则可以按照下面的步骤进行。
打开pdf文件后,选择"view"*"continuous"。
选择"edit"*"select all"。
拷贝选中的内容。
切换到word,粘贴内容。
使用这种方法拷贝到word文档中的文字会保持基本的字符格式,比如粗体、斜体、字符大小等等,但是不会具有样式等方面的设置。对于较复杂的文档,可能需要耐心进行调整。
2.拷贝图片
如果需要拷贝pdf文档中的图片,首先要找出一个隐藏的工具按钮"graphics select tool"。具体办法如下。
(1)按下"text select tool"按钮,不要松开鼠标左键,该按钮会向右延展,显示出额外的几个按钮。根据按钮的文字提示,选择正确的按钮(熟悉photoshop、coreldraw等绘图软件的用户对于这种一钮多用的情况并不陌生)。
(2)把鼠标指针移到pdf页面上,此时指针呈十字形。拖动选择好图片区域,拷贝。
(3)回到word文档,粘贴即可。
拷贝图片不仅支持拷贝pdf文档中的图片到word,实际上,我们可以选择任意区域,如文字区、图片区、文字和图片混合区,拷贝后粘贴到word中,它们都会被当作图片插入到word文档。
需要注意的是,有的pdf文档由于制作的时候设置了某些安全选项,禁止我们拷贝其内容。如果要了解这方面的设置,可以通过选择"file"*"document info"*"security"查看。如果其中的"selecting text and graphics"一项被设置为"no",这时上述拷贝文字和图像方法就不起作用了。此时,惟一的权宜之计就是使用print screen键或者其他的抓图软件获取某些pdf文档的画面。
如果pdf是图片转化来的,就不会识别的。你还不如直接把pdf保存成jpg图片,然后用ocr软件直接识别。再一个如果pdf底纹太重的话,也识别不了的。
pdf有一种是word文本直接转成pdf的,这种方法的pdf再软化成word就非常方便。还有一种pdf是photoshop之类的图像软件制作的,这种方式制作的pdf只能再转换成图片,然后再用ocr识别。
方正ocr是一个比较好用的,我的印刷厂经常会排人家拿现成的书,我就让打字员用扫描仪扫描,保存成jpg格式的图片,然后就用方正ocr识别。
另外office 2003及以后的所有版本,只要是安装企业完全版,并且在安装时选择自定义,就都有图像识别成word文档的功能。这个功能在开始-程序-office -office 工具中。