word导出的pdf乱码-为什么我的电脑上pdf文档用word文档打开就是乱码,如...

2022-12-15 05:03:05

为什么我的电脑上pdf文档用word文档打开就是乱码,如...

word不能打开pdf文件:
pdf全称portable document format，译为可移植文档格式，是一种电子文件格式。这种文件格式与操作系统平台无关，也就是说，pdf文件不管是在windows，unix还是在苹果公司的mac os操作系统中都是通用的。这一特点使它成为在internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用pdf格式文件。pdf格式文件目前已成为数字化信息事实上的一个工业标准。
如果要打开它请下载一个pdf阅读器软件.

pdf转换成word文档后,数字字母均变成乱码?

如何把pdf文档转换成word文档先了解一下: pdf文档到底是什么？
pdf是出版和图形领域的软件厂商adobe制定的电子文档格式标准。adobe为之提供了免费的文档浏览器--adobe acrobat reader以及相应的编辑软件--adobe acrobat，后者可以对pdf文档中页面的组织、链接进行编辑，对文档进行批注等等。而adobe的另外一款软件--illustrator则可以从各个细致入微处修整pdf文件。与普通格式的电子文档(如纯文本、超文本、rtf格式以及word文档等)相比，pdf文档具有能够完善保持版面样式、跨平台等优越性，所以国外许多组织机构在发放无需再次编辑的文件时通常选择使用pdf格式。在我国，许多电子书籍也开始采用pdf格式。
创建pdf文件的典型方法并不是使用illustrator等软件来编辑，而是先用普通的文字处理和桌面排版软件如word、wordperfect和pagemaker等编排好文档，然后通过adobe的pdf distiller或者pdf writer等仿打印机引擎制作pdf文件。另外也有一些pdf文档是直接使用adobe acrobat配合扫描仪将原书稿扫描制作完成的，虽然该软件配有支持对多种西方文字进行光学字符识别(ocr)的插件，但是为了保证文字的可靠性，多数情况下采用这种方法制作的pdf文件没有进行字符识别。

如何把pdf文档转换成word文档
一款非常好的pdf向doc格式转换的工具，scansoft pdf converter for microsoft word v1.0。它是由scansoft公司同微软共同组队开发了一个全新的office 2003 插件。该插件可以帮助你通过word直接将pdf文档转换为word文档，并且完全保留原来的格式和版面设计。
这个名为 scansoft pdf converter for microsoft word 的插件是首先捕获pdf文档中的信息，分离文字同图片，表格和卷，再将其统一到word格式。现在你可以重新利用早先你从网络上下载或email中收到的pdf文件中的信息，而无需添加任何其他软件。
scansoft pdf converter for microsoft 已经非常紧密的同office 2003整合在一起了，有两种方式可以将pdf格式转换成doc文件。
第一种方式，在microsoft word 2003中你可以直接通过“文件”―>“打开”来打开pdf文件。scansoft pdf converter for microsoft word插件会自动弹出了，经过转换后我们就可以得到想要的doc文件。
第二种方式，scansoft公司也已经开发了基于此的smart tag(office 2003中重要的功能元件)能够轻松的通过右键来将pdf文件转换成为 microsoft word 文件。
===========================
pdf文件中的文字存在两种可能性: 其一，可能是以计算机字符代码的形式被包裹在文件中; 其二，也可能只是一个页面图像中的像素组成的线条，没有字符代码信息。很明显，只有第一种pdf文档可以通过word打开和编辑。
如何让word读取包含字符信息的pdf文档。由于adobe公司在2000年就发布了4.x版本的acrobat reader，比以往的版本功能有所增强，所以我们就以这个版本为例来讨论。
实际上，word至今也没有pdf文档的转换器，因而无法对其直接读取。我们采用的还是"剪刀+浆糊"的办法。
1．拷贝文字
通常情况下，如果需要拷贝pdf中某一页面上的所有文字，您可以进行如下操作。
定位页面。
单击工具栏上的"text select tool"按钮。
选择"edit"*"select all"，再选择"copy"。
切换到word，按"粘贴"按钮(或ctrl＋v)把内容贴到word文档中。

如果需要拷贝的是整篇pdf文档，则可以按照下面的步骤进行。
打开pdf文件后，选择"view"*"continuous"。
选择"edit"*"select all"。
拷贝选中的内容。
切换到word，粘贴内容。

使用这种方法拷贝到word文档中的文字会保持基本的字符格式，比如粗体、斜体、字符大小等等，但是不会具有样式等方面的设置。对于较复杂的文档，可能需要耐心进行调整。
2．拷贝图片
如果需要拷贝pdf文档中的图片，首先要找出一个隐藏的工具按钮"graphics select tool"。具体办法如下。
（1）按下"text select tool"按钮，不要松开鼠标左键，该按钮会向右延展，显示出额外的几个按钮。根据按钮的文字提示，选择正确的按钮(熟悉photoshop、coreldraw等绘图软件的用户对于这种一钮多用的情况并不陌生)。
（2）把鼠标指针移到pdf页面上，此时指针呈十字形。拖动选择好图片区域，拷贝。
（3）回到word文档，粘贴即可。
拷贝图片不仅支持拷贝pdf文档中的图片到word，实际上，我们可以选择任意区域，如文字区、图片区、文字和图片混合区，拷贝后粘贴到word中，它们都会被当作图片插入到word文档。
需要注意的是，有的pdf文档由于制作的时候设置了某些安全选项，禁止我们拷贝其内容。如果要了解这方面的设置，可以通过选择"file"*"document info"*"security"查看。如果其中的"selecting text and graphics"一项被设置为"no"，这时上述拷贝文字和图像方法就不起作用了。此时，惟一的权宜之计就是使用print screen键或者其他的抓图软件获取某些pdf文档的画面。

我的pdf转word也是乱码!怎么解决呢?

如果pdf是图片转化来的，就不会识别的。你还不如直接把pdf保存成jpg图片，然后用ocr软件直接识别。再一个如果pdf底纹太重的话，也识别不了的。
pdf有一种是word文本直接转成pdf的，这种方法的pdf再软化成word就非常方便。还有一种pdf是photoshop之类的图像软件制作的，这种方式制作的pdf只能再转换成图片，然后再用ocr识别。
方正ocr是一个比较好用的，我的印刷厂经常会排人家拿现成的书，我就让打字员用扫描仪扫描，保存成jpg格式的图片，然后就用方正ocr识别。
另外office 2003及以后的所有版本，只要是安装企业完全版，并且在安装时选择自定义，就都有图像识别成word文档的功能。这个功能在开始-程序-office -office 工具中。

上一页：PDF转Word使用哪款浏览器最方便？

下一页：word能合并pdf软件-谁知道有哪个软件可以将扫描WROD文件做成一个PDF格...