如何把adobe acrobat 的pdf格式的文档转为word能够读取、编辑的文档。对于这个问题,不少用户存在两种误解。一是认为adobe acrobat pdf文档是图形格式,无法被word读取; 二是认为虽然pdf也包含文字代码信息,但word没有相应的pdf格式转换器,所以无法读取。本文将向您介绍如何把pdf文档读入word。
了解pdf文档
---- pdf文档到底是什么?
---- pdf是出版和图形领域的软件厂商adobe制定的电子文档格式标准。adobe为之提供了免费的文档浏览器--adobe acrobat reader以及相应的编辑软件--adobe acrobat,后者可以对pdf文档中页面的组织、链接进行编辑,对文档进行批注等等。而adobe的另外一款软件--illustrator则可以从各个细致入微处修整pdf文件。与普通格式的电子文档(如纯文本、超文本、rtf格式以及word文档等)相比,pdf文档具有能够完善保持版面样式、跨平台等优越性,所以国外许多组织机构在发放无需再次编辑的文件时通常选择使用pdf格式。在我国,许多电子书籍也开始采用pdf格式。
---- 创建pdf文件的典型方法并不是使用illustrator等软件来编辑,而是先用普通的文字处理和桌面排版软件如word、wordperfect和pagemaker等编排好文档,然后通过adobe的pdf distiller或者pdf writer等仿打印机引擎制作pdf文件。另外也有一些pdf文档是直接使用adobe acrobat配合扫描仪将原书稿扫描制作完成的,虽然该软件配有支持对多种西方文字进行光学字符识别(ocr)的插件,但是为了保证文字的可靠性,多数情况下采用这种方法制作的pdf文件没有进行字符识别。
---- 从以上的介绍我们可以看出,pdf文件中的文字存在两种可能性: 其一,可能是以计算机字符代码的形式被包裹在文件中; 其二,也可能只是一个页面图像中的像素组成的线条,没有字符代码信息。很明显,只有第一种pdf文档可以通过word打开和编辑。
让word读取pdf文档
---- 下面我们就来看一下如何让word读取包含字符信息的pdf文档。由于adobe公司在2000年就发布了4.x版本的acrobat reader,比以往的版本功能有所增强,所以我们就以这个版本为例来讨论。
---- 实际上,word至今也没有pdf文档的转换器,因而无法对其直接读取。我们采用的还是"剪刀+浆糊"的办法。
---- 1.拷贝文字
---- 通常情况下,如果需要拷贝pdf中某一页面上的所有文字,您可以进行如下操作。
定位页面。
单击工具栏上的"text select tool"按钮。
选择"edit"*"select all",再选择"copy"(如图1所示)。
切换到word,按"粘贴"按钮(或ctrl+v)把内容贴到word文档中。
--- 如果需要拷贝的是整篇pdf文档,则可以按照下面的步骤进行。
打开pdf文件后,选择"view"*"continuous"(如图2所示)。
选择"edit"*"select all"。
拷贝选中的内容。
切换到word,粘贴内容。
---- 使用这种方法拷贝到word文档中的文字会保持基本的字符格式,比如粗体、斜体、字符大小等等,但是不会具有样式等方面的设置。对于较复杂的文档,可能需要耐心进行调整。
---- 2.拷贝图片
---- 如果需要拷贝pdf文档中的图片,首先要找出一个隐藏的工具按钮"graphics select tool"。具体办法如下。
---- (1)按下"text select tool"按钮,不要松开鼠标左键,该按钮会向右延展,显示出额外的几个按钮(如图3所示)。根据按钮的文字提示,选择正确的按钮(熟悉photoshop、coreldraw等绘图软件的用户对于这种一钮多用的情况并不陌生)。
---- (2)把鼠标指针移到pdf页面上,此时指针呈十字形。拖动选择好图片区域,拷贝。
---- (3)回到word文档,粘贴即可。
---- 拷贝图片不仅支持拷贝pdf文档中的图片到word,实际上,我们可以选择任意区域,如文字区、图片区、文字和图片混合区,拷贝后粘贴到word中,它们都会被当作图片插入到word文档。
---- 需要注意的是,有的pdf文档由于制作的时候设置了某些安全选项,禁止我们拷贝其内容。如果要了解这方面的设置,可以通过选择"file"*"document info"*"security"查看(如图4所示)。如果其中的"selecting text and graphics"一项被设置为"no",这时上述拷贝文字和图像方法就不起作用了。此时,惟一的权宜之计就是使用print screen键或者其他的抓图软件获取某些pdf文档的画面。
pdf(portable document format)文件格式是adobe公司所开发的一种特殊的文本格式,这种文本格式最大的优点是其尺寸较小、阅读方便,非常适合在网络上传播和使用。现 在,很多产品的说明书都使用pdf格式,例如电子书籍、产品白皮书,包括很多产品的技术资料都是pdf格式。但是如果想要对其进行文本或格式进行编辑一类 的操作就会比较困难,因为pdf格式与doc格式解码格式不同,在pdf下的回车符、换行符以及相关的图片格式无法直接转换为doc文件.
* pdffactory 是一个无须 acrobat 创建 adobe pdf 文件的打印机驱动程序。pdffactory 提供的创建 pdf 文件的方法比其他方法更方便和高效。 功能包括: 多个文档整合到一个 pdf 文件中; 内嵌字体; 通过 e-mail 发送; 预览; 自动压缩优化。
* adobe reader 6.0 standard:菜单栏有个按钮“创建pdf”,点击后可以选择创建的途径,选择“从文件”,然后选中需要转换成pdf格式的文件即可。刚才的按钮下还有好几个功能,其中有个“从多个文件”可以将多个文件合并成pdf文件。
* acrobat distiller,有了它也可轻松实现转换.要用office word 打开该doc文件,然后在“文件”―>“打印”中选择acrobat distiller 打印机即ok。
* 首先这里下载go2pdf还有补丁安装后在:开始>设置>控制面板>打印机和传真机中出现virtual pdf printer图标,右键设为默认打印机,打开word文档在工具栏内点打印,就出现一个另存为的对话框,此时发现保存类型变为了pdf,点击保存就ok了 .
* adobe acrobat 7.0 professional:adobe7 使用了激活,需用paradox key generator生成,解压后的rar文档里有一个叫作"keygen"的,就是它了。运行文件夹里的"pdx-ac7p.exe"(paradox key generator),然后用该组生成的s/n安装(只是第一行数字),安装后重新启机,启动进入acrobat,在弹出的菜单上选择"activate option",点击"activation by telephone",此时在该弹出菜单acrobat会产生一组activation code,此时再执行paradox key generator,将刚才界面产生的s/n及activation code依次输入paradox key generator,按其上的"generate auth code"按键取得authorization code,再手工输入后大功告成!
* 使用office2003自带的工具转换:首 先使用adobe reader打开待转换的pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。如 果在“名称”设置的下拉列表中没有找到“microsoft office document image writer”项,那证明你在安装office 2003的时候没有安装该组件,请使用office 2003安装光盘中的“添加/删除组件”更新安装该组件。运行microsoft office document imaging,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确 认后系统提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。
* 小提示:microsoft office document imaging对pdf转doc的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
* 注:pdf本身就是可编辑的,常见的一些不可编辑是因为被作者权限控制掉,有专门的工具可以解除该限制.解除pdf的限制工具为:pdfcrack.exe
* 关 于pdf的权限问题,有些pdf可以直接打开,但是安全属性里面设置了一些保护,这样在转换文件的时候会提示权限不够,方法很简单:使用软件进行解密,试 过几种软件,最好用的还是passware_acrobat key,其次是adult pdf password recovery v2.2.0和pdf password remover v2.2,这几种就够用了。不过,有打开权限密码的破解会比较麻烦,只能使用字典和暴力破解,而且颇为费时;其次是pdf文件里的表格能否转换为 excel的问题,在没有发布adobe acrobat 7.0 pro之前的版本基本上是不行的,但是最新已经有adobe acrobat 7.0 professional中文版发布了,安装一个完整版本,结果消耗了650mb硬盘空间,在这个版本里好像已经可以将表格复制到excle里面了.
* pdfgrabber 3.0.0.12(可以将pdf文件格式转换成excel、rtf或者word格式):用于导出pdf文件的工具,可以将pdf文件格式转换成excel、rtf或者word格式.pdfgrabber允许在其他应用程序如word,excel或者access中编辑和进一步处理pdf内容而不用安装acrobat.pdfgrabber显著的特点是其有效的输出模式管理和自动检测任何数目的输入目录recosoft pdf2office personal v2.0软件也可以将pdf文件转换成doc格式,也支持中文,如果有专业版就更好了。
* 怎样才能把ppt文件改成pdf格式?文电通pdf转档器 (pdf driver),超小只有12mb,开启文件就可以直接转换;可制作pdf格式文档。
另四款有关pdf的软件
“苗条”的pdf阅读器
小巧实用的软件才是最欢迎的软件, foxit reader2.0这款“苗条”的pdf阅读器,软件安装体积只有区区的1.6mb,但是功能一点都不逊色。软件界面与acrobat reader非常的相似,不过启动速度远远超过了acrobat reader,占用系统资源也比较少。软件提供了多语言支持,可以通过选择“language→simplified chinese”,下载相应插件后即可转换为中文界面。除了可以实现acrobat reader的所有功能外,foxit reader还可以对pdf文档进行高亮注释、下划线注释、删除线注释、文本注释等操作,还可以使用箭头、线条、圆圈、矩形等各种图形标注工具对pdf文 档进行标注。
pdf文件制作利器
pdf文档使用很简单,然而如何将常用的doc、excel等文档制作成pdf格式呢?其实,有了pdfcreator,一切问题变得非常的简单。 pdfcreator是一个开源应用程序,支持windows打印功能的任何程序都可以使用它创建pdf文档。软件安装后会生成虚拟打印机,任何支持 windows打印功能的程序生成的文件,在打印时只要选择生成的pdfcreator虚拟打印机,就可轻轻松松的转换为pdf文档,并且可以生成 postscript文档、encapsulated postscript 文件等格式。此外,你也可以将文件转换为png、bmp、jpeg、pcx、tiff等图形格式文件。
pdf转word文档同样简单
要想将pdf文档转换为可以进行重新编排格式的word文档,过程同样简单,只要使用“scansoft pdf converter for microsoft word”这款office插件即可。该插件安装后,可以在word软件中直接通过“文件→打开”选项来打开pdf文档。文件转换时,插件首先捕获pdf 文档中的信息,分离文字同图片,表格和卷,再将其统一到word格式,完全保留原来的格式和版面设计。当然,有了改插件,也可以轻松地通过右键来将pdf 文件转换成为word 文件,还可以在microsoft outlook直接打开email附件里的pdf文件,以及把网上的pdf文件直接在word里打开。
pdf文档的管理
pdf文档越来越多,对文档的管理变得非常的重要,以备文章的检索、阅读。有了active pdf searcher这款pdf文件管理软件,问题变得不再复杂。它是一个强大的pdf文档阅读与检索工具,具有强大的全文检索功能,并且支持多个pdf全文 检索。软件内置pdf解析和浏览引擎,以及一个5万词的中文词库,能够检索中文、英文及其它各种语言,检索速度快,使用非常方便。
“如果wps office 2005专业版早生几年,很难想像中国的office市场是否还会是国外产品一家独大。”一位office资深用户,在使用过wps office 2005专业版后,发出如此感慨!
笔者在安装wps office 2005专业版整体试用后,亦欣喜不已。
wps office 2005专业版的三个功能软件――wps文字、wps表格、wps演示,与国外通用软件的word、excel、powerpoint一一对应,在功能完备性上,也不输于国外通用软件,并且在互联网应用上,具有突出的特点。
用户一直都很关心的兼容问题,wps office 2005专业版也已经取得了超乎想象的飞跃,所以,这次评测,我们焦点首先指向兼容性和互联网应用。
测试产品: wps office 2005专业版
产品简介:
wps office 2005 专业版(下面简称wps 2005)包括wps文字、wps表格、wps演示三大功能软件,是一款跨平台的办公软件。它既可以在windows操作系统上运行,还可以运行在主流的linux操作系统上。
wps 2005 本身就是按照跨平台技术研发的产品,笔者比较了windows平台和linux平台下同一份文件的效果,结果发现效果完全一致。
最佳推荐功能一:高度兼容成就office孪生兄弟
一直讲求差异发展的wps,在2005版本上彻底调整了技术路线,把兼容作为最大的突破重点。笔者发现,这种“兼容精神”已经大大超越以往的软件界面、文件格式的相同或相通,真正渗透进了软件底层技术,在加密、宏等类“技术型”文件的互通性上得到突破。
不可否认,在盗版的推动下,国外office的使用习惯,已经成为默认的标准,这是任何其它office厂商都不可回避、必须面对的事实。如何让用户以最小的转换代价,给予产品最大的认可和满足,是一直困扰金山的问题。2002年经过4个月的痛苦抉择,金山最后做出了一个让业界刮目的决定:全部放弃已有14年历史的传统wps技术,重构代码,打造新一代办公平台!
今天我们终于迎来了涅盘重生的wps office 2005专业版,感受它的惊人变化。
该软件由三个模块构成,wps文字、wps表格,wps演示严格对应ms office的word、excel、powerpoint,无论wps哪个模块软件,我们看到的都是典型xp风格的操作界面,工具栏和一些功能按钮的设置几乎与ms office完全一致,如果不是文件左上角的图标提示,用户实在难分彼此。
同ms office保持一致,实现对用户操作习惯的兼容,用户才能真正做到“零时间”上手,这样大大降低了软件推广使用的难度,同时有效减少培训时间,大大降低软件迁移成本。
做到操作习惯的兼容仅仅是“兼容精神”的表象体现,各类文件可以打开,内容显示无差别,这才是用户关心的核心问题。的确如此,尤其在这个讲求交流和沟通的时代,岂能容忍因为不兼容问题带来的无法与外界交流的障碍。所以,如果wps 2005文件格式不能与ms office彻底兼容,那wps 2005用户不就变成孤岛上的鲁宾逊了。
让我们马上来看看wps 2005在与ms office文件内容识别上,有怎样的表现。
wps 2005与国外主流office的兼容,不是wps 2005只能打开别的office文件的那种一般意义的单向兼容,而是突破性的双向兼容!格式的兼容还不止于此,我们注意到,ms office与wps 2005相互读取的文件,不论是中文文件,还是英文文件,都可达到一字不差、一行不差的精确效果!笔者认为,达到这种精确兼容程度,金山公司一定是在技术上取得了重大突破。因为有些国外office企业曾经认为,一字不差、一行不差的兼容是不可能实现的。
不仅仅是文件格式和操作习惯的兼容,笔者经过试用还意外发现,在知道密码的情况下,wps office 可以直接打开加了密的doc、xls、ppt文件。不仅如此,wps office 2005还可以直接打开带有宏代码的doc文档,这解除了ms office 高级用户在文件传输过程中的后顾之忧。
加解密文件通道的打通和可直接运行vba宏代码这两个深度兼容性的实现,对于其他office软件来说,目前还是一个难于突破的技术瓶颈。
wps表格可以跨excel文件进行数据引用,若改变了被引用的xls文件数据,wps表格文件中的引用数据会同步更新。这项功能体现了产品兼容的数据一致性和应用跨越性。
wps演示在动画效果、图形种类以及多母板支持上都体现了高度兼容。
最佳推荐功能二:互联网应用从“小”做起
中国互联网络信息中心发布的报告显示,截至今年6月30日,中国上网用户总数突破1亿,总数达到1.03亿户,办公的电脑化、互联网化已经成为一种现实。办公软件、互联网的使用已经不是少数人的专利。所以,能否与互联网有更紧密的结合,已经成为检验办公软件先进性的一项重要标准。
一套办公软件的安装程序只有23m,刚听到这种描述,笔者还不敢相信。亲自动手安装后才意识到,这个“小”,恰恰会为wps 2005的互联网应用奠定基础。
我们已经习惯了国外软件动辄四五百兆占用较大硬盘空间、长时安装才能完成的事实,第一次见到wps 2005,着实有了欣喜,不仅仅是因为该软件安装包仅有23m,而且还因为记者第一次安装时,2分钟就完成了所有操作。
这个产品还有一个显著的特点,即可以采用直接复制安装目录的方式去安装软件或直接删除安装目录的办法卸载软件,应用非常绿色。
近年来,杀毒软件采用互联网在线升级的方式为用户提供了便捷的服务。现在,wps 2005将杀毒软件自动升级的功能移植到了办公软件应用上。
wps 2005的自动升级功能,无需用户做任何操作,当有最新的技术研究成果时,wps 2005将更新自动下载安装。此功能保证用户可以在最短时间内获得wps 2005最新功能。这
种升级方式还很灵活,用户既可以通过互联网实现升级,也可以是通过局域内的服务器进行升级,非常方便。
wps 2005 中,首次应用了一项叫krm的授权保护技术。根据金山公司的研发人员介绍,这项技术的作用是:用户可根据需要,设置授权范围,包括是否允许、允许多大范围内的对象读取、修改文件等。应用该技术后,文件网络传送的安全性得到了很大的提升,文件授权用户不用记住复杂的密码,仅使用金山通行证,即可轻松、安全的传输、使用文件。简单地说就是采用通行证授权的方式,而非密码授权的方式对文件做读、写、修改的管理。
据金山公司介绍,产品正式推出时,会通过互联网提供海量文件模版及素材,帮助用户提升办公效率。目前金山公司并没有公布模版及素材获取的途径,据记者了解,金山公司对这个功能的评价很高,在wps 2005正式上市时,模版及素材获取的途径也将同时公布,不知道到时是否会给用户一个惊喜?我们共同期待吧!
十大亮点功能
虽然兼容ms office是核心,但毕竟ms office是基于西文行文规范而研发的办公软件,笔者试用wps 2005过程中还是发现了一些更符合中文特色的功能,很值得推荐。
文件标签
受各网络浏览器使用习惯的影响,在文件切换时,有些用户习惯于采用直观的文档标签方式。在wps office2005中对这种应用提供了两种选择,即传统的窗口切换方式和文件标签方式,让用户可以按照自己的喜好进行使用。
文字工具
在早期的wps office 版本里,就有一组很让用户称道的文字工具(删除空格、增加空格、删除段首空格、增加段首空格、段落重排、删除空段),这组功能对于那些需要经常从互联网上转摘文字的用户来说,非常方便。因为我们都知道,在转摘文章时,经常会出现大量的空格、空段,如果没有这项功能,那用户还要自己再去编辑,很麻烦。现在这个功能,wps 2005同样保留。
稿纸方式
稿纸作为金山文字的特色之一,在wps office 2005专业版中有更加全面的表现,不但能够将全篇文档都设置为稿纸,而且还可以通过将文档分节实现稿纸格式和空白格式的混合排版。
表格中人民币大写
在表格制作时,很多用户都有使用人民币大写的需要,在wps 2005的表格中,就提供了一个特殊的功能:提供阿拉伯数字自动转换为人民币大写的功能,满足广大财会人员制作报表的需要。
中文表格的表元斜线应用
在表格编辑时,我们经常会使用到斜线表头功能,国外主流 office的斜线表头,在使用上比较麻烦,比如在改变表头大小时,斜线不会跟随其自动缩放,致使版式混乱。而wps 2005中,不论表格大小如何调整,斜线表头都能够保持一致。
强大的pdf输出功能
现在,pdf文件已经成为世界上通用文件格式的之一,很多用户在日常使用中,都会使用到pdf输出功能。与其他office不同,wps 2005在pdf输出时,能够完整保留原文档各种特殊内容,并提供完善的pdf文件权限设置功能,而且自动形成目录,带有索引功能。
图10:强大的pdf输出功能
丰富的打印功能
wps 2005三个功能软件中提供的打印功能很让我服气。比如她特别提供了反片打印功能,可以轻松打印幻灯片,另外还有拼版、双面打印、文件套打等功能,真是方便又实用。
修订功能
在日常办公中,我们会经常使用到修订功能,但有时间是好几个人在同一篇文件上进行修订和批注,如果是电子格式,还可以根据颜色不同进行区分,但如果是打印稿,颜色都差不多,修订、批注者的身份就无法区分了。在wps 2005中,就针对这种情况,wps 2005实现了能够记录作者身份的功能点。
图11:能区分修订者身份的修订功能
全面的演示功能
在wps 演示中,除了具有国外主流office的功能外,还多了一项为用户提供了不同效果的幻灯片、讲义、备注页打印,如每页3张备注页等效果,非常方便实用。
当然,wps 2005的贴心功能并不仅限于这些,其它的如电子表格支持中国纸张规格、 支持蒙文竖排等特殊排版方式、文本框间的文字绕排,都很实用,但受到篇幅的制约,无法一一展开。
开发者的福音
wps 2005 对于那些有二次开发需求的用户来说,会有很强的吸引力,因为她不仅提供与vba、vb、java、delphi、vc等多种开发语言的开发接口,并在开发版中还提供vba开发环境。开发接口采用标准com接口,数量多达256类,使得oa用户可以快速平滑迁移应用。
至于可扩展的插件、控件机制,与电子政务的无缝链接,wps office 2005 政府版都已经有了成功的应用案例,wps office 2005专业版应该也不会存在什么问题。
综述:
从上面评测可以看出,wps office 2005专业版是一款极具竞争力的office产品,不仅在界面风格及主体功能上做到了与主流office“一模一样”,而且在加密文件、宏文件这两个高级兼容性上的实现,证明了她与国外主流office的兼容已经达到了无障碍的境界!
而软件轻小、互联网化、安全等互联网特点的突出表现,使得她有实力挑战任何对手。虽然晚生几年,但后发制人也并非不可能!
摘录 回答者:crq1688