pdf 无法编辑,这不是缺点,而是它的定位。
pdf 虽然无法编辑,但可以进行注释。
为什么转换pdf到其他格式?技术角度,是为了二次编辑和后续利用;但这样做的时候,请注意版权问题。
一定要转到word格式?不一定。如果文档只有文字,则建议转为txt或rtf。如果还有一些不算复杂的图表、图片,转为htm也是可以接受的。但如果格式复杂,或者你对 html 不了解,也不妨转为doc格式[1]。
本文以及善用佳软全站的关注点是“原则、思考方法、解决方案”,而不是“软件”。如果念条咒语,或挥几下手就能把pdf转为word,为什么一定要软件呢?
一、推荐的pdf转换word方案
1. 莫忘最基本的“复制/粘贴”法
寻找“高级”办法之前,不妨先试一下最基本的方法:打开pdf文档,复制全文;然后,在word中粘贴。如果文档格式不复杂,这样得到的结果就够用了。
2. gmail用户的福利:pdf格式转换
gmail[2]很早就解决了pdf查看问题。因此,把pdf文档发到gmail信箱,在附件一侧,就有”以html格式查看”链接。如果你一定需要doc格式,请复制html内容到word。
优点:速度快、可信、很多人已经有gmail信箱(没有?那就注册一个吧);各种语言编码的文字都应该可以转换。
缺点:pdf中的图片好象有问题。
3. 号称最精准的 pdftoword.com 在线转换
pdftoword.com 号称是目前最为精准的pdf to word文件转换器,出自著名的pdf解决方案供应商nitropdf。
pdftoword.com是在线应用,完全免费,使用方便:
- 访问pdftoword.com:①上传pdf→②选定格式(doc/rtf)→③输入接收邮箱;
- 进入邮箱:查收转换后的word文档。
web 2.0 share的评价:“……pdftoword 无愧于精准之王,对中文同样转换很好,文字方面不多说了,大家可以自己测试。pdftoword 在排版方面确实有独到之处,特别介绍一个细节,pdftoword 转换后的文档仍以段落为单位,没有很多的换行符,而以前大多转换器都是以行为单位,以致末尾有很多的换行符,你复制粘贴时会有许多麻烦……”
二、其他软件或在线应用
pdfundo.net在线转换
注:网站已失效。
在线的
http://pdfundo.net
(名称很有意思),可以上传pdf文档,30秒-几分钟即可转换为doc,并给出下载链接。它也有相应的客户端软件。[via lifehacker]
优点:免费、在线、直接生成doc
缺点:试转了一份台湾朋友制作的pdf(原始文件也根本不是word,繁体中文),发现很多汉字无法显示。
更多在线
pdf转word应用
电脑玩物曾做过一个 测试 ,对比了4个在线应用。但由于测试的特殊要求――11mb,立即转换――只有最好一个应用达成了目标。因此,并未对转换质量进行对比。
http://www.zamzar.com/
,多格式转换网站,文档上限1gb,转换工作需要排队等待。
http://www.pdftoword.com/
,上限 10mb,需要等待。
http://convertpdftoword.net
,文件名须为英文。
http://www.pdfonline.com/pdf2word/index.asp
,速度较快,“pdf的版面样式与文字「基本上」都有成功转换,仔细检查的话会发现在一些特殊格式的地方会漏掉一两个字没有转出来,但这都很好解决,只要自己补上就好”。
共享软件 e-pdf to word converter
共享软件 e-pdf to word converter(usd 35)在转换pdf到word类软件中,也属于效果较好的一款。
小众软件评价:…… e-pdf 可以把 pdf 文件比较完美的转换成 word 文档,我用104页的 pdf 做了测试,除了少数地方,其余都属于完美转换了……
网上其他介绍:e-pdf to word converter 是一款将adobepdf文档转换成 word 文档的工具软件,它支持文字,图像及其它内容的输出。这款软件可以脱离 microsoft word,adobe acrobat 或 acrobat reader 独立运行。完美的中文支持和原始版面转换,基本做到了百分百的原汁原味……目前唯一发现的不足,数字会被转换成全角数字,不知道可否在word中批量把数字换回半角,另外有些文字大小会小一号。试用了超多的pdf转word工具了,应该说这个是所见过版面保留最好的了,虽然还是有点缺憾。
ms office document imaging 将pdf转为word
如果你购买了ms office的相应套件,则可通过ms office document imaging进行pdf到word的转换。
microsoft office document imaging 是ms office的一款选装组件,用于印刷文档的图像化扫描存储,并具有ocr功能。因此,也可以先把pdf虚拟打印为 microsoft office document imaging 格式 (mdi) ;再通过ocr转为可编辑的word文档。(官方帮助: 2)
转载一下操作步骤:
① 从pdf到mdi:在pdf阅读器中,打印pdf,打印机选“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。 (注:如果没有找到“microsoft office document image writer”项,使用office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“office 工具 microsoft draw转换器”。 )
② 从mdi到word:document imaging 转换为运行“microsoft office document imaging”,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,确认即可。
三、结论
偶尔有pdf2doc需求的网友,建议先试用在线的gmail、pdftoword。如果质量不能满足需求,或转换的数量、速度有更多要求,可以试用/注册 e-pdf to word converter 等软件。
但无论哪种方法,在行动之前都值得想一下:真有必要从pdf转为word吗?
附录:注释
[1]:早期版本ms word采用封闭格式,wps和ooo通过各种技术手段才能与之保持尽力兼容,而其他无此实力(经济实力)的软件则不能编辑word。当然,可以用免费的wordviewer查看(应该也能复制到其他程序中吧)。新的ms office采取了xml格式,相对开放了一些。所以,也不应该基于过时的理由过于反对doc格式。但无论如何,请有如下意识:除了昂贵的ms office,还有个人免费的wps(非常小巧)、开源的ooo、在线的google doc;在很多情况下,你只使用了ms office的3%的功能;很多文档没有必要存为word格式。(感谢danei补充)
[2]: qq邮箱也支持pdf直接查看功能了。
pdf(portable document format)文件格式是adobe公司所开发的一种特殊的文本格式,这种文本格式最大的优点是其尺寸较小、阅读方便,非常适合在网络上传播和使用。现 在,很多产品的说明书都使用pdf格式,例如电子书籍、产品白皮书,包括很多产品的技术资料都是pdf格式。但是如果想要对其进行文本或格式进行编辑一类 的操作就会比较困难,因为pdf格式与doc格式解码格式不同,在pdf下的回车符、换行符以及相关的图片格式无法直接转换为doc文件.
* pdffactory 是一个无须 acrobat 创建 adobe pdf 文件的打印机驱动程序。pdffactory 提供的创建 pdf 文件的方法比其他方法更方便和高效。 功能包括: 多个文档整合到一个 pdf 文件中; 内嵌字体; 通过 e-mail 发送; 预览; 自动压缩优化。
* adobe reader 6.0 standard:菜单栏有个按钮“创建pdf”,点击后可以选择创建的途径,选择“从文件”,然后选中需要转换成pdf格式的文件即可。刚才的按钮下还有好几个功能,其中有个“从多个文件”可以将多个文件合并成pdf文件。
* acrobat distiller,有了它也可轻松实现转换.要用office word 打开该doc文件,然后在“文件”―>“打印”中选择acrobat distiller 打印机即ok。
* 首先这里下载go2pdf还有补丁安装后在:开始>设置>控制面板>打印机和传真机中出现virtual pdf printer图标,右键设为默认打印机,打开word文档在工具栏内点打印,就出现一个另存为的对话框,此时发现保存类型变为了pdf,点击保存就ok了 .
* adobe acrobat 7.0 professional:adobe7 使用了激活,需用paradox key generator生成,解压后的rar文档里有一个叫作"keygen"的,就是它了。运行文件夹里的"pdx-ac7p.exe"(paradox key generator),然后用该组生成的s/n安装(只是第一行数字),安装后重新启机,启动进入acrobat,在弹出的菜单上选择"activate option",点击"activation by telephone",此时在该弹出菜单acrobat会产生一组activation code,此时再执行paradox key generator,将刚才界面产生的s/n及activation code依次输入paradox key generator,按其上的"generate auth code"按键取得authorization code,再手工输入后大功告成!
* 使用office2003自带的工具转换:首 先使用adobe reader打开待转换的pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。如 果在“名称”设置的下拉列表中没有找到“microsoft office document image writer”项,那证明你在安装office 2003的时候没有安装该组件,请使用office 2003安装光盘中的“添加/删除组件”更新安装该组件。运行microsoft office document imaging,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确 认后系统提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。
* 小提示:microsoft office document imaging对pdf转doc的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
* 注:pdf本身就是可编辑的,常见的一些不可编辑是因为被作者权限控制掉,有专门的工具可以解除该限制.解除pdf的限制工具为:pdfcrack.exe
* 关 于pdf的权限问题,有些pdf可以直接打开,但是安全属性里面设置了一些保护,这样在转换文件的时候会提示权限不够,方法很简单:使用软件进行解密,试 过几种软件,最好用的还是passware_acrobat key,其次是adult pdf password recovery v2.2.0和pdf password remover v2.2,这几种就够用了。不过,有打开权限密码的破解会比较麻烦,只能使用字典和暴力破解,而且颇为费时;其次是pdf文件里的表格能否转换为 excel的问题,在没有发布adobe acrobat 7.0 pro之前的版本基本上是不行的,但是最新已经有adobe acrobat 7.0 professional中文版发布了,安装一个完整版本,结果消耗了650mb硬盘空间,在这个版本里好像已经可以将表格复制到excle里面了.
* pdfgrabber 3.0.0.12(可以将pdf文件格式转换成excel、rtf或者word格式):用于导出pdf文件的工具,可以将pdf文件格式转换成excel、rtf或者word格式.pdfgrabber允许在其他应用程序如word,excel或者access中编辑和进一步处理pdf内容而不用安装acrobat.pdfgrabber显著的特点是其有效的输出模式管理和自动检测任何数目的输入目录recosoft pdf2office personal v2.0软件也可以将pdf文件转换成doc格式,也支持中文,如果有专业版就更好了。
* 怎样才能把ppt文件改成pdf格式?文电通pdf转档器 (pdf driver),超小只有12mb,开启文件就可以直接转换;可制作pdf格式文档。
另四款有关pdf的软件
“苗条”的pdf阅读器
小巧实用的软件才是最欢迎的软件, foxit reader2.0这款“苗条”的pdf阅读器,软件安装体积只有区区的1.6mb,但是功能一点都不逊色。软件界面与acrobat reader非常的相似,不过启动速度远远超过了acrobat reader,占用系统资源也比较少。软件提供了多语言支持,可以通过选择“language→simplified chinese”,下载相应插件后即可转换为中文界面。除了可以实现acrobat reader的所有功能外,foxit reader还可以对pdf文档进行高亮注释、下划线注释、删除线注释、文本注释等操作,还可以使用箭头、线条、圆圈、矩形等各种图形标注工具对pdf文 档进行标注。
pdf文件制作利器
pdf文档使用很简单,然而如何将常用的doc、excel等文档制作成pdf格式呢?其实,有了pdfcreator,一切问题变得非常的简单。 pdfcreator是一个开源应用程序,支持windows打印功能的任何程序都可以使用它创建pdf文档。软件安装后会生成虚拟打印机,任何支持 windows打印功能的程序生成的文件,在打印时只要选择生成的pdfcreator虚拟打印机,就可轻轻松松的转换为pdf文档,并且可以生成 postscript文档、encapsulated postscript 文件等格式。此外,你也可以将文件转换为png、bmp、jpeg、pcx、tiff等图形格式文件。
pdf转word文档同样简单
要想将pdf文档转换为可以进行重新编排格式的word文档,过程同样简单,只要使用“scansoft pdf converter for microsoft word”这款office插件即可。该插件安装后,可以在word软件中直接通过“文件→打开”选项来打开pdf文档。文件转换时,插件首先捕获pdf 文档中的信息,分离文字同图片,表格和卷,再将其统一到word格式,完全保留原来的格式和版面设计。当然,有了改插件,也可以轻松地通过右键来将pdf 文件转换成为word 文件,还可以在microsoft outlook直接打开email附件里的pdf文件,以及把网上的pdf文件直接在word里打开。
pdf文档的管理
pdf文档越来越多,对文档的管理变得非常的重要,以备文章的检索、阅读。有了active pdf searcher这款pdf文件管理软件,问题变得不再复杂。它是一个强大的pdf文档阅读与检索工具,具有强大的全文检索功能,并且支持多个pdf全文 检索。软件内置pdf解析和浏览引擎,以及一个5万词的中文词库,能够检索中文、英文及其它各种语言,检索速度快,使用非常方便。
文章来源:
http://peiqingxin.cn
推荐pdfcreator,是一个开源应用程序,支持windows打印功能的任何程序都可以使用它创建pdf文档。软件安装后会生成虚拟打印机,任何支持 windows打印功能的程序生成的文件,在打印时只要选择生成的pdfcreator虚拟打印机,就可轻轻松松的转换为pdf文档,并且可以生成 postscript文档、encapsulated postscript 文件等格式。此外,你也可以将文件转换为png、bmp、jpeg、pcx、tiff等图形格式文件。
要的话留下邮箱发给你,也可自己搜索下载,免费。