pdf转word经验浅谈2007年04月21日 星期六 下午 12:08#isubb#介绍一款scansoft同微软共同研发的软件scansoft pdf converter for microsoft插件。该插件可以帮助我们将pdf文档转换为word文档,并且完全保留原来的版式。 下载pdf converter后,解压,执行autorun.exe,直接进行安装,安装完成后不须任何设置,它会自动整合到word中。当我们在word中点击“打开”菜单时,在“打开”对话框的“文件类型”下拉菜单中可以看到“pdf”选项,这就意味着我们可以用word直接打开pdf文档了! scansoft pdf converter的工作原理其实很简单,它先捕获pdf文档中的信息,分离文字、图片、表格和卷,再将它们统一成word格式。由于word在打开pdf文档时,会将pdf格式转换成doc格式,因此打开速度会较一般的文件慢。打开时会显示pdf converter转换进度。转换完毕后可以看到,文档中的文字格式、版面设计保持了原汁原味,没有发生任何变化,表格和图片也完整地保存下来了,可以轻松进行编辑。 除了能够在word中直接打开pdf文档外,右击pdf文档,在弹出菜单中选择“open pdf in word”命令也可打开该文件。另外,它还会在outlook中加入一个工具按钮,如果收到的电子邮件附件中有pdf文档,就可以直接点击该按钮将它转换成word文件。 有时我们在网上搜索到pdf格式的文件,同样可以通过右键菜单的相关命令直接在word中打开它。 美中不足:在word中完成对pdf文档的编辑后,只能将它保存为word格式,无法直接存为pdf格式。不过,现在把文件转换为pdf格式的软件非常多,例如acrobat5.0自带的虚拟打印机acrobat assistant、pdf995、go2pdf和本报第2期介绍的pdffactory等等。另外,该软件对中文的支持还有待改进。 scansoft and 同微软共同组队开发了一个全新的 office 2003 插件。该插件可以帮助你通过 word直接将 pdf 文档转换为word文档,并且完全保留原来的格式和版面设计。 这个名为 scansoft pdf converter for microsoft word 的插件是首先捕获pdf文档中的信息,分离文字同图片,表格和卷,再将其统一到word格式。现在你可以重新利用早先你从网络上下载或email中收到的pdf文件中的信息,而无需添加任何其他软件。 scansoft pdf converter for microsoft 已经非常紧密的同 office 2003整合在一起了,在 microsoft word 2003 中你可以直接通过 “file>>open” 来打开pdf 文件, 其次scansoft 也已经开发了基于此的smart tag(office 2003中重要的功能元件)能够轻松的的通过右键来将pdf文件转换成为 microsoft word 文件。 scansoft pdf converter for microsoft word能够让你: 1.在microsoft office直接打开pdf文件! 2.在microsoft outlook直接打开email附件里的pdf文件! 3.随时随地用右鼠键做文件转换! 4.把网上的pdf文件直接在word里打开! 使用说明: 1.首先请确定你已经卸载了旧版本的程序! 2.运行setup目录中的文件进行安装! code:serial #: b309d-833-3e2d-34ee-33 3.安装结束后复制cr目录中的shkpc10.exe文件到安装目录,并运行此文件激活程序! 4.恭喜你,你成功了! 注:安装的时候建议关闭正在运行的word,internet explorer和outlook!
前些天由于要对几份pdf文件进行编辑,所以要转成word,不过在google上找了半天,也没能找到一个满意的。不过还好最后功夫不负有心
人,终于找到一个很好用的的软件,在此我和大家一起分享一下。
日常工作学习中有关的学术论文或学术报告包括我们所用的课程教材都以pdf格式保存,如果我们要对它们进行编辑的话,那么就得将它们
转换成word格式的,不过现在市面上大多数的pdf转word的转换软件或插件都只支持英文,对中文的支持实在不敢恭维。不过有一个软件对中文
的支持是不过的,值得推荐,那就是solid converter pdf,它的功能极其强大,可以很好的分离pdf里的文字和图片资料,而且还可以按照用
户的要求进行不同形式的排版。而现在的大多数的pdf都是有密码保护的,这些pdf就不是能随便进行编辑的了,而关于这个的密码破解我强烈
推荐:apdfpr这个专用的密码破解小工具,它的工作原理不是将密码算出来,而是直接将密码移除,这样破解的速度可想而知了,而且效果奇
佳。如果哪位实在找不到我所说的那两个软件的话,可以发email给我:mathsmathsdadadi@163.com。或者可以用msn或qq和我联系,我的qq是231769168。
在qq里创建了一个群11390668,要apdfpr这个小软件的朋友可以到这个群的共享文件夹里找到。
刚刚申请了一个动态域名,大家也可以到这个网址去下载试试ftp://ht:ht@lionzoon.3322.org/pdfword.rar一般在晚上11:00之前都能连上去的。不过我不保证一定可以下哦,呵呵,还只是在测试阶段。
至于word转pdf市面的工具可谓铺天盖地,所以也没什么好说的了。
转载得,请参考网址:
http://hi.baidu.com/22659045/blog/item/4b7e332d6e104935349bf707.html
可以用scansoft pdf converte,安装完成后不须任何设置,它会自动整合到word中。当我们在word中点击“打开”菜单时,在“打开”对话框的“文件类型”下拉菜单中可以看到“pdf”选项,这就意味着我们可以用word直接打开pdf文档了!
scansoft pdf converter的工作原理其实很简单,它先捕获pdf文档中的信息,分离文字、图片、表格和卷,再将它们统一成word格式。由于word在打开 pdf文档时,会将pdf格式转换成doc格式,因此打开速度会较一般的文件慢。打开时会显示pdf converter转换进度。转换完毕后可以看到,文档中的文字格式、版面设计保持了原汁原味,没有发生任何变化,表格和图片也完整地保存下来了,可以轻松进行编辑。
除了能够在word中直接打开pdf文档外,右击pdf文档,在弹出菜单中选择“open pdf in word”命令也可打开该文件。另外,它还会在outlook中加入一个工具按钮,如果收到的电子邮件附件中有pdf文档,就可以直接点击该按钮将它转换成word文件。
有时我们在网上搜索到pdf格式的文件,同样可以通过右键菜单的相关命令直接在word中打开它。
但是,pdf文件格式的特殊性众所周知,因此在转换时,需要针对不同情况选择不同的方法。如何将pdf文件转换为txt格式恐怕是目前大家最关心的话题了,在转换的过程中通常会出现2种可能的情况,本文将针对这2种情况,为您详细介绍具体的转换方法。
第一种情况: 文件内容多为文字
如果需要转换的pdf文件的内容不是pdf图片,且内容不多,可以在打开pdf文件后,点击工具栏中含有“t”字样的“文本选择工具”按钮,在鼠标指针变为“i”字型后,通过拖拽鼠标选定当前页中需要复制的文本内容,然后选择“编辑”*“复制”,将选定的内容复制到剪贴板,最后到其他的编辑软件中进行“粘贴”即可。
如果需要转换的pdf文件的内容比较多,您可以使用第三方软件aerial达到批量转换的目的。aerial是adobe acrobat软件的一个插件,其30天免费试用版的下载地址为
http://www.ambia.com
。虽然aerial的使用说明中指出它只能支持acrobat reader 3.0版本,但是经验证明,它同样支持acrobat reader 5.0中文版,只需在安装时将默认路径改变为acrobat reader 5.0的安装路径即可。
aerial安装完成后,在acrobat reader工具栏的“增效工具”菜单中就会多出一个“aerial”子菜单(如图1所示)。依次选择“增效工具”*“aerial”*“save as rif”,进入“save as rif”对话框(如图2所示)。在“general”选项卡中,选择适合的输出程序和输出页码范围,然后单击“file name”按钮指定保存文件名,再次单击“ok”按钮即可将文件转换为rif格式,最后使用word打开rif文件并保存为txt文档即可。当然,您还可以使用一些专门的转换工具,例如著名的pdftools等。
第二种情况: 文件内容多为图片
如果需要转换的pdf文件全部是pdf格式图片,这时aerial等其他第三方插件就无能为力了。如果文件很大,整个过程则会比较烦琐。
1.pdf文件转换成bmp文件
当然,您完全可以将pdf文件打开后,使用抓图工具一页一页地抓取并保存成bmp文件,但是这显然是最笨的解决方法了。这里我们向您推荐一款实用的工具软件――konvertor_pdf2xxx,它可以一次性将所有页面转换为连续的多个bmp文件,其免费试用版下载地址为
http://www.tucows.com/mmedia/preview/220570.html
。具体使用方法如下。
请对比下载的界面操作:
(1)选中“input setup”项目的“paths”选项卡,在“source path”文本输入栏中指定需要转换的pdf文件所在的文件夹; 点击“select files”按钮,在弹出的“select”对话框中,选择需要转换的pdf文件; 选中“output setup”项目的“paths”选项卡,在“target path”文本输入栏中指定转换后生成bmp文件的保存路径。
(2)选中“input setup”项目的“output”选项卡,在“output format”下拉列表中设定文件格式为bmp,在“misc”选项卡中设置需要转换pdf文件的页码范围,以及转换时的分辨率。
根据笔者经验,普通的五号字体(100%显示比例)的pdf图片采用250~300dpi即可; 如果字号比较大(即四号以上),采用150~200dpi较好; 如果是六号或七号字,可以考虑使用400~500dpi。当然,您也可以根据图片的实际质量加大分辨率。但需要注意的是,当分辨率超过600dpi后,系统的转换速度会直线下降,有时候甚至会发生假死机等情况。
接下来,选中“output setup”项目的“misc”选项卡,在“target file name”项目中设置生成bmp文件的名称,在“resize”项目中设定生成bmp图片长和宽的像素值。如果pdf图像文件自身的质量不是很好,可以适当地将像素值设定得大一些,例如1600×1200; 然后,在“bmp”选项卡中设置图片颜色为“black & white”选项。
(3)单击“launch”按钮开始格式转换,生成的bmp文件将保存在前面指定的位置,转换所需的时间跟您的设置有很大关系。
2.通过ocr软件将图片中的字符识别出来
这里推荐您使用清华紫光的ocr光学字符识别软件,您可以到清华紫光的主页
http://www.thunis.com/default.htm
下载清华紫光ocr 2000 千禧专业版。
选择“文件”*“打开”,在弹出的“打开”对话框中,选中前konvertor_pdf2xxx转换得到的bmp图片。然后,选择“命令”*“全部识别”,一次性将所有打开的bmp图片进行识别。最后,选择“文件”*“导出”,在弹出的“导出为”对话框中定义保存的文件名,并指定保存文件类型为txt即可。
更多内容你可以看:
http://topic.csdn.net/t/20040803/09/3236461.html