由于我使用的是foxit reader.所以我就以此软件为例,讲述把pdf转换成word并手动排版的过程。首先介绍一下pdf文字有如下两种情况,一种放大文字显得不是很规范,一种则是标准字体排版的,现在的阅读器的文字选取功能基本上都能进行大概的识别,但是第二种的准确率是明显高于第一种的。所以首先推荐你使用第二种效果的pdf做转换。
新建一个word文档。设置好格式(在转换过程中建议一步步的来尤其是有图片的情况下,图片多的情况word排版容易出问题所以建议一段段的来,至于怎么一步步,接着看)
点击这个t字按钮,这是文本选择工具,点击之后用鼠标选取文段就会高亮显示。然后右键可以选择复制该段内容。(可以先把文字都复制,但是公式之类的会成乱码建议多次复制或者复制之后再删除)
把文字都粘贴到word中。粘贴之后你会发现文档格式很乱,有很多回车键怎么处理呢。首先点击替换按钮,输入^p。如果输入不了可能是输入法的半角全角没切换(请切换到英语输入法半角)替换里面全不填,然后全部替换。
现在回车是没了,整个文档没了段落变成了一整团。这时候点击替换,在上面输入两个空格,下面输入^p和两个空格(如果你不知道输入^p那么点击更多在特殊格式里面找到段落标记选定它就可以了)
如果替换的结果是没有被替换,在输入空格的时候就把输入法的半角改成全角。
还有注意我说的这次的^p后面有两个空格。然后选择全部替换。
然后段落就出来了,然后设置字体格式,文字阶段就设置好了。
然后是处理文档中的图片,在阅读器中点击照相机工具,然后框选图片,右键复制图片(比较复杂的公式建议使用保存图片的方法复制直接用文本识别没有格式而且容易乱码)。然后在word中的对应位置粘贴图片。(按顺序来从头到尾,一次完成,不然就会很麻烦)
双击图片,在图片的排列方式里面修改一下成为四周密排就可以自由设置图片的位置了。如果你不想图片左右有字则要输入一系列回车,直到回车超过图片区域。然后逐步就可以把文档做成word了
虽然工作量大很多,但是保证比软件转成的要实用的多。当然具体情况具体分析,排版很简单的pdf,用工具一样可以很快很简单的完成。
参考:
如何手动把pdf表格转换成word
http://jingyan.baidu.com/article/6b97984d7dcfcf1ca2b0bf1d.html
pdf转为word格式可以采取六款软件,anybizsoft pdf converter v2.5、solid converter pdf v6 / v7、e-pdf pdf 2 word converter 2.5、cajviewer 7.0、abbyy finereader v9、readiris corporate 12,其中前三个适用于普通的pdf文件(里面内容可以用鼠标选中的),后三个适用于图片类或者是扫描件做成的pdf文件(通常网络上下载的书本都是这个形式的)。你要有针对性的选择合适的软件转换出来才有最好的效果。
1
anybizsoft pdf converter v2.5
anybizsoft pdf converter 是一款pdf 转多种格式的软件,select部分是你要转换输出的格式,你要什么格式就选择什么格式,前提是你一定要安装微软的office办公软件。
add files按键就是添加你要转换的文件用的,可以批量的。
output setting部分就是输出设置部分,是设置文件输出保存位置的,可以是源pdf文件位置或你也可以自定义。最后那个大大的convert按键就是转换开始键了。这个软件对于中文字体的支持还是不错的,就是有时候版面会有点错乱。不过胜在支持多格式转换。而且转换速度比较快。
2
solid converter pdf v6/ v7
solid converter pdf v6是一个
pdf转word的神器,支持pdf转换成word、excel、图片、html等等,当然这个软件还带有pdf的加水印、修改等功能。
转换速度虽然比较慢,但是转换出来的效果是非常好的,版面维持的几乎不变,还有一项最好的功能就是能够转换部分直接复制是乱码的pdf。
3
e-pdf pdf 2 word converter 2.5
e-pdf pdf 2 word converter 是一款功能比较单一的软件,只能是pdf转word。但那是这个软件的转换速度和版面的还原能力都是比较好的,而且有中文汉化版的便于操作。只需转换word格式的朋友推荐使用。
4
cajviewer 7是中国知网的专用浏览器,也支持pdf格式的阅读,完整版本是带有ocr组件的(约37m左右)。打开pdf文件以后在工具栏上有一个放大镜下面打一个勾的上面还有一个字和a的那个图标工具就是ocr工具。选择这个工具 然后拉框选择识别区域,稍等一会儿就会有文字识别结果对话框出来,那里面的文字就是识别提取出来的人,如果你要整个pdf转换,你可以在菜单栏 文件---另存为文本就可以了。
5
abbyy finereader v9
abbyy finereader v9是我见过的最强大的pdf(图片格式或者是扫描件)转word的软件。它是一款ocr软件,界面比较简洁明,9.0和以上版本有简体中文版的,支持100语言的识别,特别是混合多种语言识别效果也非常好。
国内的ocr软件仅仅是对中文的识别比较好而已。而且,这款软件只要你设置好识别文件所用的语言然后打开pdf文件(支持直接打开的)然后其他的工作就交给软件了,识别完后 文件------另存为word格式就可以了。而且版面的保持能力是我见过的ocr软件里面最好的一个,识别率也是最高的一个,就是转换识别的速度比较慢。只要pdf文件比较清晰,准确率基本可以达到95%以上(除了数学公式、计算式、化学式、分子式、三角函数等专业的内容之外),强力推荐大家使用。如果你要识别韩语pdf文件的话请使用10.0版本,9.0不支持韩语的识别的。
6
readiris corporate 12
readiris corporate 12也是一款ocr软件,同样支持100多种语言的识别,但是要识别亚洲语言还要额外安装亚洲语言词典才行。识别能力也是非常高的,就是版面的保持能力比abbyy 的略差一筹,而且转换速度比较慢,对pdf文件的兼容性略差一点。识别等等都要比国内的ocr软件高出不少,也是一款不可多得的软件。
总结:当然pdf转word的软件还有很多种,上面介绍的几个软件只是本人转换了上千个pdf文件在无数个转换软件中挑选出来的比较好的软件,特地总结一些经验大家共勉,免得大家走太多弯路。
怎样把pdf转换成word
最后,因为pdf是可以加密加权限的,所以如果遇到已加密的pdf文件要先解密以后才可以转换的。
对于可以打开阅读,但是限制了复制打印等功能的pdf文件,一般可以用pdf password remover 3或者pdf unlocker 去掉加密权限,然后再转换。(如果pdf password remover 3没有注册 只支持解密3页内容)。
在“开始”菜单的“microsoft office工具”中打开microsoft office document imaging,在左侧窗口中单击鼠标右键,选择“粘贴页面”,把复制的图片粘贴到document imaging中,在“工具”中选择 “使用ocr识别文本”,document imaging的ocr识别程序就会对图片进行识别,完成后选择“工具”中的“将文本发送到word”,程序会自动打开word文档,转换完成!
大家可以用这种方法,把css管理手顺的文档转移到word中,变成可以编辑文字的模式,这样翻译起来就方便多了!
实现工具:solid converter pdf 1、下载安装文件solid converter pdf,点击安装2、运行软件,按工具栏要求选择需要转换的pdf文档,点击右下的“转换”(convert)按扭,选择自己需要的版式,根据提示完成转换。