1由于我使用的是foxit reader.所以我就以此软件为例,讲述把pdf转换成word并手动排版的过程。首先介绍一下pdf文字有如下两种情况,一种放大文字显得不是很规范,一种则是标准字体排版的,现在的阅读器的文字选取功能基本上都能进行大概的识别,但是第二种的准确率是明显高于第一种的。所以首先推荐你使用第二种效果的pdf做转换。
2新建一个word文档。设置好格式(在转换过程中建议一步步的来尤其是有图片的情况下,图片多的情况word排版容易出问题所以建议一段段的来,至于怎么一步步,接着看)
3点击这个t字按钮,这是文本选择工具,点击之后用鼠标选取文段就会高亮显示。然后右键可以选择复制该段内容。(可以先把文字都复制,但是公式之类的会成乱码建议多次复制或者复制之后再删除)
4把文字都粘贴到word中。粘贴之后你会发现文档格式很乱,有很多回车键怎么处理呢。首先点击替换按钮,输入^p。如果输入不了可能是输入法的半角全角没切换(请切换到英语输入法半角)替换里面全不填,然后全部替换。
5现在回车是没了,整个文档没了段落变成了一整团。这时候点击替换,在上面输入两个空格,下面输入^p和两个空格(如果你不知道输入^p那么点击更多在特殊格式里面找到段落标记选定它就可以了)
如果替换的结果是没有被替换,在输入空格的时候就把输入法的半角改成全角。
还有注意我说的这次的^p后面有两个空格。然后选择全部替换。
6然后段落就出来了,然后设置字体格式,文字阶段就设置好了。
7然后是处理文档中的图片,在阅读器中点击照相机工具,然后框选图片,右键复制图片(比较复杂的公式建议使用保存图片的方法复制直接用文本识别没有格式而且容易乱码)。然后在word中的对应位置粘贴图片。(按顺序来从头到尾,一次完成,不然就会很麻烦)
8双击图片,在图片的排列方式里面修改一下成为四周密排就可以自由设置图片的位置了。如果你不想图片左右有字则要输入一系列回车,直到回车超过图片区域。然后逐步就可以把文档做成word了
9虽然工作量大很多,但是保证比软件转成的要实用的多。当然具体情况具体分析,排版很简单的pdf,用工具一样可以很快很简单的完成。
1、实现工具:office 2003中自带的microsoft office document imaging
应用情景:目前国外很多软件的支持信息都使用pdf方式进行发布,如果没有adobe reader,无法查看其内容,如果没有相关的编辑软件又无法编辑pdf文件。转换为doc格式则可以实现编辑功能。尽管有些软件也可以完成pdf转换为doc的工作,但很多都不支持中文,我们利用office 2003中的microsoft office document imaging组件来实现这一要求最为方便。
使用方法:
第一步:首先使用adobe reader打开待转换的pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。
编辑提示:如果你在“名称”设置的下拉列表中没有找到“microsoft office document image writer”项,那证明你在安装office 2003的时候没有安装该组件,请使用office 2003安装光盘中的“添加/删除组件”更新安装该组件。
第二步:运行microsoft office document imaging,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。
编辑提示:目前,包括此工具在内的所有软件对pdf转doc的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。
2、实现工具:solid converter pdf
应用情景:利用office 2003中的microsoft office document imaging组件来实现
pdf转word文档在一定程度上的确可以实现pdf文档到word文档的转换,但是对于很多“不规则”的pdf文档来说,利用上面的方法转换出来的word文档中常常是乱码一片。为了恢复pdf的原貌,推荐的这种软件可以很好地实现版式的完全保留,无需调整,而且可以调整成需要的样板形式。
使用方法:
1、下载安装文件solid converter pdf,点击安装。
编辑提示:安装前有个下载安装插件的过程,因此需要保证网络连接通畅。
2、运行软件,按工具栏要求选择需要转换的pdf文档,点击右下的“转换”(convert)按扭,选择自己需要的版式,根据提示完成转换
1、ocr(光学辨识软件)转换
扫描版pdf,以及由图片直接转换成的pdf,用常规软件转换成word文档后,内容仍旧是图片,不能进行文字编辑,要用ocr软件进行图片文字识别转换。
ocr软件也可用于文本内容的pdf转换。有些文本内容的pdf使用了非常规编码,用常规软件转换后是乱码,只能用ocr软件转换。
abbyyfinereader是最著名的ocr软件。该软件也具有将pdf转换为ppt、excel等格式的功能。
2、adobe acrobat
是目前最专业的pdf阅读与编辑软件,与著名的photoshop等同属adobe公司旗下产品。
打开pdf后,点击工具栏上的“文件----另存为其它”,再选择文件格式。
推荐安装adobe acrobat x以上版本。