如果pdf文件是用图片做成的,不管你怎么转,还是图片。这样,就只能把图片用photoshop打开,另存为tiff文件,然后再用office自带的文字识别工具office document imaging(需要在安装office时自定义安装office工具才会有),识别后就可以转为word里,进行编辑。
office2003实现pdf文件转word文档
经过尝试,发现可以利用 office 2003 中的 microsoft office document imaging 组件来实现
pdf转word文档,也就是说利用word来完成该任务。方法如下:
用adobe reader 打开想转换的pdf文件 ,接下来 选择 “文件→打印”菜单,在打开的“打印”窗口中将 “打印机”栏中的名称设置为 “microsoft office document image writer”,确认后将该pdf文 件输出为 mdi格式的虚拟打印文件 。
注: 如果没有找到“microsoft office document image writer”项,使用office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“office 工具 microsoft draw转换器”。
然后, 运行 “microsoft office document imaging”,并利用它来 打开 刚才保存的mdi文件,选择“工具→ 将文本发送到word ”菜单,在弹出的窗口中选中“ 在输出时保持图片版式不变 ”,确认后系统会提示“必须在执行此操作前重新运行 ocr 。这可能需要一些时间”,不管它, 确认 即可。
注: 对pdf转doc的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
以上仅在 word2003 中可用,其他版本没有microsoft office document image writer。