office2003实现pdf文件转word文档
经过尝试,发现可以利用 office 2003 中的 microsoft office document imaging 组件来实现
pdf转word文档,也就是说利用word来完成该任务。方法如下:
用adobe reader 打开想转换的pdf文件 ,接下来 选择 “文件→打印”菜单,在打开的“打印”窗口中将 “打印机”栏中的名称设置为 “microsoft office document image writer”,确认后将该pdf文 件输出为 mdi格式的虚拟打印文件 。
注: 如果没有找到“microsoft office document image writer”项,使用office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“office 工具 microsoft draw转换器”。
然后, 运行 “microsoft office document imaging”,并利用它来 打开 刚才保存的mdi文件,选择“工具→ 将文本发送到word ”菜单,在弹出的窗口中选中“ 在输出时保持图片版式不变 ”,确认后系统会提示“必须在执行此操作前重新运行 ocr 。这可能需要一些时间”,不管它, 确认 即可。
注: 对pdf转doc的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
以上仅在 word2003 中可用,其他版本没有microsoft office document image writer。
当我们在安装acrobat时,可以选择安装它的word插件,安装好后就可以在使用word时看到多了两个按钮,一个是将word文档存为pdf格式,另外一个是将word文档存为pdf并发email.我们只是利用第一个就够了,将word文档存为pdf格式后,用acrobat打开再另存一次,然后将pdf文件用adobe illustrator 10或更高版本打开,最好是在同一台机器上进行,这样不会因为字体而发生变化。打开后在adobe illustrator将文字转换为曲线,表格并不会发生任何变化,与原来的word文档一模一样,这样你可以将word文档转换成了已转成曲线的ai或eps文件,就可以任意编辑和输出了!