pdf转word
1. 可检索内容的pdf(内容可以用鼠标选中的非双层pdf)文件
推荐用下面软件转换
1.1 用 anybizsoft pdf converter v2.5 转换
1.2 用 solid converter pdf v6转换,
这两个效果都是蛮好的,特别是solid converter pdf v6 .
2. 对于是图片做成的pdf(特别是扫描件做成的pdf)文件
推荐用下面软件转换
2.1 页数比较少的用 cajviewer 7.0 (带ocr组件完整版) ,支持直接打开pdf文件,识别文字。
2.2 页数比较多的可以用 readiris corporate 12软件来进行识别 (需要安装亚洲语言包,不然不识别中文)
2.3 页数比较多的还可以用 abbyy finereader 9或者9以上版本(有简体中文版)进行识别转换。
这个软件的识别率很高,转换出来的版面基本保持原样,还可以手动人工框选识别,缺点就是识别速度较慢。
上面几个软件的识别率都还可以,不建议用什么office组件识别,太麻烦识别率也不高。
3. 对于一些不允许做修改的pdf文件(就是加密加了权限的pdf),那么就先要去除密码或者去除数字证书,才能照上面两个步骤做~~~
office2003实现pdf文件转word文档 经过尝试,发现可以利用 office 2003 中的 microsoft office document imaging 组件来实现pdf转word文档,也就是说利用word来完成该任务。方法如下: 用adobe reader 打开想转换的pdf文件 ,接下来 选择 “文件→打印”菜单,在打开的“打印”窗口中将 “打印机”栏中的名称设置为 “microsoft office document image writer”,确认后将该pdf文 件输出为 mdi格式的虚拟打印文件 。 注: 如果没有找到“microsoft office document image writer”项,使用office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“office 工具 microsoft draw转换器”。 然后, 运行 “microsoft office document imaging”,并利用它来 打开 刚才保存的mdi文件,选择“工具→ 将文本发送到word ”菜单,在弹出的窗口中选中“ 在输出时保持图片版式不变 ”,确认后系统会提示“必须在执行此操作前重新运行 ocr 。这可能需要一些时间”,不管它, 确认 即可。 注: 对pdf转doc的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。 以上仅在 word2003 中可用,其他版本没有microsoft office document image writer。