pdf转word
1. 如果不是图片类做成的pdf 你可以尝试用verypdf pdf2word 工具或者使用solid converter pdf 转换 但是如果是内嵌了字体的,那么就要看情况了,因为有的字体你系统里面有,转出来就没有问题,如果系统里面没有,那么转出来就是一堆乱码,那么就先要把这些pdf文件转成位图形式(也就是常说的pdf转曲)然后再用工具转,当然这时候上面的2个工具基本无能为力了
2.对于是图片做成的pdf 那么我们就需要用ocr类软件进行识别了,你可以用比较简单的cajviewer来提取 但是只能是一页页提取文字,或者你可以使用readiris corporate 12软件来进行识别,但是readiris corporate 12呢需要下载支持韩语 日语还有简体中文的亚洲语言包才是识别中文,但是这个软件的ocr识别率是比较好的~~~~当然还有abbyy finereader 也是一款识别率很高的软件,关键还支持中文识别~~也是一款不可多得的ocr软件,这里我强力推荐这个软件。
3. 对于一些不允许做修改的pdf文件(就是加密加了权限的pdf),那么就先要去除密码或者去除数字证书,才能照上面两个步骤做~~~