兄弟我也在做这个功能呢,把我的思路说给你听听,第一使用虚拟打印技术把pdf文档打印成图片,组成word文档,缺点是 文档容量大。可降低图片质量。第二使用剪切板把pdf 每页内容读取出来用 past 方法粘贴到新建的word中(格式容易混来,做起来难度较大),我推荐第一种把.pdf
to word 难度很大的 如果你是c++ ,java实现的话 会容易很多。
http://www.pdftoword.com/
,我喜欢用这个网站转换,是全免费的,很好用,也不用装软件,非常方便,进入网站后,要先设置自己收邮件的邮箱地址,然后上传文件,选择要转换成的格式,系统会把转换好的文件发到你设置的收信邮箱。
pdf格式编辑软件很多:
1.abbyy finereader,最好的pdf转换成word的软件,也可以进行ocr识别成word格式,识别率高,网上有pj。
2.汉王hw_pdf_ocr_80可以转换成word或txt,免费软件,也可以进行ocr识别成txt;
3.用solid converter pdf professional 可以在pdf与word互相转换,也就可以编辑了;
4.用adreamsoft_pdf_toword以转换成word,就可以编辑了;
5.汉王pdf_converter,免费软件,可以让pdf转换成word或txt;
6.用foxit pdf editor可以直接编辑了,网上有pj的软件;
7.用foxit phantom可以直接编辑了,网上有pj的软件。
8.abobe acrobat professional 也有部分编辑功能,网上有pj的软件。
9.anybizsoft pdf to word是一款专业的
pdf转word格式的免费转换软件。
10.小丑鱼pdf转换器,免费软件。
pdf文件如果加密了:对于一些不允许做修改、复制、打印等的pdf文件(就是加密加了权限的pdf),那么就先要去除密码或者去除数字证书,软件有:
1.pdf password remover
2.adult pdf password recovery
如果不是图片类做成的pdf 你可以转换成word格式后进行编辑, 但是如果是内嵌了字体的,那么就要看情况了,因为有的字体你系统里面有,转出来就没有问题,如果系统里面没有,那么转出来就是一堆乱码;一些用户为了避免别人转换,特意引入了一些特殊字体,复制和转换出来都是乱码。
对于是图片和没有字体(乱码)做成的pdf文件,那么我们就需要用ocr类软件进行识别了,软件有:清华紫光ocr;尚书七号;leadtools ocr;赛酷ocr;汉王ocr(推荐);abbyy finereader(推荐)