2022-12-12 04:37:52
pdf转word问题,转换成word后,哪些文字还是一页一页...
![pdf转word问题,转换成word后,哪些文字还是一页一页...](https://www.llpdf.com/upload/editor/textimg/20221212/1670791072586.jpg)
这是由于你下载的
pdf文档是由扫描图像制作成的,而一般的pdf转换软件不能识别扫描图像制作成的pdf文档,所以还是图像文件,无法进行编辑。你只有使用ocr文字识别工具才能解决这个问题。现在比较好的ocr软件有abbyy finereader 10 corporate edition,你可以到网上搜索下载这个软件的破解版或者绿色 ,如果你自己解决不了,发到1497501080的qq邮箱。
从pdf转换成word后文字图标都显示,但是上下交错, 怎...
![从pdf转换成word后文字图标都显示,但是上下交错, 怎...](https://www.llpdf.com/upload/editor/textimg/20221212/1670791072669.jpg)
出现这种情况,需要考虑两个问题,一是pdf的制作源,如果是使用pdf虚拟打印机转化的文件,或是运用adobe indesign直接生成的pdf,一般不会出现上述状况,因为pdf文件中的内容(除人为设置编辑权限外)都是可以编辑的;如果pdf是从纸质材料上扫描、拍照后处理成图像的,就很容易出现上述问题,扫描和拍照的像素越低、版式混乱的可能性就越大,因为adobe pdf的内嵌版式控制符系统与word不相同。二是pdf转换软件,推荐使用solid pdf converter 7 汉化破解版,转换效果较好,转换时直接默认“页面流”(page flow)即可。
pdf转换后的word文字和原版面一样,每行的字数是固定...
![pdf转换后的word文字和原版面一样,每行的字数是固定...](https://www.llpdf.com/upload/editor/textimg/20221212/1670791072312.jpg)
对于你的描述 可以判断你的文件是图片做成的,solid是没有办法处理这样的文件的~~你可以按下面的方法做~~~这是我不断的实践中自己总结的:
2. 对于是图片做成的pdf(特别是扫描件做成的pdf)文件
推荐用下面软件转换
2.1 页数比较少的用 cajviewer 7.0 (带ocr组件完整版) ,支持直接打开pdf文件,识别文字。
2.2 页数比较多的可以用 readiris corporate 12软件来进行识别 (需要安装亚洲语言包,不然不识别中文)
2.3 页数比较多的还可以用 abbyy finereader 9或者9以上版本(有简体中文版)进行识别转换。
这个软件的识别率很高,转换出来的版面基本保持原样,还可以手动人工框选识别,缺点就是识别速度较慢。
上面几个软件的识别率都还可以,不建议用什么office组件识别,太麻烦识别率也不高。
3. 对于一些不允许做修改的pdf文件(就是加密加了权限的pdf),那么就先要去除密码或者去除数字证书,才能照上面两个步骤做~~~
请参考