2023-01-05 19:01:13
我下载安装了wps2010,把word转化为pdf,但转化出来的...
pdf文件中的文字存在两种可能性: 其一,可能是以计算机字符代码的形式被包裹在文件中; 其二,也可能只是一个页面图像中的像素组成的线条,没有字符代码信息。word + acrobat 5.0 转pdf在操作系统 windows 2000和windows me下效果才比较理想。 如果在xp系统下pdf出现乱码,可能是默认阅读器对中文不支持或你没有安装中文语言支持,你可以装一个acrobat 5.0中文版,及 acrobat 5.0中文版自带的一个插件 webcapture2ck。这个插件可以在acrobat 5.0中文版的正版软件中可以找到。 1、在ie浏览器地址栏输入网址,2、文件菜单中选择打印功能,3、选择用pdfwriter或distiller打印机驱动。
如果pdf是图片转化来的,就不会识别的。你还不如直接把pdf保存成jpg图片,然后用ocr软件直接识别。再一个如果pdf底纹太重的话,也识别不了的。
pdf有一种是word文本直接转成pdf的,这种方法的pdf再软化成word就非常方便。还有一种pdf是photoshop之类的图像软件制作的,这种方式制作的pdf只能再转换成图片,然后再用ocr识别。
方正ocr是一个比较好用的,我的印刷厂经常会排人家拿现成的书,我就让打字员用扫描仪扫描,保存成jpg格式的图片,然后就用方正ocr识别。
另外office 2003及以后的所有版本,只要是安装企业完全版,并且在安装时选择自定义,就都有图像识别成word文档的功能。这个功能在开始-程序-office -office 工具中。