开通会员
  • 尊享所有功能
  • 文件大小最高200M
  • 文件无水印
  • 尊贵VIP身份
  • VIP专属服务
  • 历史记录保存30天云存储
开通会员
您的位置:首页 > 帮助中心 > 提出pdf字转word-把pdf中的图片中的文字提取成word
默认会员免费送
帮助中心 >

提出pdf字转word-把pdf中的图片中的文字提取成word

2023-01-05 05:30:15

pdf中的图片中的文字提取成word

把pdf中的图片中的文字提取成word
对于是图片做成的pdf(特别是扫描件做成的pdf)文件,要转换成能编辑文本就麻烦多了:
1、页数比较少的用 cajviewer 7.0.2 (简体中文完整功能绿色版,带ocr组件完整版,需要的就是它),支持直接打开pdf文件,识别文字。
2、页数比较多的可以用 readiris corporate v12.0.5702(简体中文特别版)软件来进行识别 (需要安装亚洲语言包,不然不识别中文)
3、页数比较多的还可以用 abbyy finereader 8或者8以上版本(有汉化版或简体中文版)进行识别转换。这个软件的识别率很高,转换出来的版面基本保持原样。
《abbyy finereader pro 8.0.0.706 光学文字识别软件》(abbyy finereader ocr 8.0.0.706 professional edition)v8.0.0.706 专业汉化版: http://xidong.net/file001/file_43806.html
4、adobe acrobat 9.0 professional 简体中文版(注册激活后才能用),使用比较简单,不用下载另外的语言包支持,完整版都在600mb以上,识别率虽然比不上面的,但是效果也是不错的。不要下成那个只能阅读的adobe reader9.0版本。
5、使用汉王,转换的识别效率同样很高。
6、microsoft office document image(microsoft office document scanning)这是office自带的一个ocr识别工具,如果你安装office时,安装了就可使用,没有安装可以从安装光盘安装。但是不建议使用,太麻烦识别率也不高,校对工作量大。如果很少的图片也是可以考虑的。
7、omnipage professional v17及以上版本,这个不支持中文(没有东亚语言包),但对英、法、德、意都没有问题。号称是目前世界上辨识率最高、辨识速度最快的辨识软件。

ocr识别软件都不可能百分之百识别图片中的文字!但对英文字符的识别可以达到98%甚至99%,中文字符的识别率一是达不到这么高,二是不同的软件差别也比较大!如果pdf文件版面比较干净,清晰度很好,可以考虑来识别转换。如果你眼睛看着都费劲,那就干脆放弃好了,人还看不出来,就不要想软件能识别出来了。
您已连续签到 0 天,当前积分:0
  • 第1天
    积分+10
  • 第2天
    积分+10
  • 第3天
    积分+10
  • 第4天
    积分+10
  • 第5天
    积分+10
  • 第6天
    积分+10
  • 第7天

    连续签到7天

    获得积分+10

获得10积分

明天签到可得10积分

咨询客服

扫描二维码,添加客服微信