2022-11-26 22:13:05
怎么样把扫描的pdf转成可编辑的word
如果pdf文档是通过扫描纸质文件生成的,就不能够用上述简单的方法导出文字了,但也可以借助ocr文本识别技术来导出文字。
在adobe acrobat里可以操作菜单“文档”→“ocr文本识别”→“使用ocr识别文本”,经过识别以后,就可以用“选择工具”选中文字进行复制了。
adobe reader没有自带ocr文本识别功能,但可以这样操作,操作菜单“文件”→“打印”,打印机名称选择“microsoft office document image writer”,这是一个随microsoft office 2003一起安装到计算机里的虚拟打印机,它将pdf文档打印到后缀为“mdi”的文件里,并自动打开,在打开的“mdi”文件里依次操作菜单“工具”→“使用ocr识别文本”和“工具”→“将文本发送到word”就可以将文字导出到一个word文档里。
ocr文本识别技术的识别率取决于创建pdf文档时的扫描精度,那些字迹模糊不清的文档,能够正确识别出的文字也不会太多。
详见
http://hi.baidu.com/d%5fzzn0470/blog/item/f3784fb16e20dc5c09230280.html
怎样将扫描版的pdf转换成word
1.安装一个虚拟打印机smatrprinter打印输出时选择jpg格式(可将原pdf文件拆分成若干jpg图片文件)
2.安装一个汉王文豪7600,打开全部图片,自动版面识别后输出为rtf格式(可直接用word打开)
网上搜索“虚拟打印机smatrprinter”和“汉王文豪7600”很容易找到下载地址
扫描书面作成的pdf文件,怎样把文字提取出来,转换成w...
出品pdf文件格式的公司adobe有个官方的转换软件,很大很笨重,adobe acrobat,在迅雷上搜索下载有注册码的就可以。
还推荐一个清华大学搞出来的小软件“尚书7号”,非常好用,
第一步是讲你的pdf书籍用pdf软件打开,另存为图片格式的
第二步打开尚书7号,载入这些图片,点击识别,就能识别出所有的文字了。
如何将扫描得到的pdf转成可编辑的word文档? - 百度...
你将pdf文件用reader软件打开,用ctrl+a全选内容,复制,然后打开word页面,粘贴就可以了。
还有一个方法就是在reader软件的界面,点击文件菜单-点另存为文本,也可以的,不过生成的是.txt格式的文件,txt可以直接复制到word里进行编辑的。