2022-11-26 18:01:51
pdf里面的图片如何才能转换成word格式的纯文本?哪能...
图片一般不能转换成纯文本,但图片里的文字可以通过ocr转换成纯文本,正确率在50-95%。推荐文豪7600里的屏幕识别1.0插件,即安装文豪7600后,把屏幕识别1.0文件夹单独拷出来,再把文豪7600卸载掉。
如何是pdf的书(扫描的)建议用abbyy finereader 9.0 edition,但准确性还不是很高,需要手动修改。
国产有一个赛酷ocr,收费的,不是很贵。但效果没有宣传的那么好。但软件不大,也可以的。
...可以把pdf里的文字和表格全部转换为word···多...
anybizsoft pdf converter
anybizsoft pdf converter 是一款pdf 转多种格式的软件,select部分是你要转换输出的格式,你要什么格式就选择什么格式,前提是你一定要安装微软的office办公软件。
solid converter pdf
solid converter pdf v6是一个
pdf转word的神器,支持pdf转换成word、excel、图片、html等等,当然这个软件还带有pdf的加水印、修改等功能。
e-pdf pdf 2 word converter
e-pdf pdf 2 word converter 是一款功能比较单一的软件,只能是pdf转word。但那是这个软件的转换速度和版面的还原能力都是比较好的,而且有中文汉化版的便于操作。只需转换word格式的朋友推荐使用。
cajviewer
cajviewer 7是中国知网的专用浏览器,也支持pdf格式的阅读,完整版本是带有ocr组件的(约37m左右)。打开pdf文件以后在工具栏上有一个放大镜下面打一个勾的上面还有一个字和a的那个图标工具就是ocr工具。选择这个工具 然后拉框选择识别区域,稍等一会儿就会有文字识别结果对话框出来,那里面的文字就是识别提取出来的人,如果你要整个pdf转换,你可以在菜单栏 文件---另存为文本就可以了。
abbyy finereader
abbyy finereader是我见过的最强大的pdf(图片格式或者是扫描件)转word的软件。它是一款ocr软件,界面比较简洁明,9.0和以上版本有简体中文版的,支持100语言的识别,特别是混合多种语言识别效果也非常好。
我承认是从网上复制的,但是作者归纳的真不错。你就用abbyy finereader 吧,我喜欢这个(这个的缺点是安装文件很大,v10好像到了700mb)。
知道福昕阅读器吧,视图-文本查看器,对于一些纯文本转换的pdf很好用。
搜索一下,这些软件都能找到的。不全是免费的,但是可以找到破解版。
pdf怎样转化成word?哪个朋友可以帮帮我?
你可以尝试以下方法:
一、推荐的pdf转换word方案
1. 莫忘最基本的“复制/粘贴”法
寻找“高级”办法之前,不妨先试一下最基本的方法:打开pdf文档,复制全文;然后,在word中粘贴。如果文档格式不复杂,这样得到的结果就够用了。
2. gmail、qq邮箱中直接查看pdf格式
gmail很早就解决了pdf查看问题。把pdf作为附件发送至gmail信箱,在附件一侧,点击“view”或“查看”链接,进入在线pdf阅读器后,点击“纯html”链接,即可以网页格式显示pdf内容。如果你一定需要doc格式,请复制html内容到word。
而qq邮箱中,pdf附件旁边也有类似的“纯文本方式查看”链接,只是相比gmail,缺少文字格式。
另外,这种转换还能破解pdf防止复制内容的限制。
优点:速度快、可信、很多人已经有gmail信箱(没有?那就注册一个吧);各种语言编码的文字都应该可以转换。
缺点:pdf中的图片好象有问题。
3. 号称最精准的 pdftoword.com 在线转换
pdftoword.com 号称是目前最为精准的pdf to word文件转换器,出自著名的pdf解决方案供应商nitropdf。
pdftoword.com是在线应用,完全免费,使用方便:
- 访问pdftoword.com:①上传pdf→②选定格式(doc/rtf)→③输入接收邮箱;
- 进入邮箱:查收转换后的word文档。
web 2.0 share的评价:“……pdftoword 无愧于精准之王,对中文同样转换很好,文字方面不多说了,大家可以自己测试。pdftoword 在排版方面确实有独到之处,特别介绍一个细节,pdftoword 转换后的文档仍以段落为单位,没有很多的换行符,而以前大多转换器都是以行为单位,以致末尾有很多的换行符,你复制粘贴时会有许多麻烦……”
二、其他软件或在线应用
pdfundo.net在线转换
注:网站已失效。
在线的
http://pdfundo.net
(名称很有意思),可以上传pdf文档,30秒-几分钟即可转换为doc,并给出下载链接。它也有相应的客户端软件。[via lifehacker]
优点:免费、在线、直接生成doc
缺点:试转了一份台湾朋友制作的pdf(原始文件也根本不是word,繁体中文),发现很多汉字无法显示。
更多在线pdf转word应用
电脑玩物曾做过一个 测试 ,对比了4个在线应用。但由于测试的特殊要求――11mb,立即转换――只有最好一个应用达成了目标。因此,并未对转换质量进行对比。
http://www.zamzar.com/
,多格式转换网站,文档上限1gb,转换工作需要排队等待。
http://www.pdftoword.com/
,上限 10mb,需要等待。
http://convertpdftoword.net
,文件名须为英文。
http://www.pdfonline.com/pdf2word/index.asp
,速度较快,“pdf的版面样式与文字「基本上」都有成功转换,仔细检查的话会发现在一些特殊格式的地方会漏掉一两个字没有转出来,但这都很好解决,只要自己补上就好”。
共享软件 e-pdf to word converter
共享软件 e-pdf to word converter(usd 35)在转换pdf到word类软件中,也属于效果较好的一款。
小众软件评价:…… e-pdf 可以把 pdf 文件比较完美的转换成 word 文档,我用104页的 pdf 做了测试,除了少数地方,其余都属于完美转换了……
网上其他介绍:e-pdf to word converter 是一款将adobepdf文档转换成 word 文档的工具软件,它支持文字,图像及其它内容的输出。这款软件可以脱离 microsoft word,adobe acrobat 或 acrobat reader 独立运行。完美的中文支持和原始版面转换,基本做到了百分百的原汁原味……目前唯一发现的不足,数字会被转换成全角数字,不知道可否在word中批量把数字换回半角,另外有些文字大小会小一号。试用了超多的pdf转word工具了,应该说这个是所见过版面保留最好的了,虽然还是有点缺憾。
ms office document imaging 将pdf转为word
如果你购买了ms office的相应套件,则可通过ms office document imaging进行pdf到word的转换。
microsoft office document imaging 是ms office的一款选装组件,用于印刷文档的图像化扫描存储,并具有ocr功能。因此,也可以先把pdf虚拟打印为 microsoft office document imaging 格式 (mdi) ;再通过ocr转为可编辑的word文档。(官方帮助: 2)
转载一下操作步骤:
① 从pdf到mdi:在pdf阅读器中,打印pdf,打印机选“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。 (注:如果没有找到“microsoft office document image writer”项,使用office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“office 工具 microsoft draw转换器”。 )
② 从mdi到word:document imaging 转换为运行“microsoft office document imaging”,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,确认即可。
三、结论
偶尔有pdf2doc需求的网友,建议先试用在线的gmail、pdftoword。如果质量不能满足需求,或转换的数量、速度有更多要求,可以试用/注册 e-pdf to word converter 等软件。
但无论哪种方法,在行动之前都值得想一下:真有必要从pdf转为word吗?
附录:注释
[1]:早期版本ms word采用封闭格式,wps和ooo通过各种技术手段才能与之保持尽力兼容,而其他无此实力(经济实力)的软件则不能编辑word。当然,可以用免费的wordviewer查看(应该也能复制到其他程序中吧)。新的ms office采取了xml格式,相对开放了一些。所以,也不应该基于过时的理由过于反对doc格式。但无论如何,请有如下意识:除了昂贵的ms office,还有个人免费的wps(非常小巧)、开源的ooo、在线的google doc;在很多情况下,你只使用了ms office的3%的功能;很多文档没有必要存为word格式。
pdf格式怎么转换成word
我知道,我测试使用过几个类似的软件,结果感觉【anybizsoft pdf to word】转换效果最好。
无论图片、表格全部通吃,但扫描版的pdf转换成的word是不能进行文字编辑的。
此软件还是免费的
pdf转换成word用什么软件好
我推荐给你几个软件,都挺好的,我一直在用。
(1)abbyy finereader 10 professional edition v10.0.102.95
这个软件278mb,应该是精简过的,不过一直用的不错,识别时会分屏对照,对于不是100%识别正确的会以颜色标出,便于人工比对。操作起来比较简单,易于上手,转化为word时会忠实保留原文格式,原文中的图像也不会错过。在研究过程中,帮忙解决了好几个很费功夫的pdf文档,有个人居然说我转好的word文档不好复制文字,nnd,我只好再告诉他如何将复制的文字不带格式的粘贴下来。
(2)adobe acrobat 9.0 pro
这是个完整版软件,600多mb,不过不用完全安装,只安装第一项就可以具有ocr识别功能;我还有10.1版本的软件,功能上作了升级,具体操作也有些微小区别,虽然安装时会出现个警告,不过用起来完全没有问题。
(3)汉王pdf converter 8.1 免费版
很多人在知道上推荐这款软件,体积是蛮小的,只有30多mb,免费软件,界面上有2个广告。这款软件除了体积小外,还有个优点就是,当你点击每一个被标出的字时,软件会自动给出多个备选识别文字。不过软件只能将文档识别为txt,不能保留源格式,界面中提供了上下对照,会将pdf文档划分为多个文本块进行识别,不会把那么多文本挤到一起让你头大,不过它不能自动标出所有可能的错字,也不错了,这么小的体积,对于要求不高的单纯中文或英文识别任务,应该完全可以胜任了。