2022-12-06 17:58:26
1. 使用office2003自带的工具转换
首先使用adobe reader打开待转换的
pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。 如果在“名称”设置的下拉列表中没有找到“microsoft office document image writer”项,那证明你在安装office 2003的时候没有安装该组件,请使用office 2003安装光盘中的“添加/删除组件”更新安装该组件。 运行 microsoft office document imaging,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。
2. pdf 2 word
pdf 2 word是一个独立运行的软件, 而非插件。可将 pdf 格式直接转换成 word 格式文件。
pdf 2 word虽然是一款英文软件,但其操作界面及参数设置都非常简单,没有特殊需要的话直接按照软件的默认值进行转换即可,pdf 2 word转换的速度非常快,对于图片和文档格式的识别也非常好,在这样的一款小软件中做到这些还是很难能可贵的。
用pdf转换器转成word仍然是图片,怎么办?
pdf转word:(必须安装microsoft office 2003 或 2007)
1、打开pdf,选“打印”。
2、在“打印窗口”中选“microsoft office document image writer”,并选“文档和图章”,确定后生成mdi文件。
3、打开mdi,在“工具栏”中选“使用ocr识别文本”。(ocr需要一段时间)
4、ocr完成后,在“工具栏”中选“将文本发送到word”。在弹出窗口中选择“所有页面”和“在输出时保持图片版式不变”。系统会自动打开转换好的word文档,把它保存下来就ok了。
注:ocr存在一定的误差,需要进行校对。
扫描版pdf文件如何转换为文字版pdf文件?
第一种办法:识别工具
如果你所得到的pdf 文档是用扫描仪扫进去的图片转换的,那么就麻烦了,
不过还是比手输入快多了,所以继续往下看。首先你用acrobat 把pdf 文件打开,
然后点文件――>另存为――>把他保存成图片格式*.tiff(这是无压缩图片格
式,以便识别),然后到网上下载文字识别软件,建议用尚书六号(现在好像出
到七号了,很有名,随处都可以下到),安装好后,打开转换好的tiff 图片,点
击识别,看,文字出来了吧,尚书系列文字识别软件功能十分强大,你可以在里
面把文字都编辑好了,再保存成rtf 或txt 文件,然后粘贴到word 里就可以使
用了,注意过滤回车符。
如果是影印版,也就是pdf 全都是扫描上去的图片格式,那你去下个汉王
ocr。如果是文字版的话,就去下个 adobe acrobat 9 ,在文件的菜单下可以导
出了。
尚书7 号 :支持二楼的说法,pdf 转word有这类软件,但对于你这种图片
格式的根本没有用。
只能用文字识别这类软件如“尚书七号”但是还是要有一定的分辩率才能
识别将其转成文档格式
赛酷ocr 就可以完成你的要求,打开pdf 识别,然后就可以导入word
如果你有扫描仪的话,就需要一款汉王ocr 软件,如6800。如果没有扫描
仪的话,需要购进一款汉王6800(或更高的级别的)扫描仪,随机赠送ocr软
件。
它能够将扫描的文字直接导入到word中进行编辑。
怎么将pdf转换成word,用什么软件好呢?
pdf转word、txt:
1. 可检索内容的pdf(内容可以用鼠标选中的非双层pdf)文件,推荐用下面软件转换:pdf to word converter, 是一款将adobepdf文档转换成 word 文档的工具软件,它支持文字,图像及其它内容的输出。这款软件可以脱离 microsoft word,adobe acrobat 或 acrobat reader 独立运行。无需注册,绿色软件。
2. 对于用图片做成的pdf(特别是扫描件做成的pdf)文件,推荐用汉王pdf ocr 8.0软件转换,或adobe acrobat x pro(要注册,有破解版)。
3. 对于一些不允许做修改的pdf文件(就是加密加了权限的pdf),那么就先要去除密码或者去除数字证书,才能照上面两个步骤做(推荐用pdf password remover去除密码)。
需要的话留下email,发给你。 也可以自己搜索下载。
pdf完全图片格式怎么转word可编辑的文字了?? - 百度...
这是我自己的答案,拿出来分享~
用adobe acrobat 7.0 professiona l打开一篇pdf文档,
“文件” 菜单――“另存为”――“保存类型:jpeg(*.jpg
*.jpeg *.jpe) ”――“保存”。
稍等一会儿,整篇pdf文档就变成一幅幅图片了。
adobe acrobat 7.0 professiona l使命完成。
尚书七号ocr
“文件” 菜单――“打开图像”――“文件类型:全体图像
(*.tif *.bmp *.jpg)
(2)开始识别。
“选择全部文件”按钮――“开始识别”按钮
稍等一会儿,所选图片就变成文本了。
(3)必须校对。
逐幅图片进行校对,时间紧的话着重校对红色部分,这是识别软
件认为需人工校对的部分,但是不要迷信,没有标出的地方还是
有错的。
不要听ocr厂家“识别率超过98%”的一派胡言,校对过程绝对是
折寿的,我从网上下载了人文2005版鲁迅全集18卷,到现在一卷
也没有识别完……
(4)合成输出。
“选择全部文件”按钮――“输出”菜单――“到指定格式文件
”命令――“保存类型:txt”――“输出到外部编辑器”――
“保存”
(5)记事本编辑。