2022-12-11 16:19:28
把pdf格式的文件转换成word文档 怎么弄?
可以利用office 2003中的microsoft office document imaging组件来实现
pdf转word文档,也就是说利用word来完成该任务。方法如下:
用adobe reader打开想转换的pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。
注:如果没有找到“microsoft office document image writer”项,使用office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“office 工具 microsoft draw转换器”。
然后,运行“microsoft office document imaging”,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。
注:对pdf转doc的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
pdf完全图片格式怎么转word可编辑的文字了?? - 百度...
这是我自己的答案,拿出来分享~
用adobe acrobat 7.0 professiona l打开一篇pdf文档,
“文件” 菜单――“另存为”――“保存类型:jpeg(*.jpg
*.jpeg *.jpe) ”――“保存”。
稍等一会儿,整篇pdf文档就变成一幅幅图片了。
adobe acrobat 7.0 professiona l使命完成。
尚书七号ocr
“文件” 菜单――“打开图像”――“文件类型:全体图像
(*.tif *.bmp *.jpg)
(2)开始识别。
“选择全部文件”按钮――“开始识别”按钮
稍等一会儿,所选图片就变成文本了。
(3)必须校对。
逐幅图片进行校对,时间紧的话着重校对红色部分,这是识别软
件认为需人工校对的部分,但是不要迷信,没有标出的地方还是
有错的。
不要听ocr厂家“识别率超过98%”的一派胡言,校对过程绝对是
折寿的,我从网上下载了人文2005版鲁迅全集18卷,到现在一卷
也没有识别完……
(4)合成输出。
“选择全部文件”按钮――“输出”菜单――“到指定格式文件
”命令――“保存类型:txt”――“输出到外部编辑器”――
“保存”
(5)记事本编辑。
pdf转化成word的文字文档
如果你有扫描仪的话,就需要一款汉王ocr软件,如6800。如果没有扫描仪的话,需要购进一款汉王6800(或更高的级别的)扫描仪,随机赠送ocr软件。
它能够将扫描的文字直接导入到word中进行编辑。
pdf转化word
1. 第一步:先用adobe reader打开想转换的pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的“名称”设置为“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。
第二步:运行microsoft office document imaging,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。
2. 情况一:如果pdf文档本身就是用pagemaker或word转换而来的(文字非常清晰锐利,很容易识别),那你就方便了。你可以先用acrobat打开,然后点文件――>另存为――>把他保存成rtf文档,这样将把所有的pdf页保存成rtf文档,在用word打开。注意最好保存成rtf文档,要不很有可能产生乱码。小技巧:如果你只想识别pdf文件中的其中几页,那你可以现把那几页另存为新的pdf文档,再进行识别。ny1
情况二:如果你所得到的pdf文档是用扫描仪扫进去的图片转换的,那么就麻烦了,不过还是比手输入快多了,所以继续往下看。首先你用acrobat把pdf文件打开,然后点文件――>另存为――>把他保存成图片格式*.tiff(这是无压缩图片格式,以便识别),然后到网上下载文字识别软件,建议用尚书六号(现在好像出到七号了,很有名,随处都可以下到),安装好后,打开转换好的tiff图片,点击识别,看,文字出来了吧,尚书系列文字识别软件功能十分强大,你可以在里面把文字都编辑好了,再保存成rtf或txt文件,然后粘贴到word里就可以使用了,注意过滤回车符。
pdf转换成word后内容乱码怎么办?
word和pdf排版的编码不一样,有乱码是正常的,而且其中的公式,在word 下基本上都会变成乱码,没办法的。
你是想减少些页数吗?
如果这样的话,你可以把pdf格式的那个文件的每页都换成图片的格式,然后拼接一下。