开通会员
  • 尊享所有功能
  • 文件大小最高200M
  • 文件无水印
  • 尊贵VIP身份
  • VIP专属服务
  • 历史记录保存30天云存储
开通会员
您的位置:首页 > 帮助中心 > pdf图导入word文件-我怎么把PDF文件转到WORD中来呢?
默认会员免费送
帮助中心 >

pdf图导入word文件-我怎么把PDF文件转到WORD中来呢?

2022-12-12 09:55:42

我怎么把pdf文件转到word中来呢?

我怎么把pdf文件转到word中来呢?
office2003实现pdf文件转word文档

经过本人尝试,发现可以利用office2003中的microsoftofficedocumentimaging组件来实现pdf转word文档,也就是说利用word来完成该任务。方法如下:

用adobereader打开想转换的pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为“microsoftofficedocumentimagewriter”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。

注:如果没有找到“microsoftofficedocumentimagewriter”项,使用office2003安装光盘中的“添加/删除组件”更新安装该组件,选中“office工具microsoftdraw转换器”。

然后,运行“microsoftofficedocumentimaging”,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。

注:对pdf转doc的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。

以上仅在word2003中可用,其他版本没有microsoftofficedocumentimagewriter。

pdf转word
下载地址: http://www.chunya.com.cn/soft/uploadsoft/pdf 转word.rar

超酷pdf转word工具solidconverterpdf[带注册]
下载页面: http://www.peee.net/soft/rj/200507/767.html

pdf转word工具(pdf2word)v1.6 绿色汉化注册版

下载页面: http://www.wishdown.com/software/catalog75/1124.html

有办法将pdf里的文字转移到word,但图形只能用照相功...

有办法将pdf里的文字转移到word,但图形只能用照相功...
pdf2word 1.6 绿色汉化版

pdf2word能够从pdf格式文档中提取文字、图形和其它内容存放入word格式文档中,因此你就能重复利用你的pdf文档内容,在word中再编辑文字、排版及重整布局;并且它是一个独立软件,不需要安装microsoft word、adobe acrobat软件支持。

http://www.down101.com/softinfo/2407.html

如何将图片格式的pdf转化为word?

如何将图片格式的pdf转化为word?
批量处理是有办法的

一、“选择文字工具,选好了贴到word里”
如果你的pdf文件是用文字制做而不是图片制做的,可以“在adobe acrobat 7.0中有选择文字的工具,可以选好了贴到word里”。但是根据你介绍的情况,你的pdf文件是用图片做的,所以不能用这种方法。

二、批量截图
截图的办法对于不是很清楚的图片来说,并不可取,因为它要么会损失信息,要么会如楼主所说加大工作量。

我建议你先用adobe acrobat中的导出功能,将这个文件导出为图像。做法:在上面菜单上选文件>导出>提取图像为>jpeg文件(其他二种也行,jpeg文件比较小),再按提示,选择一个适当的文件夹,保存图像 。
这种方法保存下来的一张张图片,比你一页页截图省力多了,而且保留了原文件的全部信息。不过500页可不一个小数,会很慢,但至少不用你亲自动手干预了。

三、批量识别
如果你想进行编辑,就必须进行ocr识别。关键在于你如何能够批量进行这个工作。

好一点的ocr软件都可以一次导入多幅图片进行识别,然后输出。不过,好像500页的确有点多了,我从来也没有超过50页的记录,通常也就是二、三十页。就算50页,也比一页一页强,是吧?

我用过不少ocr软件,觉得汉王文本王、清华紫光th比较好用。它们的识别率都非常高,还可以识别表格、繁体字、英文、竖排文字等;输出方式也很灵活,可以只输出文字,也可以按原稿排版格式输出word文件;使用起来也都不复杂。 不知你用的是什么版本的汉王,识别率会那么低。我有的时候识别质量很次的报纸上的文章,它的识别率也还是可以接受的。

四、提高识别率
如果你的底图质量非常差的话,建议你先在图片处理软件中将导出的图片进行放大、去点、锐化等处理,然后再送到ocr中识别。

我估计,你可能还是送入ocr的图片损失了部分原文的信息,造成识别率下降。因为你既然能放大,放大后截图的识别率还可以,那就说明原图的信息足够ocr识别了。只是你在操作过程中损失了部分东西。

所以,我建议你:
1)先将你的pdf文件导出5-10页图片出来
2)用汉王等ocr软件进行批量识别(识别中注意将不规则的部分框除)
3)输出成word文档

如果它们能很顺利地被识别出来,那后面的事就不用我说了。如果不行,那就真的是你的底图的问题了,这就需要对导出的图片进行批量修正处理。

如果还不行,那、那……我也没辙了。

怎么把.pdf的文件复制到word文件中,急急!!

怎么把.pdf的文件复制到word文件中,急急!!
office 2003 里的 document image writer 虚拟打印机
(an translated english version of this article is provided here.)

安装完 office 2003 之后,你会发现“打印对话框”中的打印机列表多了一个“microsoft office document image writer”的打印机,如果选中此项来打印的话,你会得到一个扩展名为 mdi 的文件。

这个虚拟打印机本来用处是不大的,也很少有文章介绍它。但以下介绍一个很好的 microsoft office document image writer 虚拟打印功能的应用场景:

(1) 我们可以通过 microsoft office document image writer 将 word,excel,powerpoint,记事本,internet explorer 等浏览器,photoshop,outlook express 中的 email ……各种可以打印输出的文件,打印输出为 mdi 这一通用格式,用于存档。

(2) office 2003 中提供的 microsoft office document imaging 功能,同时提供了编程接口,可以很方便的从 mdi 文件中提取其中包含的文本,图片等内容,通过相应的索引模块,可以很方便的为不同格式的文档建立索引。

(3) office 2003 同时提供了可以查看 mdi 文件内容的 activex 控件,我们可以把该控件放置到我们的 windows forms 中,用于查看 mdi 文件的内容。

这样,一个通用性很高的文档管理系统就很容易创建出来了。

也许你安装有 adobe acrobat 系列的软件(注意此处不包括 adobe acrobat reader)的话,你会知道你的打印机列表中也是有一个可以打印 pdf 格式的虚拟打印机(而 acrobat reader 只能读 pdf,不能写)。这里,microsoft office document image writer 的作用大致和 adobe acrobat 的虚拟打印机类似。

通过 pdf 这一通用格式,我们也可以实现上面 mdi 实现的功能。但 mdi 的优势是明显的:
office 2003 已经是很多客户已经购买或者计划购买中的软件,为实现文档管理功能而另外购买 acrobat 的 licences 显然要额外花费很多成本。

(当然还有个因素,大多数人都相信,微软自己的东西兼容性要相对好一些。)
您已连续签到 0 天,当前积分:0
  • 第1天
    积分+10
  • 第2天
    积分+10
  • 第3天
    积分+10
  • 第4天
    积分+10
  • 第5天
    积分+10
  • 第6天
    积分+10
  • 第7天

    连续签到7天

    获得积分+10

获得10积分

明天签到可得10积分

咨询客服

扫描二维码,添加客服微信