2023-01-11 18:01:27
pdf里文本都是图片形式的,请问怎么把它弄到word里 -...
有两种情况:
1.根本不存在文本,这个内容就是一个图片(在pdf里以xobject形式存在),谁也没办法拿到文字信息.
2.是文本,可以用foxitreader等工具把文本选择,拷贝,粘贴出来.要修改就用foxit pdf editor就可以修改
另:如果pdf稳当禁止这样操作的话,只能把pdf转化成word来处理了.一样针对第二种情况
怎么把.pdf的文件复制到word文件中,急急!!
office 2003 里的 document image writer 虚拟打印机
(an translated english version of this article is provided here.)
安装完 office 2003 之后,你会发现“打印对话框”中的打印机列表多了一个“microsoft office document image writer”的打印机,如果选中此项来打印的话,你会得到一个扩展名为 mdi 的文件。
这个虚拟打印机本来用处是不大的,也很少有文章介绍它。但以下介绍一个很好的 microsoft office document image writer 虚拟打印功能的应用场景:
(1) 我们可以通过 microsoft office document image writer 将 word,excel,powerpoint,记事本,internet explorer 等浏览器,photoshop,outlook express 中的 email ……各种可以打印输出的文件,打印输出为 mdi 这一通用格式,用于存档。
(2) office 2003 中提供的 microsoft office document imaging 功能,同时提供了编程接口,可以很方便的从 mdi 文件中提取其中包含的文本,图片等内容,通过相应的索引模块,可以很方便的为不同格式的文档建立索引。
(3) office 2003 同时提供了可以查看 mdi 文件内容的 activex 控件,我们可以把该控件放置到我们的 windows forms 中,用于查看 mdi 文件的内容。
这样,一个通用性很高的文档管理系统就很容易创建出来了。
也许你安装有 adobe acrobat 系列的软件(注意此处不包括 adobe acrobat reader)的话,你会知道你的打印机列表中也是有一个可以打印 pdf 格式的虚拟打印机(而 acrobat reader 只能读 pdf,不能写)。这里,microsoft office document image writer 的作用大致和 adobe acrobat 的虚拟打印机类似。
通过 pdf 这一通用格式,我们也可以实现上面 mdi 实现的功能。但 mdi 的优势是明显的:
office 2003 已经是很多客户已经购买或者计划购买中的软件,为实现文档管理功能而另外购买 acrobat 的 licences 显然要额外花费很多成本。
(当然还有个因素,大多数人都相信,微软自己的东西兼容性要相对好一些。)