2022-11-27 18:10:14
怎么把.pdf的文件复制到word文件中,急急!!
office 2003 里的 document image writer 虚拟打印机
(an translated english version of this article is provided here.)
安装完 office 2003 之后,你会发现“打印对话框”中的打印机列表多了一个“microsoft office document image writer”的打印机,如果选中此项来打印的话,你会得到一个扩展名为 mdi 的文件。
这个虚拟打印机本来用处是不大的,也很少有文章介绍它。但以下介绍一个很好的 microsoft office document image writer 虚拟打印功能的应用场景:
(1) 我们可以通过 microsoft office document image writer 将 word,excel,powerpoint,记事本,internet explorer 等浏览器,photoshop,outlook express 中的 email ……各种可以打印输出的文件,打印输出为 mdi 这一通用格式,用于存档。
(2) office 2003 中提供的 microsoft office document imaging 功能,同时提供了编程接口,可以很方便的从 mdi 文件中提取其中包含的文本,图片等内容,通过相应的索引模块,可以很方便的为不同格式的文档建立索引。
(3) office 2003 同时提供了可以查看 mdi 文件内容的 activex 控件,我们可以把该控件放置到我们的 windows forms 中,用于查看 mdi 文件的内容。
这样,一个通用性很高的文档管理系统就很容易创建出来了。
也许你安装有 adobe acrobat 系列的软件(注意此处不包括 adobe acrobat reader)的话,你会知道你的打印机列表中也是有一个可以打印 pdf 格式的虚拟打印机(而 acrobat reader 只能读 pdf,不能写)。这里,microsoft office document image writer 的作用大致和 adobe acrobat 的虚拟打印机类似。
通过 pdf 这一通用格式,我们也可以实现上面 mdi 实现的功能。但 mdi 的优势是明显的:
office 2003 已经是很多客户已经购买或者计划购买中的软件,为实现文档管理功能而另外购买 acrobat 的 licences 显然要额外花费很多成本。
(当然还有个因素,大多数人都相信,微软自己的东西兼容性要相对好一些。)
pdf格式的文档如何读取?
如何把adobe acrobat 的pdf格式的文档转为word能够读取、编辑的文档。对于这个问题,不少用户存在两种误解。一是认为adobe acrobat pdf文档是图形格式,无法被word读取; 二是认为虽然pdf也包含文字代码信息,但word没有相应的pdf格式转换器,所以无法读取。本文将向您介绍如何把pdf文档读入word。
了解pdf文档
---- pdf文档到底是什么?
---- pdf是出版和图形领域的软件厂商adobe制定的电子文档格式标准。adobe为之提供了免费的文档浏览器--adobe acrobat reader以及相应的编辑软件--adobe acrobat,后者可以对pdf文档中页面的组织、链接进行编辑,对文档进行批注等等。而adobe的另外一款软件--illustrator则可以从各个细致入微处修整pdf文件。与普通格式的电子文档(如纯文本、超文本、rtf格式以及word文档等)相比,pdf文档具有能够完善保持版面样式、跨平台等优越性,所以国外许多组织机构在发放无需再次编辑的文件时通常选择使用pdf格式。在我国,许多电子书籍也开始采用pdf格式。
---- 创建pdf文件的典型方法并不是使用illustrator等软件来编辑,而是先用普通的文字处理和桌面排版软件如word、wordperfect和pagemaker等编排好文档,然后通过adobe的pdf distiller或者pdf writer等仿打印机引擎制作pdf文件。另外也有一些pdf文档是直接使用adobe acrobat配合扫描仪将原书稿扫描制作完成的,虽然该软件配有支持对多种西方文字进行光学字符识别(ocr)的插件,但是为了保证文字的可靠性,多数情况下采用这种方法制作的pdf文件没有进行字符识别。
---- 从以上的介绍我们可以看出,pdf文件中的文字存在两种可能性: 其一,可能是以计算机字符代码的形式被包裹在文件中; 其二,也可能只是一个页面图像中的像素组成的线条,没有字符代码信息。很明显,只有第一种pdf文档可以通过word打开和编辑。
让word读取pdf文档
---- 下面我们就来看一下如何让word读取包含字符信息的pdf文档。由于adobe公司在2000年就发布了4.x版本的acrobat reader,比以往的版本功能有所增强,所以我们就以这个版本为例来讨论。
---- 实际上,word至今也没有pdf文档的转换器,因而无法对其直接读取。我们采用的还是"剪刀+浆糊"的办法。
---- 1.拷贝文字
---- 通常情况下,如果需要拷贝pdf中某一页面上的所有文字,您可以进行如下操作。
定位页面。
单击工具栏上的"text select tool"按钮。
选择"edit"*"select all",再选择"copy"(如图1所示)。
切换到word,按"粘贴"按钮(或ctrl+v)把内容贴到word文档中。
--- 如果需要拷贝的是整篇pdf文档,则可以按照下面的步骤进行。
打开pdf文件后,选择"view"*"continuous"(如图2所示)。
选择"edit"*"select all"。
拷贝选中的内容。
切换到word,粘贴内容。
---- 使用这种方法拷贝到word文档中的文字会保持基本的字符格式,比如粗体、斜体、字符大小等等,但是不会具有样式等方面的设置。对于较复杂的文档,可能需要耐心进行调整。
---- 2.拷贝图片
---- 如果需要拷贝pdf文档中的图片,首先要找出一个隐藏的工具按钮"graphics select tool"。具体办法如下。
---- (1)按下"text select tool"按钮,不要松开鼠标左键,该按钮会向右延展,显示出额外的几个按钮(如图3所示)。根据按钮的文字提示,选择正确的按钮(熟悉photoshop、coreldraw等绘图软件的用户对于这种一钮多用的情况并不陌生)。
---- (2)把鼠标指针移到pdf页面上,此时指针呈十字形。拖动选择好图片区域,拷贝。
---- (3)回到word文档,粘贴即可。
---- 拷贝图片不仅支持拷贝pdf文档中的图片到word,实际上,我们可以选择任意区域,如文字区、图片区、文字和图片混合区,拷贝后粘贴到word中,它们都会被当作图片插入到word文档。
---- 需要注意的是,有的pdf文档由于制作的时候设置了某些安全选项,禁止我们拷贝其内容。如果要了解这方面的设置,可以通过选择"file"*"document info"*"security"查看(如图4所示)。如果其中的"selecting text and graphics"一项被设置为"no",这时上述拷贝文字和图像方法就不起作用了。此时,惟一的权宜之计就是使用print screen键或者其他的抓图软件获取某些pdf文档的画面。
如何将pdf文档转换为word文档
如何将pdf格式转化为word格式- -
首先,pdf文档本身分为以下几类:
1.非加密的pdf文档 这类文档是作者公开在网路上流行的文档,其内容是允许
读者拷贝粘贴的,当然这其中要设计到合理的引用注释。主要有两种类型,一个是编辑
好的可以对文字部分操作的文档,另外一种是扫描格式的。对于前一种文档adobe公司出
品的pdf阅读和编辑软件都可以对文字部分进行选取,拷贝和粘贴,当然图片部分也可以
。通常我们写文章需要引用或编辑的时候,有选择的选取其中的文字就可以了,很方便
,也没有必要全文选取。当然,如果处于版面要求以及某种目的需要快速的全文转化,
也是完全可以实现的。
主要方法包括:
a. adobe公司出品的pdf创建和编辑软件adobe acrobat(不是reader)本身就
具有将pdf文档转化为word文档的能力。只要我们打开菜单栏,将文档另存为doc格式或
rtf格式就可以了。但是说实话,这种方法得到的文档只能够说是变成了一堆字而已,原
来的版式都没有了。不过这也不失为一种方法。
b. 借助于其它软件实现高质量的pdf文档向word文档的转换。其实现在能够实
现这种功能的软件很多,我只介绍其中的两个,而这两个也绝对是具有业界领先水平的
。它们是scansoft公司出品的scansoft pdf converter和abbyy公司出品的abbyy pdf
transformer。当然后者作为ocr领域的业界大企业,还有一些具有此功能的更高级的软
件,但是这个已经足以应付大部分的转换了。
这两个软件能够快速实现对于可拷贝的pdf文档的迅速转化,而且绝对是高
质量的全文转换。经过转换得到的word文档,排版和原来的pdf文档几乎没有分别,绝对
是让你震惊的水准,需要全文转换的绝对推荐使用!
c. 对于非加密扫描型pdf文档来说,其上面包含的文字实际上是属于图片的一
部分,我们如果想大量的一次性得到这些文字,必须借助于ocr软件的辅助,这种软件种
类繁多,中文外文的都有。当然,对于英文的识别效率应该好于对于中文的,这也和选
择的软件关系很大。而且,最重要的是,pdf文档中文字的清晰度。
2.加密型pdf文档 加密型pdf文档通常不允许读者对其进行任何拷贝和编辑,
包括其中的文字和图片。这也是对版权的保护。如果你非要违背作者意图来获得其中的
文字,使用的方法主要有两种:第一就是借助于pdf加密破解软件,第二种就是手动往电
脑里面敲吧。推荐后者,毕竟该尊重的一定要尊重。
参考资料:引自
http://publishblog.blogchina.com/blog/tb.b?diaryid=1146714
请求支援:pdf格式文件用word2003打不开,如何才能打...
pdf(portable document format) 文件格式是电子发行文档的事实上的标准。adobe reader是一个查看、阅读和打印pdf文件的最佳工具。而且它是免费的。
新版增加了两个 acrobat plugs-ins (acrobat search and autoindx),它可以在硬盘、cd 和局域网中搜索用 acrobat catalog tool 创建了索引文件的多个pdf文件。新的版本可以降低pdf尺寸,播放内嵌的quicktime、flash、avi等媒体文件格式。建议您将adobe reader与acrobat软件更新到您所用平台和语言的最新版本,以避免旧版本中存在的安全问题。