2023-01-04 18:47:17
如何将pdf格式的文件转化为word形式
第一步:首先使用adobe reader打开待转换的pdf文件,接下来选择"文件→打印"菜单,在打开的"打印"设置窗口中将"打印机"栏中的"名称"设置为"microsoft office document image writer",确认后将该pdf文件输出为mdi格式的虚拟打印文件。
提示:如果你在"名称"设置的下拉列表中没有找到"microsoft office document image writer"项,那证明你在安装office 2003的时候没有安装该组件,请使用office 2003安装光盘中的"添加/删除组件"更新安装该组件。
第二步:运行microsoft office document imaging,并利用它来打开刚才保存的mdi文件,选择"工具→将文本发送到word"菜单,并在弹出的窗口中勾选"在输出时保持图片版式不变",确认后系统提示"必须在执行此操作前重新运行ocr。这可能需要一些时间",不管它,确认即可。
提示:目前,包括此工具在内的所有软件对pdf转doc的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。
关于pdf格式文件转换为word格式的问题
因为pdf格式文件本身就具有加密功能,大多数pdf格式的文件都设置了权限,不允许进行复制,选取,所以你无法将里面的文字提取出来,即使是转换软件,也只是格式上的转换,并不能直接从里面提取文字,这也是大家用pdf的原因之一,能够起到保密功能
当然pdf文件本身也存在以下几种格式:
1、pdf本身就是通过相片或扫描的方式保存的,这个格式是无法提取其中的文字的
2、pdf文件原作者进行了加密处理,不允许进行提取、复制、打印,则无法将文字转成word可编辑格式
3、pdf文件没有进行加密,它本身就可以进行复制,则此类pdf格式文件才能转化成word文字编辑格式