2022-11-24 13:21:21
如何把pdf转成word文字
提供两种方法,应该够详细了
1、实现工具:office 2003中自带的microsoft office document imaging
应用情景:目前国外很多软件的支持信息都使用pdf方式进行发布,如果没有adobe reader,无法查看其内容,如果没有相关的编辑软件又无法编辑pdf文件。转换为doc格式则可以实现编辑功能。尽管有些软件也可以完成pdf转换为doc的工作,但很多都不支持中文,我们利用office 2003中的microsoft office document imaging组件来实现这一要求最为方便。
使用方法:
第一步:首先使用adobe reader打开待转换的pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。
编辑提示:如果你在“名称”设置的下拉列表中没有找到“microsoft office document image writer”项,那证明你在安装office 2003的时候没有安装该组件,请使用office 2003安装光盘中的“添加/删除组件”更新安装该组件。
第二步:运行microsoft office document imaging,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。
编辑提示:目前,包括此工具在内的所有软件对pdf转doc的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。
2、实现工具:solid converter pdf
应用情景:利用office 2003中的microsoft office document imaging组件来实现
pdf转word文档在一定程度上的确可以实现pdf文档到word文档的转换,但是对于很多“不规则”的pdf文档来说,利用上面的方法转换出来的word文档中常常是乱码一片。为了恢复pdf的原貌,推荐的这种软件可以很好地实现版式的完全保留,无需调整,而且可以调整成需要的样板形式。
使用方法:
1、下载安装文件solid converter pdf,点击安装。
编辑提示:安装前有个下载安装插件的过程,因此需要保证网络连接通畅。
2、运行软件,按工具栏要求选择需要转换的pdf文档,点击右下的“转换”(convert)按扭,选择自己需要的版式,根据提示完成转换。
如何将pdf文件转换为word文档?
按照我的顺序来:
①选择“打印”→选择“microsoft office document image writer”→点击“确定”→保存类型为“*.mdi”(一般情况下就这一个)
②在“*.mdi”文档里,选择“工具”→“将文本发送到word(t)”→选择路径→确定。
③这时就是word文档了!
(只建议用于纯文字,不建议用于表格、图像等)
怎样将pdf文件转换成word文档
pdf转word
1. 如果不是图片类做成的pdf 你可以尝试用verypdf pdf2word 工具或者使用solid converter pdf 转换 但是如果是内嵌了字体的,那么就要看情况了,因为有的字体你系统里面有,转出来就没有问题,如果系统里面没有,那么转出来就是一堆乱码,那么就先要把这些pdf文件转成位图形式(也就是常说的pdf转曲)然后再用工具转,当然这时候上面的2个工具基本无能为力了
2.对于是图片做成的pdf 那么我们就需要用ocr类软件进行识别了,你可以用比较简单的cajviewer来提取 但是只能是一页页提取文字,或者你可以使用readiris corporate 12软件来进行识别,但是readiris corporate 12呢需要下载支持韩语 日语还有简体中文的亚洲语言包才是识别中文,但是这个软件的ocr识别率是比较好的~~~~当然还有abbyy finereader 也是一款识别率很高的软件,关键还支持中文识别~~也是一款不可多得的ocr软件,这里我强力推荐这个软件。
3. 对于一些不允许做修改的pdf文件(就是加密加了权限的pdf),那么就先要去除密码或者去除数字证书,才能照上面两个步骤做~~~
怎么样把pdf格式转换为word格式
pdf转word、txt:
1. 可检索内容的pdf(内容可以用鼠标选中的非双层pdf)文件,推荐用下面软件转换:pdf to word converter, 是一款将adobepdf文档转换成 word 文档的工具软件,它支持文字,图像及其它内容的输出。这款软件可以脱离 microsoft word,adobe acrobat 或 acrobat reader 独立运行。无需注册,绿色软件。
2. 对于用图片做成的pdf(特别是扫描件做成的pdf)文件,推荐用汉王pdf ocr 8.0软件转换,或adobe acrobat x pro(要注册,有破解版)。
3. 对于一些不允许做修改的pdf文件(就是加密加了权限的pdf),那么就先要去除密码或者去除数字证书,才能照上面两个步骤做(推荐用pdf password remover去除密码)。
需要的话留下email,发给你。 也可以自己搜索下载。
怎么把pdf转化成可编辑word文本格式?
1.利用大纲视图 打开ppt演示文稿,单击大纲,在左侧幻灯片/大纲”任务窗格的“大纲”选项卡里单击一下鼠标,按ctrl+a组合健全选内容,然后使用ctrl+c组合键或右键单击在快捷菜单中选择复制命令,然后粘贴到word里。
提示:这种方法会把原来幻灯片中的行标、各种符号原封不动的复制下来。
2.利用发送功能巧转换 打开要转换的ppt幻灯片,单击文件→发送→microsoftword菜单命令。然后选择只使用大纲单选按钮并单击确定按钮,等一会就发现整篇ppt文档在一个word文档里被打开。
提示: 在转换后会发现word有很多空行。在word里用替换功能全部删除空行可按ctrl+h打开替换对话框,在查找内容里输入^p^p,在替换为里输入^p,多单击几次全部替换按钮即可。(^可在英文状态下用shift+6键来输入。)3.利用另存为直接转换 打开需要转换的幻灯片,点击文件→另存为,然后在保存类型列表框里选择存为rtf格式。现在用word打开刚刚保存的rtf文件,再进行适当的编辑即可实现转换。
4.pptconverttodoc软件转换 pptconverttodoc是绿色软,解压后直接运行,在运行之前请将word和ppt程序都关闭。选中要转换的ppt文件,直接拖曳到pptconverttodoc程序里。单击工具软件里的开始按钮即可转换,转换结束后程序自动退出。
提示: 如果选中转换时加分隔标志,则会在转换好的word文档中显示当前内容在原幻灯片的哪一页。转换完成后即可自动新建一个word文档,显示该ppt文件中的所有文字。
ps:第四种慎用,百度上很多所谓的那个软件都是有病毒的,毒性不小,一般的杀毒软件查不出~~
pdf文档的规范性使得浏览者在阅读上方便了许多,但倘若要从里面提取些资料,实在是麻烦的可以。