2023-01-03 17:23:41
为什么我复制pdf文字到word里显示的是乱码的啊 - 百...
是文字支持问题,不如用这款软件
我用的是cajviewer
cajviewer5.5_ocr v5.5.0 build 4030
说明:带ocr识别,带多语言包,ocr识别支持中英文识别。 大小:32.911 mb
1)局部文字识别:直接使用caj浏览器的ocr
2)全文件识别:打印到microsoft office document image writer打印机,选择打印形成的文件的保存位置,然后会自动形成一个mdi文件,并且自动用microsoft office document image打开此文件,然后选择“工具”菜单下的“使用ocr识别文本”,识别完成后,在选择“工具”下的,“将文本发送到word”,最后将把整个 pdf文件识别输出到word文件中。
注意:microsoft office document image可以非常准确的全文件识别转化中文、英文、表格,但是无法将图形输出到word,而是把文件中的所有图形单独形成一个个独立的图片文件,放在相同位置的一个相同名称的文件夹中,因此可用snagit软件将图形打开,然后复制到word中。(所有的识别软件都不能很好的处理图形的识别问题, microsoft office document image的这种处理方法已经是非常好的解决这个问题了。)
推荐快速方法:
从caj文件中提取文本前需要做好以下准备工作,安装caj文件浏览器5.5,安装office2003,并完全安装office工具 microsoft office document imaging,然后在打印机里面会增加microsoft office document image writer打印机。 microsoft office document image可以非常准确的全文件识别转化中文、英文、表格。
caj文件的识别:
(一)首先,从网上下载caj格式的资料文件保存到本地硬盘上。
(二)然后,启动cajviewer浏览器程序,并在该程序中打开刚才保存的caj格式的文件。浏览文件到最后一页后,不要关闭caj浏览器程序。
(三)在caj浏览器程序窗口中,选择“文件”→“打印”,并选择打印机为microsoft office document image writer打印机,勾选打印到文件选项和确定打印页数。
(四)保存打印文件(*.prn)到适当位置。等待打印完成后,microsoft office document image 自动打开刚才保存的打印文件。
(五)在microsoft office document image窗口中,选择“页面”菜单中的“选择所有页面”菜单项,然后选择“工具”菜单中的“使用ocr识别文本”提取文本。
(六)选择“工具”下的 “将文本发送到word”,最后将把整个caj文件识别输出到word文件中。
word在装了学习精要learning essentials后,pdfmaker...
在您使用安装了 adobe pdfmaker 加载项的 microsoft office 2003 程序时,可能会收到此错误消息。
症状
在您使用 microsoft office 2003 程序时,可能会收到以下消息:
microsoft office <程序名称> 检测到您的计算机上存在一个已知会导致 <程序名称> 2003 不稳定的 adobe acrobat pdfmaker 版本。要解决此问题,请从 adobe systems 的网站上下载更新。
注释 在此消息中,<程序名称> 是出现错误时您正在使用的 office 2003 程序。
原因
发生此错误的原因是 adobe acrobat 5.0.5 或更早版本附带并一起安装的 pdfmaker.dot 文件、pdfmaker.xla 文件或 pdfmaker.ppa 加载项与 office 2003 不兼容。adobe 不支持在 office 2003 中运行 5.0.5 版本或更早版本的 pdfmaker 模板。
完全解决方案
为了实现 pdfmaker 加载项与 microsoft office 2003 程序的兼容,您需要使用 adobe acrobat 6.0。有关 adobe acrobat 6.0 的详细信息,请访问 adobe acrobat 系列产品网站。
临时解决方法
若要临时解决此问题,请重命名用于 office 2003 程序的所有 adobe acrobat 加载项。具体操作步骤如下:
退出 office 2003 程序。
单击“开始”,再单击“搜索”。
单击“所有文件和文件夹”。
在“全部或部分文件名”框中,键入 pdfmaker.dot(用于 microsoft office word)、pdfmaker.xla(用于 microsoft office excel)或 pdfmaker.ppa(用于 microsoft office powerpoint®),再单击“搜索”。
重命名找到的每个文件。
操作方法
右键单击该文件,单击“重命名”,为文件键入新名称,再按 enter。
例如,将 pdfmaker.dot 重命名为 pdfmaker.old。