2022-11-29 05:25:23
为什么用adobe reader 9把pdf文件转化为word后标点...
pdf转换成word本身就会有误差的,不可能100%的转换,因为pdf是版式标准,word是流式标准,转换成pdf后文档格式信息会全部丢失,所以再转换回来的时候有误差在所难免。
如果是word等流式文档转换成pdf后再转回来误差会小一些,只是格式上的差异;如果图片格式转换成pdf后你还想转回来还要经过ocr识别,ocr识别本身就会有误差,最高可能达到98%,如果再加上格式的丢失可能就降的更低了!
如何去除pdf文档转word文档时多余的段落标记 详细�...
文档中的文字信息复制下来,进入word 中使用“粘贴”命令可以将pdf 的文字转换为可编辑
状态。但转换过来的文本每一行末均有一个段落标记(硬回车换行符),造成进一步编辑很困
难。利用word 的“查找/替换”高级功能,可以较方便地解决这一难题。
第一步,在“查找/替换”中查找“。‘段落标记’”,(“段落标记”是指从“查找/替换”对话
框中选定“高级”后出现的“特殊字符”中加入的^p,也可直接输入“。^p”,p 是小写,
“。”就是句号。),替换为“。‘手动分页符’”(也是特殊字符,可直接输入“。^m”)。此一
步目的是将“真正”的段落标记和假的多余的段落标记区分开(每段的最后通常都是句号,
如果是别的比如说省略号或没有标点,那么�6�7�6�7)。
第二步,在“查找/替换”中查找“段落标记”,替换为空。此步是为了清除多余的段落标记。
第三步,将“手动分页符”替换为“段落标记”。至此工作完成。
实际操作中,如果需要处理的文档较多(比如重新编辑pdf 格式的电子书如武侠小说等),建
议将上述三步操作录制为一个宏(如果还有其余重复的操作比如重新设置页面格式、分栏等,