2022-11-28 07:01:50
我在把pdf格式的文字复制到word后 出现了一行满了下...
这是因为pdf的页宽比word中设置的稍大,在word中单击文件-页面设置,修改纸张和页边距。
放大页边距只是使外观显得正常,其实这是的每一行都有一个回车,而不是每一段才有一个回车。解决的方法是:单击编辑-替换,在“查找内容”中填入^p,在“替换为”中留空,单击确定删除所有硬回车,然后再分段。如果每段开头有空格,就把空格替换为回车加空格,这样段落就分好了。
pdf转换后的word文字和原版面一样,每行的字数是固定...
对于你的描述 可以判断你的文件是图片做成的,solid是没有办法处理这样的文件的~~你可以按下面的方法做~~~这是我不断的实践中自己总结的:
2. 对于是图片做成的pdf(特别是扫描件做成的pdf)文件
推荐用下面软件转换
2.1 页数比较少的用 cajviewer 7.0 (带ocr组件完整版) ,支持直接打开pdf文件,识别文字。
2.2 页数比较多的可以用 readiris corporate 12软件来进行识别 (需要安装亚洲语言包,不然不识别中文)
2.3 页数比较多的还可以用 abbyy finereader 9或者9以上版本(有简体中文版)进行识别转换。
这个软件的识别率很高,转换出来的版面基本保持原样,还可以手动人工框选识别,缺点就是识别速度较慢。
上面几个软件的识别率都还可以,不建议用什么office组件识别,太麻烦识别率也不高。
3. 对于一些不允许做修改的pdf文件(就是加密加了权限的pdf),那么就先要去除密码或者去除数字证书,才能照上面两个步骤做~~~
请参考
将pdf格式的文件转为word格式后,行与行之间多了空白...
楼上的^p是错误的,也不能全换。我复制楼主的文字查看过了,那些是手动换行符号。
应该用^l^l全部替换为^l
注:在word里看到是↓符号就是用^l,如果看到是转弯的回车符号,就用^p,记得是用2个替换为1个,否则整篇文章都到一起了