我用OCR识别pdf文件后,页眉(页码、所属章节)、页脚(①注释内容)也在正文。 需求:删除多余的页眉(页码、所属章节),将页脚(①注释内容)引用到正文正确位置,变为脚注,相邻页面同一段落内容断开的需去除多余回车 提问:可以用代码处理吗
可以处理。我写Python脚本:
这个办法好,小妹正在帮你找答案中!