首页 新闻 会员 周边

通过OCR识别将PDF转Word后的页眉页脚处理

0
悬赏园豆:200 [待解决问题]

我用OCR识别pdf文件后,页眉(页码、所属章节)、页脚(①注释内容)也在正文。
需求:删除多余的页眉(页码、所属章节),将页脚(①注释内容)引用到正文正确位置,变为脚注,相邻页面同一段落内容断开的需去除多余回车
提问:可以用代码处理吗屏幕截图 2026-05-27 154923
屏幕截图 2026-05-27 154944

zhengshunfang1995的主页 zhengshunfang1995 | 初学一级 | 园豆:2
提问于:2026-05-27 15:48
< >
分享
所有回答(2)
0

可以处理。我写Python脚本:

  1. 按位置自动删页眉页脚
  2. 识别①这类注释转脚注
  3. 合并跨页断行
    输出干净文本或Word。按文档复杂度收费50-200元,需发一页样例确认规则。
loveme2 | 园豆:176 (初学一级) | 2026-05-28 08:18
0

这个办法好,小妹正在帮你找答案中!

ledhook | 园豆:210 (菜鸟二级) | 2026-06-01 19:55
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册