下载中心

如何用PDF扫描件中的内容,批量重命名文档?

工作中,我们经常需要从PDF扫描件中批量提取指定区域的关键信息(如合同编号、公司名称、日期等),并用这些提取的内容来自动重命名文件。本文介绍通过一款「鹰迅OCR」,可以自动提取pdf中的任意内容,并以此来命名文档,非常适用于财务发票处理、合同归档、证件扫描等需要大量文档管理的场景,可大幅提升办公效率,提高文档整理效率。

什么场景需要根据扫描件内容重命名PDF

在日常办公中,我们经常需要处理大量PDF扫描件——合同、发票、报表、证件等。这些文件的原始名称往往是杂乱无章的编号或扫描日期,查找特定文件时非常困难。以下场景尤其需要批量重命名:

效果预览:PDF扫描件用文档内容批量重命名

PDF扫描件批量重命名处理前效果

处理前,文件夹中有多个pdf扫描件合同,每个合同命名没有规律,难以找到对应的公司合同。

PDF扫描件批量重命名处理前效果

PDF扫描件批量重命名处理后效果

处理后,每个pdf文档都根据文档中的公司名称来进行了重命名,文件更方便查找归档。

PDF扫描件批量重命名处理后效果

今天本文就来分享具体的操作步骤,整个操作大体上分两步:

第一步:批量提取PDF扫描件中我们需要用来命名的内容,可以是任意区域的内容。

第二步:用提取的内容进行批量重命名操作。

实操教程:PDF扫描件用文档内容批量重命名

1、打开「鹰迅OCR」,左侧选择「文档处理」,右侧选择「提取PDF指定区域内容」的功能。

首先提取我们需要用来重命名的内容,可以是文档任意内容。这里针对的是pdf文档,可以是普通的pdf文档,也可以是pdf扫描件,图片型pdf文档。

如果我们需要处理的文档是发票,我们可以使用软件左侧中的「财务票据」分类中的「增值税发票」的功能来提取发票中的信息。同理,如果我们是一些身份证、营业执照等,我们都可以找到相应的功能。

PDF扫描件批量重命名提取内容功能选择

2、选择需要处理的pdf文档。

这里可以同时处理多个pdf文档。

PDF扫描件批量重命名提取内容文件选择

3、设置提取内容的规则。

PDF扫描件批量重命名设置提取规则设置

这里我们点击设置提取规则」按钮会打开弹窗进行规则的设置。

PDF扫描件批量重命名绘制提取内容的选区

这里通过选区工具,来绘制一个我们需要提取内容的区域。例如这里我们需要提取公司名称,就在公司名称区域绘制一个选区,然后取个名称,方便我们需要同时提取多个内容时进行区分。

我们还可以通过Ctrl+滚轮的方式放大需要提取的页面,方便更精准的提取想要的内容。

绘制好提取的区域之后,点击【完成选区标注】,就进去下一个界面。

PDF扫描件批量重命名选区绘制列表

在这里,就可以看到我们需要提取的内容选区的具体信息,这里我们只提取了公司名称这一个内容,如果有多个内容这里也会全部显示。

4、批量提取pdf内容处理完成。

选择一个提取后的文档保存的位置,1秒就提取成功。

PDF扫描件批量重命名提取内容处理完成

提取成功后,我们可以查看提取的信息,这里文档中的公司名称就全部提取出来了。

PDF扫描件批量重命名查看提取后的表格

5、用提取内容进行重命名功能选择。

回到软件界面,在「通用辅助功能」中选择「导入 Excel 修改文件名」功能来批量修改文档名称。

PDF扫描件批量重命名功能选择

6、设置重命名的模版,并添加到软件中。

PDF扫描件批量重命名导入重命名模板

在操作之前,我们需要先下载一个重命名的模板,然后把我们提取的信息复制进来,然后点击【从Excel中导入待处理信息】按钮,上传我们设置好的重命名模板。具体模板显示如下:

PDF扫描件批量重命名Excel模板展示

7、预览文档新的名称,并设置重命名后的文档保存位置。

PDF扫描件批量重命名预览

这里我们就可以预览新的文档名称,是不是符合我们的需求。

8、PDF扫描件用文档内容批量重命名处理完成。

PDF扫描件用文档内容批量重命名处理完成

常见问题FAQ:PDF扫描件用文档内容批量重命名

Q:OCR识别准确率如何?

A:识别准确率可达95%以上,只是注意我们在设置提取的内容时,保证提取区域精准,否则容易提取其他同坐标的其他内容。

Q:处理的pdf文档需要结构相同吗?

A:需要,工具是通过绘制选区坐标的方式,以第一份示例文件绘制选区然后应用到其他文档,因此如果有大量的文档有提取内容重命名的需求,需要保障每份文档需要提取的内容位于相同坐标,也就是文档结构相同。

Q:支持哪些类型的PDF文件?

A:支持所有标准PDF格式,包括纯扫描版PDF(无文字层)、文字版PDF、图文混排PDF。如果是加密PDF,需要先解除密码限制再导入处理。

Q:可以只提取PDF部分页面的内容吗?

A:支持指定页码范围进行OCR识别。例如,多页合同的第一页通常包含合同编号和双方信息,可以只针对第一页标记识别区域,避免无关内容干扰

Q:导出表格有什么用途?

A:系统自动将每个文件的提取内容整合为Excel表格,整合我们提取的字段内容,不仅可以用来重命名文档,还可直接推送至ERP、CRM等业务系统,或用于后续数据清洗、统计分析,无需手动录入。

Q:处理大量文件时会不会很慢?

A:不会。上千份的文档也能在短短1分钟之内完成所有操作。批量处理数量没有限制,适合企业级文档处理需求。

使用总结:PDF扫描件用文档内容批量重命名

本文介绍了如何使用「鹰迅OCR」工具,来解决PDF扫描件文件名杂乱、难以检索的痛点。核心步骤包括:导入PDF文件→标记需要用来命名的内容区域→执行批量重命名并导出表格。整个过程自动化程度高,操作简单,如果你每天都要面对几十上百份扫描件,手动重命名太耗时,现在就来试试这个批量处理的方法吧!

正文到此结束
立即下载