word 登记表中的信息如何提取汇总到 excel 中
我们经常会需要用到word进行信息登记,比如我们将每个工程项目的信息登记在word表格当中,这样登记后虽然很直观,但是如果想要对数据进行汇总就不太方便了。今天就给大家介绍一下如何将登记表中的信息提取到excel中进行汇总。
想要提取Word表格中的相关信息到excel中,如果依靠人工的话,我们需要打开每一个word文档,然后复制对应区域的内容到excel表格的对应列这种操作非常的繁琐,文件数量非常多的时候,可能一不小心就漏掉了某个文件。
在这种批量的场景下,我们需要使用批量处理脚本才能够快速的提取。但是普通的批量处理脚本很难做到通用,可能表格内容结构发生变化,那脚本也得跟着调整,这对我们的挑战就太大了。今天就给大家介绍一种使用批量处理工具来帮我们实现提取word登记表中的信息到excel中的操作方法。
处理前
在我们的文件夹中有多个word文件,这些文件的内容都是需要被提取汇总到excel中的,如下图:
这些word文档内容结构基本上都是类似的。
提取后
提取后,所有word文档的内容都汇总到了一个excel表格当中,每个word文档的内容对应一条数据。
视频教程
点击查看视频教程
操作步骤
1、打开「鹰迅批量处理工具箱」,左侧选择「Word工具」,右侧在数据提取分类中选择「提取 Word 中的内容到 Excel」的功能。
2、所有需要汇总提取的word文档,一次性都选择到软件的界面上来。
3、设置提取的选项。
这里我们可以看到提取的方式有两种,分别是「
在进行设置之前,我们先打开一个word文档的内容,确认好我们需要提取的范围。
根据上图中红色框框的标记,我们可以整理出下面的提取规则:
1、提取工程名称,规则是【工程名称:】之后的内容。
2、提取验收时期,规则是【验收时期:】之后的内容。
3、提取表格中的工程地点、工程造价、建筑面积、开工日期、施工效果图。
4、提取验收结论整段内容。
这里可以分为三种情况,
- 提取指定位置的内容,比如指定的某两个字符串之间的内容或者指定字符串到段落结尾的内容,上面的第1点、第2点便是这种情况。这种情况需要用
「自定义规则提取 」的方式进行提取。 - 提取表格中的内容,上面的第 3 点便是这种情况。这种情况需要用「
模板中提取」的方式进行提取。 - 提取整段的内容,上面的第 4 点便是这种情况。这种情况需要用「
模板中提取」的方式进行提取。
自定义规则提取
因此我们先勾选
这样我们就建好了一个自定义的规则。
模板中提取
因此我们先勾选
那么这里的模板文件是哪里来的呢?我们只需要任意复制一个word的数据文件,然后进行一些简单的修改就可以了。
这里注意红色框框的内容就是我们修改的内容,我们将这些单元格或者段落用占位符代替,占位符用英文输入法状态下的中括号[]包裹。这些单元格对应的内容就会被提取到 Excel 文件中,并且会以中括号内的占位符作为提取后的 Excel 表头名称。
4、设置输出目录。
5、处理完成。
一会儿多个word登记表中的信息全部都被提取到一整个excel文件中了,我们再对这些数据在进行筛选汇总等操作就方便很多了,这样我们在一个表格中就能看到所有登记信息,一目了然了。
通过这种方法汇总提取多个word中的信息, 再也不需要我们人工一个一个的操作了,这种批量处理的方法简单,那么大家以后碰到需要提取汇总多个word登记表中信息的时候,就赶紧来试试这个方法吧。