多个 word 中的数据如何提取到 excel 中
我们经常会在工作当中需要汇总多个Word中的数据,比如公司的每个部门都需要提交一份工作总结或者会议纪要,这些文件通常都是有统一的格式的。假如我们想要将这些文件中的相关信息都提取到一个excel文件中,应该怎么操作呢?
Word文档通常在记录会议纪要、工作总结等等类型的场景中用得非常的多,假如有几十个部门,每个部门都按照固定的模板提交了一份工作总结,我们需要将工作总结中的一些重要的信息提取汇总好,再向领导进行汇报,那应该怎么样快速的实现呢?
想要提取word文档中的指定内容,其实是非常复杂的一项工作,因为通常我们都需要人工的打开每一个word文档,再将对应的内容复制到excel文件当中,可能稍有不注意就会复制错。今天就给大家介绍一种自动处理的方法,帮我们实现从多个word文档中快速提取指定数据到excel文件中。
处理前
文件夹中有多个 Word 文档
这些word文档的结构都是差不多的,只不过里面的内容不一样
提取后
提取后,每个word文档都对应excel中的一条数据。
视频教程
点击查看视频教程
操作步骤
1、打开「鹰迅批量处理工具箱」,左侧选择「Word工具」,右侧在数据提取分类中选择「提取 Word 中的内容到 Excel」的功能。
2、这里一次性将多个需要进行数据提取的word文档全部都选择到软件的界面。
3、设置提取的选项。
这里提取的方式支持「
在设置前,我们先打开一个 Word 数据文件看一下内容,并确认我们需要提取的信息,比如下面红色框框标记的内容。
1、提取【工程名称】,规则是【工程名称:】之后的内容。
2、提取【验收时期】,规则是【验收时期:】之后的内容。
3、提取表格中的工程地点、工程造价、建筑面积、开工日期、施工效果图。
4、提取验收结论整段内容。
这里可以分为三种情况,
- 提取指定位置的内容,比如指定的某两个字符串之间的内容或者指定字符串到段落结尾的内容,上面的第1点、第2点便是这种情况。这种情况需要用
「自定义规则提取 」的方式进行提取。 - 提取表格中的内容,上面的第 3 点便是这种情况。这种情况需要用「
模板中提取」的方式进行提取。 - 提取整段的内容,上面的第 4 点便是这种情况。这种情况需要用「
模板中提取」的方式进行提取。
自定义规则提取
因此我们先勾选
这样我们就建好了一个自定义的规则。
模板中提取
因此我们先勾选
这里的模板文件是哪里来的呢?我们需要怎么设置这个模板文件呢?
我们只需要任意复制一个 Word 数据文件,然后将内容进行相应的调整即可,见下图:
这里注意红色框框的内容就是我们修改后的内容,我们将这些单元格或者段落用占位符代替,占位符用英文输入法状态下的中括号[]包裹。这些单元格对应的内容就会被提取到 Excel 文件中,并且会以中括号内的占位符作为提取后的 Excel 表头名称。
4、设置输出目录。
5、处理完成。
一会儿,软件的处理就完成了,我们选择的多个word文档中的指定数据就全部汇总到一个excel文件当中了,这个时候我们可以打开提取后的excel文档,看看数据的效果。
通过这种方式对多个word中数据进行提取,是不是非常的简单呢?有了这种方法,我们就再也不需要人工一个个打开word文档进行复制粘贴了,简单的几步操作,不管几百个还是几千个word文档,数据都能够轻松的提取到一起。有需要的小伙伴赶紧自己去尝试一下吧。