excel数据去重:海量数据删除重复项原来只需要两个步骤

标签: excel数据去重 九数云 | 发布时间: 2022-08-12 11:24:35

很多人在使用Excel删除重复项时经常出现的问题,九数云是如何轻松解决的?

在excel分析数据时,最头疼的莫过于数据清洗。数据清洗作为数据分析全过程的必要步骤,会占据分析过程的50%—80%的时间,其结果质量会直接影响模型效果和最终结论,而删除重复数据(excel数据去重)往往是数据清洗的第一步。

提到删除重复数据,一般都会想到利用Excel来处理,常见的处理的方式大概有三种:公式、删除重复项、高级筛选。然而,在使用Excel时很容易出现很多变数。删除重复数据时“如何迅速汇总海量表格,将步骤化繁为简”成为人心所向,九数云功能之一就此应运而生。

下面小九就很多人在使用Excel删除重复项时经常出现的问题,谈谈如何用九数云轻松解决。

Excel数据去重

用户在使用Excel时会遇见很多问题

  1. 汇总庞大的数据,,只能一一复制粘贴众多表格,还没进行到删除重复项的步骤,电脑早已严重卡顿
  2. 某些数据有多个不同的值,无法选择第一项或者最后一项
  3. 设置删除重复项的比较列时少选择了几列,导致误删数据。一步错步步错,发现筛选结果出错后只能从头再来
  4. 版本低的Excel有时候用删除重复项和高级筛选功能达不到目的,只能利用公式:
    • 用COUNTIF函数得出结果时,再筛选提取次数为1的数据实在太麻烦
    • 想用UNIQUE函数优雅地删除数据,发现自己版本不支持
    • 零基础小白想学习用普通数组函数提取,却只能看着公式缓缓打出一个问号。excel数据去重:海量数据删除重复项原来只需要两个步骤插图

九数云数据去重

跳过由excel数据去重,因为海量数据导致卡顿的“环节”,在九数云依次上传需要的表格后,就可以正式开始丝滑删除重复数据了。

1. 删除整行重复数据

01 点击示例表「重复数据>分析表」,选择「确定」创建分析表。

excel数据去重:海量数据删除重复项原来只需要两个步骤插图1

02 选择全部字段,然后点击「+」。

在「更多」中添加「删除重复数据」分析步骤,就可实现效果。

excel数据去重:海量数据删除重复项原来只需要两个步骤插图2

03 删除完重复数据后会自动进入预览界面,可以看到数据从40条变成了27条。

excel数据去重:海量数据删除重复项原来只需要两个步骤插图3

2. 部分字段去重计数

在使用Excel批量删除重复项功能的时候,往往只会保留第一条不重复数据。但倘若我们需要的是最后一条不重复数据,就南辕北辙了。

举个例子,公司名称存在重复记录,需求是保留有公司全称的数据,这时用Excel筛选就不太方便了,因为不能自由选择项

excel数据去重:海量数据删除重复项原来只需要两个步骤插图4

九数云可以去重保留第一项或最后一项,在正常删除重复数据后,将需要的字段从「分类」拖拽到「汇总」,再选择你要的项,就可达到部分去重计数的结果。

excel数据去重:海量数据删除重复项原来只需要两个步骤插图5

3.更新源数据自动完成数据清洗

后续不想进行重复的步骤,可以点击「更新Excel」,上传新的表格后九数云将会自动复用你上次的操作。

excel数据去重:海量数据删除重复项原来只需要两个步骤插图6

总结

在处理少量数据时,Excel凭借其强大的基础功能和容易上手的操作性,在数据分析领域占有绝对的统治地位,大多数用户想要删除重复数据也会第一时间想到它。但对海量数据进行数据分析,Excel数据去重就因操作严重卡顿影响效率而失去优势。

九数云简化了Excel数据去重步骤,并且相较于Excel的一次性分析模式,作为自助式BI的九数云能解放用户的双手,提供一种一劳永逸、事半功倍的数据分析模式,即同样的分析模式制作一次,后面都可以复用。当用户的表格更新,需要再一次删除重复数据时,要做的只是简单地动动手指,上传Excel更新数据,然后等待九数云自动清洗数据即可,极大地提高了用户的效率。



上一篇:
下一篇:
相关内容