如何用excel做数据分析?——九数云

标签: excel做数据分析 | 发布时间: 2023-03-09 8:57:47

excel是数据分析的最基础的工具,它是日常工作中最常用的工具,在不考虑性能和处理数据量的情况下,用excel做数据分析完全可以应付大部分的数据分析工作。

前提:明确目的

用excel做数据分析的一定要知道分析方向和目的,一切数据分析都是以业务为核心目的,而不是以数据为目的。

数据用来解决什么问题?是进行汇总统计制作成报表?是进行数据可视化,作为一张信息图?

是验证某一类业务假设?是希望提高某一个指标的KPI?

1、提出问题

2012到2015年的销售额的变化趋势?反映了什么样的销售规律?

总销售量前三的产品是哪些类别?各自占比?

男、女婴儿的占比?

什么年龄段的婴儿购买量较大?

2、理解数据

理解数据中各字段的含义以及字段记录的信息,是非常重要的。

用excel做数据分析的过程中常用的数据类型主要有:字符串、数值、逻辑。

注意:字符串形成存储的数值,属于字符串类型。文本类型不能计算,只有转换为数值类型,才能计算。

3、数据清洗

(1)数据检查

选择子集:

若是直接操作原始数据,对不需要的字段进行隐藏,对于数据尽量不要删除,不需要可以隐藏。此处,因为不直接操作原始数据,选中数据分析中所不需要的数据字段,做删除处理。

(2)列名重命名

将英文字段转换成我们习惯的中文字段,方便理解、查看,便于后续用excel做数据分析。

注:最好直接将英文字段修改成中文字段,此处演示只是为了方便对比。

(3)数据类型转化

日期数据处理:对于存在的不规则日期、时间数据,先转换成统一格式。

有时候,需要用到分列功能。

(4)数据去重

根据分析目的不同,也可以不做去重处理。是否执行去重操作,具体看分析业务需要!

(5)缺失值处理

缺失值的主要处理逻辑有:填充数据和删除数据。至于选择填充数据还是删除数据,根据数据量和业务需求而定。若数据量较多,且删除不影响数据分析,就删除。若数据量较少,建议选择填充数据。

(6)数据排序

本案例按“降序”排列。

(7)异常值处理

a、表2 婴儿信息表中,“出生日期” 字段,通过筛选或升序排列,可以发现,有婴儿“出生日期”为:1984-06-16,与当前表中数据有明显差异,做删除处理

b、表2 婴儿信息表中,“性别”字段,通过筛选发现婴儿性别出现2,可能是用excel做数据分析时数据统计出错,考虑到当前数量较大,异常值仅仅占极小一部分分,故进行删除处理。



上一篇:
下一篇:
相关内容