数据清洗超强干货之五个字段截取场景!小白快看过来!——九数云BI
标签: 数据清洗 | 发布时间: 2024-03-13 11:24:13
九数云在本文为您带来了5个数据清洗截取字段的场景,干活满满!
数据清洗是数据分析最重要且不可或缺的步骤,会占据分析过程极大的比重,清洗结果会直接影响我们的分析效率以及最终结论。今天九数云将结合使用文本函数,给大家讲解以下五类需要对字符进行截取的场景,在目标字段中如何仅保留我们想要的字符呢?
本文将介绍以下五个不同的截取场景,快快码住:
1.截取固定位数的字符
2.截取某个字符前的所有的字符
3.截取某个字符后的所有字符
4.从某个字符开始截取不固定长度的字符
5.去掉字段前后固定数目的字符
1. 数据清洗-截取固定位数的字符
截取字符串的最后 8 位固定位数字符
固定字符的截取比较简单,我们可以用 RIGHT 函数,使用公式:RIGHT(电话,8)
公式说明:
RIGHT( 电话,8 )
截取「电话」号码的最后八位构建新字段即可。
2. 数据清洗-截取某个字符前的所有的字符
从字符串中获取「:」之前的所有字符
组合 LEFT 和 FIND 函数,使用公式:LEFT(用户账号和密码,FIND(":",用户账号和密码)-1)。
公式说明:
3. 数据清洗-截取某个字符后的所有字符
从字符串中获取「:」之后的所有字符
组合 RIGHT 、 LEN 、 FIND 函数,使用公式:RIGHT(用户账号和密码,LEN(用户账号和密码)-FIND(":",用户账号和密码))。
公式说明:
4. 数据清洗-从某个字符开始截取不固定长度的字符
获取「:」后到「,」前的所有字符:
组合 MID 、 FIND 函数,使用公式:MID(用户账号和密码,FIND(":",用户账号和密码)+1,FIND(",",用户账号和密码)-FIND(":",用户账号和密码)-1)。
公式说明:
5. 数据清洗-去掉字段前后固定数目的字符
去掉字段最后的「分公司」后缀,保留公司名称,
注:若需要去掉字段前指定数目的字符串可使用RIGHT(字段,LEN(字段)-数字)。
组合 LEFT、LEN 函数,使用公式:LEFT(省份,LEN(省份)-3)。
公式说明:
6.总结
数据分析中的截取字符用于从原始字符串中提取子串,常用于数据清洗、信息抽取,有助于处理文本数据、标准化地址或名称、提取日期/时间组件。文本函数的组合,还能应用于更多的数据清理及整合步骤,借助数据分析工具九数云,成为更强的数据分析er!
上一篇: 快递拉均重账单详细算法来了!——九数云BI
下一篇: 3月更新|「数据连接」模块和自定义计算模型重磅上新!——九数云BI