Excel数据清洗方法有哪些?
一、什么是Excel数据清洗
Excel数据清洗是指对原始数据进行整理、修正和标准化处理,让数据变成“可分析、可计算、可建模”的状态。
一句话理解:
数据清洗 = 把“脏数据”变成“干净数据”
二、为什么必须做数据清洗
如果不清洗数据,会导致:
统计结果错误
透视表异常
图表失真
函数报错
典型问题:
空格多
格式不统一
重复数据
错误值
文本与数字混用
三、Excel数据清洗的核心方法
方法一:删除重复数据
操作路径:
数据 → 删除重复项
适用场景:
客户名单去重
订单数据去重
方法二:处理空值(空单元格)
方法1:筛选删除
筛选空值 → 删除行
方法2:批量填充
选中空白 → 输入公式:
="暂无数据"
Ctrl + Enter 批量填充
方法三:统一格式(非常重要)
1. 日期格式统一
确保全部为标准日期格式
2. 数字格式统一
避免:
文本数字(无法计算)
带单位数字(如100元)
3. 文本格式统一
例如:
“华东区”和“华东地区”要统一
方法四:去除多余空格
使用函数:
=TRIM(A1)
作用:
去掉前后空格
去掉多余中间空格
方法五:文本清洗函数
1. CLEAN函数(去除不可见字符)
=CLEAN(A1)
2. SUBSTITUTE替换
=SUBSTITUTE(A1,"旧内容","新内容")
3. REPLACE替换指定位置
=REPLACE(A1,1,3,"ABC")
方法六:分列清洗数据
路径:
数据 → 分列
用途:
拆分姓名
拆分地址
拆分编码
方法七:统一大小写
1. 全大写
=UPPER(A1)
2. 全小写
=LOWER(A1)
3. 首字母大写
=PROPER(A1)
方法八:错误值处理
使用 IFERROR
=IFERROR(公式,"默认值")
常见错误:
#N/A
#VALUE!
#DIV/0!
方法九:数值转换清洗
1. 文本转数字
=VALUE(A1)
2. 去除单位
=SUBSTITUTE(A1,"元","")
方法十:筛选异常值
操作:
筛选 → 数值条件
例如:
大于10000
小于0
四、Excel高级数据清洗方法
方法一:条件格式清洗
用于标记异常数据
例如:
重复值
空值
超出范围
方法二:Power Query清洗(企业级)
功能:
自动清洗数据
批量处理数据源
可重复使用
适用场景:
电商数据
财务数据
系统导出数据
方法三:辅助列清洗法
例如:
原数据 → 清洗列 → 最终数据
优点:
安全
可追溯
易修改
五、Excel数据清洗完整流程
第一步:检查数据结构
是否有空行
是否有合并单元格
第二步:去重处理
删除重复记录
第三步:格式统一
日期 / 数值 / 文本统一
第四步:清理空值与异常值
填充或删除
第五步:文本规范化
统一名称与编码
第六步:错误值处理
使用IFERROR兜底
六、数据清洗常见错误
1. 直接做分析不清洗
导致结果错误
2. 没有统一格式
透视表无法正确汇总
3. 忽略隐藏字符
影响匹配函数
4. 直接修改原始数据
导致不可追溯
七、数据清洗最佳实践
1. 永远保留原始数据
不要直接覆盖
2. 使用清洗辅助列
分步处理
3. 标准化字段命名
统一格式
4. 清洗后再分析
避免错误分析结果
八、总结
Excel数据清洗的核心逻辑是:
去重 → 补空 → 统一格式 → 处理异常 → 标准化字段
只要数据干净,后面的函数、透视表、图表才是准确的。