1. excel数据清洗
第一步,把所有工资表放在一个文件夹里面,再把所有社保缴费明细放到另外一个文件夹里面。
第二步,使用power query把每个月工资表里面代扣的社保个人部分全部导入,同时载入数据模型中。
第三步,同第二步一样导入社保缴费明细,同时加载到模型。
第三步,开始建立模型,包括建立关系,建立度量值,然后使用扁平化数据透视表,对两个表进行联合透视。
第四步,透视表完成后,基本上就有了每个保险的代扣记录,代缴记录,差异值。
最后,多说一句,为什么我愿意回答这个问题。因为,你这个问题,忽然让我想起了。当年做社保清理,前后清理了公司将近13个年度的全部社保。那时候可没有什么power query这等工具,纯excel操作,所以,加油吧!
2. Excel数据清洗
1打开excel表格,Ctrl A全选表格
2在顶部开始菜单栏右侧找到表格图标,选择表格-清除-内容
3如图所示,已经把表格数据清除了。
3. excel数据清洗三种方法
1、打开需要清除内容的 Excel 表格,使用鼠标选中需要清除内容的单元格;
2、然后按一下键盘上“Delete”键;
3、即可将单元格中的内容一次性清除,而格式保持不变。
4. Excel数据清洗为标准格式
一、电脑端
1.回收站还原
首先是回收站还原的方法,我们可以先找到自己误删的文件,然后点击右键,就可以进一步选择【还原】的操作,这样就可以快速恢复我们想要的文件,可以说是非常方便了。
2.WPS备份中心
我们同样可以使用WPS的备份中心,只需要点击左上角的【文件】按钮,然后就可以使用这个功能,接下来就可以快速恢复已经误删的文件哦,但是前提你需要在编辑的时候就处于登录状态了呢。
二、手机端
1.手机数据恢复大师
在手机端进行恢复的话,我们也可以使用手机数据恢复大师的方法,可以对多种文件格式进行快速恢复,例如我们要恢复Excel文件时,可以先选择【Office文件恢复】按钮,然后选择【Excel文档】,最后再点击【确定】即可,是不是超级方便的呢。
2.小米云备份恢复
另外,我们同样可以使用手机自带的备份恢复功能,例如小米手机就有小米云服务功能,平时会自动将重要的文件备份到云端,此时你需要开启【自动同步数据】或者【仅在WLAN下同步】,即可对数据进行快速恢复了。
5. Excel数据清洗的相关操作
1、首先在excel表格中输入性别数据,需要根据性别计算费用的数值。
2、然后在B2单元格中输入函数公式:=IF(A2="男",80,IF(A2="女",100,0))。
3、点击回车按键,即可将输入的函数公式生成计算结果,可以看到在A2显示为男时,对应的金额为80。
4、然后点击B2单元格右下角绿色圆点向下填充公式,即可得到批量的计算金额的结果了。
6. excel中数据清洗
数据清洗目的主要有:
①解决数据质量问题;
②让数据更适合做挖掘;
数据清洗是对数据审查过程中发现的明显错误值、缺失值、异常值、可疑数据,选用一定方法进行“清洗”,为后续的数据分析做准备。
数据清洗的方法有:
①数据数值化
对存在各种不同格式的数据形式的原始数据,对其进行标准化操作。对字符串取值,按照ANSI码值求和得到字符串的值,如果值太大,取一个适当的质数对其求模。
②标准化 normalization
对整体数据进行归一化工作,利用min-max标准化方法将数据都映射到一个指定的数值区间。
③数据降维
原始数据存在很多维度,使用主成分分析法对数据的相关性分析来降低数据维度。
④数据完整性
数据完整性包括数据缺失补数据和数据去重;
补全数据的方法有:
1. 通过身份证件号码推算性别、籍贯、出生日期、年龄(包括但不局限)等信息补全;
2. 通过前后数据补全;
3. 实在补不全的,对数据进行剔除。
数据去重的方法有:
1. 用sql或者excel“去除重复记录”去重;
2. 按规则去重,编写一系列的规则,对重复情况复杂的数据进行去重。
7. Excel数据清洗是什么
数据清洗是为了解决数据质量问题,“脏数据”一般有以下三种类型:
1、残缺数据
这一类数据主要是一些应该有的信息缺失,如供应商的名称、分公司的名称、客户的区域信息缺失、业务系统中主表与明细表不能匹配等。对于这一类数据过滤出来,按缺失的内容分别写入不同Excel文件向客户提交,要求在规定的时间内补全。补全后才写入数据仓库。
2、错误数据
这一类错误产生的原因是业务系统不够健全,在接收输入后没有进行判断直接写入后台数据库造成的,比如数值数据输成全角数字字符、字符串数据后面有一个回车操作、日期格式不正确、日期越界等。这一类数据也要分类,对于类似于全角字符、数据前后有不可见字符的问题,只能通过写SQL语句的方式找出来,然后要求客户在业务系统修正之后抽取。日期格式不正确的或者是日期越界的这一类错误会导致ETL运行失败,这一类错误需要去业务系统数据库用SQL的方式挑出来,交给业务主管部门要求限期修正,修正之后再抽取。
3、重复数据
对于这一类数据——特别是维表中会出现这种情况——将重复数据记录的所有字段导出来,让客户确认并整理。
数据清洗是一个反复的过程,不可能在几天内完成,只有不断的发现问题,解决问题。对于是否过滤,是否修正一般要求客户确认,对于过滤掉的数据,写入Excel文件或者将过滤数据写入数据表,在ETL开发的初期可以每天向业务单位发送过滤数据的邮件,促使他们尽快地修正错误,同时也可以做为将来验证数据的依据。数据清洗需要注意的是不要将有用的数据过滤掉,对于每个过滤规则认真进行验证,并要用户确认。
1、Trim
功能:去除单元格两端的空格。
语法:=TRIM(text)
text指要移除空格的文本或者单元格名称
说明:此方法只能删除字符串首尾的空格,而不能删除字符串中间的空格!因为英文单词之间的空格是必须的,Excel不会去除这种空格!
2、Clean
有时文字值包含起始空格、 尾随或多个嵌入的空格字符 (Unicode 字符集值 32 和 160) 或非打印字符 (Unicode 字符集值 0 到 31、 127、 129、 141、 143、 144 和 157)。这些字符进行排序、 筛选或搜索时,有时会导致意外的结果。
功能:删除文本中所有不能打印的字符。
语法:=CLEAN(text)
CLEAN 函数语法具有以下参数:
text,必需。要从中删除非打印字符的任何工作表信息。
3、Concatenate
功能:连接单元格内的内容
语法:= CONCATENATE(text1, [text2], ...)
text1为必需,要联接的第一个项目。项目可以是文本值、数字或单元格引用。
[text2]表示text2为选填的意思,下同。
说明:concatenate能够连接的参数最多只有30个,而&则没有限制。
4、Mid
功能:提取字符串中间的字符串
语法:= MID(text, start_num, num_chars)
text必填。包含要提取字符的文本字符串。
Start_num必填。文本中要提取的第一个字符的位置。文本中第一个字符的 start_num 为 1,以此类推。
Num_chars必填。指定希望 MID 从文本中返回字符的个数。
5、Left
如果继续想从出生年月里提取年份,则需要用到left函数。
功能:提取字符串左边的字符串
语法:= LEFT(text, [num_chars])
Text,必需。 包含要提取的字符的文本字符串。
num_chars,可选。 指定要由 LEFT 提取的字符的数量。
Num_chars 必须大于或等于零。
如果 num_chars 大于文本长度,则 LEFT 返回全部文本。
如果省略 num_chars,则假定其值为 1。
6、right
与left类似,如果想从出生年月里提取月日,则需要用到right函数。
功能:提取字符串右边的字符串
语法:=RIGHT(text,[num_chars])
text 必需。包含要提取字符的文本字符串。
num_chars可选。指定希望RIGHT提取的字符数。
7、repalce
功能:替换字符串中的连续几个字符或者某个字符
语法:= REPLACE(old_text, start_num, num_chars, new_text)
Old_text必填。要替换其部分字符的文本。
Start_num必填。old_text 中要替换为 new_text 的字符位置。
Num_chars必填。old_text 中希望 REPLACE 使用 new_text 来进行替换的字符数。
New_text必填。将替换 old_text 中字符的文本。
8、substitute
也可以利用substitute实现。
功能:替换字符串中的连续几个字符或者某个字符
语法:=SUBSTITUTE(text, old_text, new_text, [instance_num])
text必填。需要替换其中字符的文本,或对含有文本(需要替换其中字符)的单元格的引用。
Old_text必填。需要替换的文本。
New_text必填。用于替换 old_text 的文本。
Instance_num虽然日程表需要数据点之间常量的步骤,预测.指定要用 new_text 替换 old_text 的事件。如果指定了 instance_num,则只有满足要求的 old_text 被替换。否则,文本中出现的所有 old_text 都会更改为 new_text。
8. Excel数据清洗的方法包括
出现这种情况的原因是因为发送完整个文件后,没等对方查看,自己就改变了文件的存储位置,就会显示文件被清理了,具体如下:
1、首先选择一个文件。
2、点击选择一个好友点击发送。
3、之后选择这个文件的原位置,选择删除。
4、然后对方再打开这个文件。
5、就会显示文件已被清理了。
- 相关评论
- 我要评论
-