首页 > 编程知识 正文

人力资源数据分析模板,人力资源数据分析师培训

时间:2023-05-04 20:18:24 阅读:269719 作者:2987

目的:工资,职业,月工时和满意度之间有什么关系

从聚数力网站下载源数据后,在pandas中载入数据

import numpy as npimport pandas as pddata = pd.read_csv(r'D:UsersDesktopHR_comma_sep.csv')data.head()

data.sales.unique() #查看sales的类别,包括哪些工作类型

data.info() 数据干净,无缺失值data.groupby(['salary','sales'])['average_montly_hours'].mean() 不同工资,不同工作类别下月工时的均值data.groupby(['salary','sales'])['average_montly_hours'].mean().unstack(0) 将层次化索引的外层的键放到column列  此种展示方式可以看出it类和product_mng高工资月工作时长反而越短,知识提高效率啊,哈哈

data1 = data.groupby(['salary','sales'])['average_montly_hours'].mean().unstack(0)%matplotlib inlinedata1.plot.bar(rot = 60) 以柱状图的形式展现工资,工作类别和月工时之间的关系data1.plot.bar(stacked = True,rot = 60) 以堆积图呈现,对比效果明显

data.groupby(['salary','sales'])['satisfaction_level'].mean().unstack(0).plot(rot = 60) 折线图更直观地呈现三者之间的关系,不过RandD工资越高满意度越低,可能是因为此工作的高工资带来的负面影响比较高,或者是因为刚好从事此工作的人对薪资的要求远没有对职业满意度高
def top_n(sat,n =5): lev =sat['satisfaction_level'].sort_values(ascending = False) return lev[:n]data.groupby(['salary','sales']).apply(top_n) 各工资水平下,不同岗位工作满意度最高的前5名


data.sort_values(by = 'satisfaction_level')[:20] 薪资低,月工时长是造成满意度比较低的主要原因
cats = pd.cut(data.satisfaction_level,4) 将满意度进行分区间,集中在(0.545.0.772)之间的最多cats.value_counts()

data.groupby(['sales',cats]).size().unstack()
def xg(group): return group['satisfaction_level'].corr(group['average_montly_hours'])data.groupby(['salary','sales']).apply(xg) 观察满意度和月工时之间的相关性是负相关,即月工时越高,满意度越低

待续









版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。