前言

笔者一直想将概率统计、数据挖掘等数据分析的高级方法应用到人力资源管理领域。在当前的信息化、数据化时代,人力资源管理对数据的依赖性相当强,从招聘中的能力和素质测评,到培训评估、绩效管理、岗位分析、劳动用工、效能分析、薪酬管理等各方面都需要进行数据分析。但人力资源的数据分析大多是描述性统计分析,较少用到高级数据分析技术,如回归分析、聚类分析、因子分析、判别分析、文本挖掘等,对数据的利用率不高,更缺乏对数据的有效和深入挖掘。

笔者一直苦于没有找到合适的工具,直到接触R语言。随着了解不断深入,笔者发现R语言有很多优点:它摆脱了SPSS这类软件的禁锢,即摆脱那种严格的环境和刻板的分析;函数式的编程风格很接近Excel函数用法,复杂的模型通常一两个函数就能解决,容易学习和上手;拥有大量的统计算法,可以任意研究和使用;可以绘制出生动美观的数据图形。而且R语言完全免费,这对人力资源管理专业人员来说非常重要,因为企业几乎不太可能为人力资源部门专门配备商业统计软件。

于是本书做了一次大胆尝试,即以R语言为基础,将概率统计、机器学习、文本挖掘等大数据时代流行的数据分析技术,和人力资源管理实践结合在一起,看看有何化学反应。在此之前,鲜见人力资源管理专业人员涉足这个领域,在此之后,你会发现原来人力资源管理也可以运用大数据分析技术,也可以通过数据挖掘来发现数据价值,也能用机器学习的算法预测未来可能发生的事件,还能对文字内容进行数据分析,而这一切在R语言的驱动下变得容易实现。

本书的每个案例都以人力资源管理中的现实情景为基础,通过人物对话的方式来讲述。书中虚拟的谦多顺公司在人力资源管理方面出现了一些问题,比如员工需求数量不准确、员工薪酬满意度不高、学员对培训师的意见比较大、新员工离职率比较高、员工能力评价不够客观、离职沟通出现问题,等等。人力资源部经理Miss陈面对这些问题,采用数据分析的方法,帮助部门同事逐个解决问题。在这个过程中,你可以了解概率统计的基本知识、数据挖掘的经典算法,以及文本挖掘中的情感分析,并领略R语言的魅力。

本书由于涉及统计学领域的知识,还涉及R语言编程,对人力资源管理专业人员来说有一定难度。为此笔者对书中内容做了一些特别设计,比如必须讲的统计知识尽量详细并且图文并茂,所有案例都提供R源代码以方便练习,等等。如果潜心阅读,并辅以实践演练,相信会有莫大收获。

希望本书的出版,能够让越来越多的人力资源管理专业人士认识R语言,运用高级数据分析技术来有效解决企业中的管理问题,更好地发挥人力资源数据的价值。

为什么编写本书

人力资源管理源于数据分析。20世纪初古典管理学家弗雷德里克·温斯洛·泰勒通过实验研究如何提高工人的劳动生产率,并提出了迄今仍在使用的计件工资制、计时工资制,可算作人力资源数据分析的先驱。后来闵斯特伯格、梅奥两位学者将心理学方法引入工业领域,通过大量实验,研究如何提高工人效率,其核心依然是对数据的测量和分析。所以,人力资源管理从发展之初就与数据分析结下不解之缘。一百多年后的今天,世界进入了信息化、数据化时代,但我国人力资源管理却在数据分析领域原地踏步,在大数据门外驻足不前,仍然在汇总、平均、同比、环比,仍然在依赖Excel,几乎没有将数据挖掘等高级技术应用到管理实践中,去更充分地挖掘数据的价值。这不能不说是一种遗憾!

人力资源管理领域未及时享用数据分析技术发展带来的福利,像那些重要且经典的算法如判别分析、机器学习、聚类分析、因子分析、时间序列分析、文本挖掘等早已进入零售、金融、通信、电子商务以及社交媒体行业,并且表现出令人惊讶的作用,但始终把人力资源管理挡在门外。

然而,人力资源管理专业人员学习数据分析的意愿并不十分强烈。根据弗鲁姆的理论,人力资源管理专业人员研究数据分析的动机强弱,取决于数据分析能够为工作带来的价值大小、学习的难度大小,以及学习的工具和环境的适宜程度。可想而知,在看不到数据分析带来的价值,对数据分析知识心存畏难,且没有称手的分析工具时,人力资源管理专业人员又怎能迈入数据分析的世界呢?

所以,本书尝试将数据分析的高级技术引入人力资源管理领域,提升人力资源管理专业人员学习数据分析的动机水平。首先,用人力资源管理专业人员熟悉的情景编写案例,让大家了解数据分析技术在人力资源管理过程中的作用和价值;其次,穿插普及数据分析的基础知识和算法,重点介绍当前数据分析领域表现优异的统计工具——R语言,并附送源代码。希望能够唤起看到本书的人力资源管理同行对高级数据分析的兴趣。

当然,本书只是抛砖引玉。鉴于笔者视野狭窄,狭隘地认为我国人力资源管理领域并未真正涉足数据分析,并未有“大牛”出现,实际上这可能是错误的。不排除有“牛人”早已进行深入的研究,程度之深,应用范围之广,超出笔者的想象。若能发现同行在做同样的事情,希望能够交流、学习,共同促进和提升。

也希望通过本书能够进一步推广R语言。笔者用过不少统计软件,但从未有一款如R语言那样让笔者着迷,它几乎能满足笔者对数据分析的所有需求,分析过程简单快速,各种算法随手拈来,图形绘制变化万千。这么好的统计工具,还是免费的,实在没有理由拒绝,也希望更多的人能够知道这个工具,早早用上。

本书特点

(1)创新性强,内容为人力资源管理、数据分析和R语言的交叉知识领域。国内首次以R语言为工具,将数据挖掘、文本挖掘等数据分析技术引入人力资源管理领域。

(2)深入浅出、通俗易懂。全书以人力资源管理人员(简称HR)的视角为基础,采取人物对话方式,结合案例讲解数据分析技术在人力资源管理实践中的应用。

(3)对HR来说熟悉度高,代入感强,认同感强。书中案例均以人力资源管理中的常见情景为基础,涉及招聘、培训、薪酬、员工关系管理等模块,对HR来说接受程度高。

(4)阅读难度较低。全书避开讲解复杂的统计学概念、算法,避开讲解R语言的数据结构、语法等内容,重点介绍统计方法的应用案例及其效果,降低阅读难度。

(5)提供完整源代码和数据。源代码重复使用性高,可直接运行并显示效果,易于操练,方便解读,源代码经小量修改后即可用于各类企业。

本书人物关系图和公司设定

1.人物关系图

2.公司设定

公司名称:谦多顺集团股份有限公司

公司规模:下属20家子公司,员工3万余人

公司性质:民营企业

主营业务:房地产、软件开发、物业服务、通信产品生产与销售等业务。

本书内容

全书共分8章,各章内容如下。

第1章:人力资源数据分析的意义。介绍人力资源数据分析的特点、难点以及人力资源数据分析和大数据的关系。

第2章:数据分析前的准备工作。包括如何选用数据分析的工具,数据收集的工具和方法,以及如何整理数据。

第3章:员工年度需求预测。主要介绍了需求预测所采用的方法并分析整个过程。

第4章:培训师评估。介绍如何建立企业内部培训讲师授课评分数据库,在此基础上通过计算机标准分建立常模,绘制正态分布图,用定量化的方法选择讲师,并进行培训评估。

第5章:薪酬公平性分析。讲解如何运用薪资结构图、基尼系数、Compa指标、薪酬公平感计量模型来分析员工薪酬公平性。

第6章:员工综合能力评估。讲解通过综合评价法评估员工综合能力。

第7章:员工离职倾向分析。介绍了如何用Boosting、随机森林等机器学习算法预测员工未来一年内的离职概率。

第8章:员工辞职报告的情感分析。介绍用文本挖掘中的情感分析技术分析员工辞职报告。

关于作者

蔡治:西南师范大学心理学硕士、高级经济师、高级人力资源管理师、高级企业培训师、SPSS数据分析师,R语言爱好者,长期从事人力资源管理工作,现任某国有通信企业人力资源部经理。

哪些人会对本书有阅读兴趣

•人力资源管理工作中需要进行数据分析的人士。

•R语言爱好者,对R语言在各行业中的应用感兴趣的人士。

•经常阅读分析报告,关注各职能板块研究报告的各级管理人员。

•从事咨询、研究、分析等工作的专业人士。

•人力资源管理专业的本科生和研究生。

致谢

感谢广东省通信产业服务有限公司陈洪先生、钟永健先生、冯丽芳女士和张晓军女士,将数据分析的任务交给我,为我提供了在工作中研究和应用数据分析的机会,促成我去接触和学习R语言。感谢李延华、张宝、张静,我们经常在一起沟通、讨论,产生了不少想法。感谢夫人陈丽君女士的默默支持和鼓励,让我得以完成本书的写作。

尽管我对书稿校正多次,但仍然不可避免有疏漏和不足之处,请读者批评指正。我会在适当的时间进行修正,以满足大家的需要。

与作者联系

博客:http://blog.sina.com.cn/editcai

邮箱:cizimail@qq.com

作 者
2016年8月