- 大数据时代的人力资源管理
- 蔡治
- 2057字
- 2024-12-21 15:09:43
2.1 如何选择数据分析工具
2.1.1 常用的数据分析软件
老梁:经理,俗话说“工欲善其事,必先利其器”。我们人力资源管理人员该如何选择一款合适的数据分析软件呢?
Miss陈:数据分析的软件有很多,最常见的是我们熟悉的Excel,除此之外还有许多专业的统计软件,带数据统计模块的计算机编程语言,带数据分析函数的数据库,等等。这些工具在其相关领域或行业中的知名度都很高,被广泛地应用在科研、商业等环境,比较著名且常见的数据分析软件有R、SPSS、SAS、Matlab、Mathematica、Stata、Python、Eviews等,如图2-1所示。
图2-1 常见的数据分析软件
这些都是国内比较常见的数据分析软件。除了这些,其实还有很多数据分析软件,根据最新统计,数据分析软件有93款之多,涉及大数据、数据库、图表等方面,咱这里就不一一列举了。
老梁:您提到的这些软件,有些我听说过,比如SPSS、SAS,但很多都没听说过。经理,这些数据分析的软件有什么特点呢?
Miss陈:简单介绍一下刚刚提到的这些数据分析软件的特点吧。
(1)R:全称是R language,即R语言。这是一种计算机语言,是专门用于统计分析、绘图的语言和操作环境。R是一个免费、源代码开放的、跨平台的软件,是一个用于统计计算和统计制图的优秀工具。其功能包括数据存储和处理系统、数组运算(其向量、矩阵运算方面的功能尤其强大)、完整连贯的统计分析、优秀的统计制图功能、简便而强大的编程语言(可操纵数据的输入和输出),可实现分支、循环,用户可自定义功能。从某种角度来说,R语言的统计功能是所有统计软件中最强大的,因为除了传统的统计算法之外,目前最新的统计算法和研究技术都能在R语言中找到相关的函数包,几乎涵盖了人们在统计学领域的所有知识成果,而且算法更新速度极快,这点让商业领域的明星软件SAS和SPSS都望尘莫及。
(2)Excel:Microsoft Office System中的电子表格程序,是我们经常使用的办公软件之一,使用频率非常高。它可以完成表格输入、统计、分析等工作,可生成精美直观的表格、图表,是我们日常工作中处理各种表格的首选工具。随着Excel的升级,现在还可以使用它跟踪数据,生成数据分析模型,编写公式以对数据进行计算,以多种方式透视数据,并以各种具有专业外观的图表来显示数据。由于Excel也有统计模块,所以可以说Excel也是数据分析软件。
(3)SPSS:全称Statistical Product and Service Solutions,即“统计产品与服务解决方案”,IBM公司的统计软件,可用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务。IBM还有基于SPSS的衍生软件SPSS Modeler,专门用于数据挖掘领域,提供了不少主流的数据挖掘算法(包括文本分析、实体分析、决策管理与优化)。SPSS在生物、医疗、心理学等科研领域用得较多。
(4)SAS:全称Statistical Analysis System,即“统计分析系统”,是由美国NORTH CAROLINA州立大学于1966年开发的统计分析软件,总部位于美国北卡罗来纳州的凯瑞,是全球最大的私有软件公司。SAS系统在国际上已被誉为统计分析的标准软件,是全球商业智能和分析软件与服务领袖,全球50000多家企业都在通过SAS软件对数据进行深入挖掘,在各个领域得到广泛应用。另外,SAS可能是最贵的统计软件。
(5)Matlab:Matrix laboratory的缩写,是一款由美国The MathWorks公司出品的商业数学软件,是一种用于算法开发、数据可视化、数据分析,以及数值计算的高级技术计算语言和交互式环境。Matlab还可以用来创建用户界面及与调用其他语言(包括C、C++和Fortran)编写的程序。Matlab主要用于数值运算,但利用为数众多的附加工具箱(Toolbox)它也适合不同领域的应用,例如控制系统设计与分析、图像处理、信号处理与通信、金融建模和分析等。另外还有一个配套软件包Simulink,提供了一个可视化开发环境,常用于系统模拟、动态/嵌入式系统开发等方面。数学专业的同学们基本上都会学习这个软件。
(6)Mathematica:由美国科学家斯蒂芬·沃尔夫勒姆领导的沃尔夫勒姆研究公司(位于美国伊利诺伊州香槟市)开发的一款被广泛使用的计算软件。它拥有强大的数值计算和符号运算能力,是目前为止使用最广泛的数学软件之一。软件名字“Mathematica”还是由苹果创办人乔布斯向沃尔夫勒姆公司创立者提议命名的。Mathematica和Matlab都是数学领域的主流软件。
(7)Stata:数据分析、数据管理以及绘制专业图表的整合性统计软件。Stata的统计功能很强,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义的负二项回归,随机效应模型等。
(8)Python:一种面向对象、解释型的计算机程序设计语言,与C++、Pascal等计算机编程语言类似。它的主要特点是语法简洁而清晰、具有丰富和强大的类库、免费且开源、代码可移植性强,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。Python有专门的数据分析库,比如数据分析三件套Matplotlib、Nunpy、Scipy,可以进行科学运算、数据分析和统计绘图。
(9)Eviews:Econometrics Views的缩写,通常称为计量经济学软件包。软件本意是对社会经济关系与经济活动的数量规律,采用计量经济学方法与技术进行“观察”,也是专门从事数据分析、回归分析和预测的工具。使用Eviews可以迅速地从数据中寻找出统计关系,并用得到的关系去预测数据的未来值,其应用范围包括科学实验数据分析与评估、金融分析、宏观经济预测、仿真、销售预测和成本分析等。
2.1.2 选择数据分析工具的策略
老梁:经理,这么多数据分析软件让我眼花缭乱啊,好像个个都不错呢,该如何选择呢?
Miss陈:不同的使用者应该考虑不同的选择策略,根据实际需求来选择合适的数据分析工具。我们是人力资源管理从业人员,那么就先分析一下我们在数据分析方面的需求和特点吧。
(1)人力资源需要分析的数据量级不大,远未达到大数据量级。大数据是指数据的体量很大,达到或超过1TB规模的数据,显然人力资源的数据没有达到这个级别,只是小数据。
(2)人力资源需要分析的数据种类较多,涉及人力资源管理的各个模块。比如招聘、培训、绩效、薪酬等管理模块都会产生数据。由于我们全面启用了人力资源管理系统,这些数据多数都存储在数据库中,格式比较规范,并且容易收集。
(3)人力资源的数据统计方法相对比较基础和传统,一般用计数、汇总、百分比、平均数等方法,从不同维度进行统计,通过同比、环比、横向对比、对标等方式进行分析。
(4)人力资源管理的从业人员在数据分析方面所知所学不多,很多人在工作后才学习使用各种软件并接触数据分析。
老梁:经理,您说得对啊。
Miss陈:所以,作为人力资源管理从业人员在选择数据分析软件的时候,应该根据我们的需求特点,从功能性、易用性、经济性三个维度,去衡量如何选择合适的数据分析软件。
老梁:您是说应该选择功能强大、简单易学并且成本又不会太高的分析软件?
Miss陈:是的,其实就是选择性价比。在Excel、R、SPSS、SAS、Matlab、Mathematica、Stata、Python、Eviews等软件中选择的话,那么Excel在易用性方面比较突出,也有一定的统计分析功能,可以作为初、中级用户的选择;R在功能性、经济性方面比较突出,可以作为中、高级用户的选择,如图2-2所示。
老梁:经理,您前面提到Python也是免费的,从功能性、易用性、经济性三个维度来看也有优势,为什么不选它呢?
Miss陈:Python虽然简单、强大、标准、免费,但它是一门计算机编程语言,它能做的事情太多,而数据分析只是它众多功能模块中的一个小模块,不是其专长,我认为Python更适合计算机编程专业人士使用。相对而言,R虽然也是一门编程语言,但R是专门用于数据分析的语言,其所有的功能都为数据分析而设计。所谓术业有专攻,在数据分析领域,R语言更具优势,更适合我们去使用。
图2-2 不同级别用户数据分析工具的选择
2.1.3 关于Excel
老梁:经理,既然Excel在功能性和易用性上有优势,那么我们是不是用Excel进行数据分析就可以了啊?毕竟我们对Excel的熟悉程度高,上手容易,学习成本也较低。
Miss陈:很遗憾,Excel不能完全满足我们的分析需求。不过既然提到Excel,那么我们就谈一谈它,因为对绝大多数人力资源管理人员来说,Excel几乎是数据统计分析的唯一选择,日常工作中的数据分析基本都靠Excel来完成。
老梁:是啊,我们每天都在用Excel进行数据统计和报表制作。
Miss陈:所以Excel是我们最常使用的办公软件之一,使用频率非常高,甚至可以说是office办公软件中使用频率最高的软件。而且不仅是咱们人力资源部,公司的各个部门都会用到它,比如市场部做经营分析、财务部做财务分析等,都会使用Excel。
从功能上来讲,Excel可完成表格输入、统计、分析等工作,可生成精美直观的表格、图表,是我们日常工作中处理各式各样表格的优秀工具。并且随着Excel的升级,新的版本还可以跟踪数据,生成数据分析模型,编写公式以对数据进行计算,以多种方式透视数据,以各种具有专业外观的图表来显示数据,数据还可以存储到云中保存。
在数据分析方面,Excel提供了一套分析工具库和用于数据分析的VBA函数库,可以比较方便地进行一些高级的统计分析,比如常见的回归分析、t检验、F检验、方差分析、计算相关系数等,都可以在Excel的数据分析库中找到,如图2-3所示。但是Excel提供的这些数据功能相比专业的统计分析软件来说,具有种类不多、计算结果简单、图形粗糙等缺点,不过据说用Excel提供的VBA函数也能实现很多数据分析算法,但需要编写大量代码,会很耗时间。
图2-3 Excel中的数据分析工具
老梁:经理,虽然如此,但关键是别的软件咱也不会啊,Excel的功能如此强大,又容易上手,所以自然就想到Excel了。您说Excel还可以进行回归分析之类的统计分析,感觉很不错呢。
Miss陈:是的,Excel老少咸宜。打个比方,Excel就像一把菜刀,人人都可以用来切菜,但是不同的人有不同的用法,会产生不同的效果。普通的人仅仅用来切菜,厉害的人可以用菜刀杀猪宰羊,各样操作游刃有余。类似的,Excel用到高深之处,一切和数据相关的工作都可以胜任,甚至还可以用它来编写游戏。
老梁:看来我的Excel运用还处于初级阶段,只会用来进行简单的数据统计和做报表,从来没碰过数据分析工具、VBA这些东西,哈哈。
Miss陈:虽然Excel有许多优点,但也有不足的地方。
(1)Excel的高级数据分析功能比较简单。虽然Excel提供了分析工具库,但功能却比较简单。比如回归分析,若要进一步进行自变量多重共线性的检验,就做不了,也不能做逻辑回归分析。Excel提供的分析算法也不多,诸如分类、降维、非参数检验等算法都没有,更别说当前大数据时代流行的机器学习算法。虽然有Excel的VBA可以编写代码,但难度是非常大的。
(2)Excel的绘图功能还不够强。大家可能都对Excel默认的图表功能抱怨过,特别是2003年版及以前的版本,实在缺乏美感。虽然新版本的Excel图表好看了很多,还加入了应用商店,可以绘制一些流行的图形,但我认为Excel的绘图还是不够强大,绘制复杂图形时需要进行烦琐的设置,并且绘制多张复杂图表时操作显得更加烦琐。Excel的绘图功能跟它的统计功能类似,基本的功能都有,很容易就可以绘制基本图形,但是复杂图形就需要研究很久、设置很多参数。
(3)Excel是微软Office办公套件的一部分,价格不菲。虽然家庭版、学生版比较便宜,但很多功能都被阉割了。比如Power View功能在家庭版和学生版上就找不到,必须得用专业版,可是专业版的价格就很高。现在微软的收费方式又有变化,采取月费或年费的方式,每年都得花钱,算起来开支不小。单就软件收费而说无可厚非,但成本费用一定是影响我们选择软件的重要因素。
老梁:是啊,咱们公司当年买Office办公软件可花了不少钱,不过随着时间推移,以前的版本都过时了,还没升级呢。看别人新版本的Excel界面很酷,功能很多,可惜咱们没得用啊。如果要用得花不少钱呢,大家都在等着公司升级Office版本,可是不知道啥时候才会升级到新版本。
Miss陈:呵呵,公司如果升级Office,那将会是一笔不菲的开支。现在版本的Office还能用,而且也不影响公司正常的经营生产,升级的必要性不大,所以公司多半会继续使用现在的版本。
2.1.4 关于R语言
1.R语言的江湖地位
老梁:经理,俗话说,天下没有免费的午餐,像R语言这样免费的数据分析软件会不会有缺陷,如功能不全、性能不强,又或者有某些功能要收费呢?
Miss陈:人们对免费的东西持有怀疑态度是一种常见的思维定式,就像超市里面免费品尝的东西实际上是在引诱你买货架上的产品,培训机构请你免费听课无非是进行广告宣传吸引你去参加收费的培训,旅游公司的免费旅游实际上会让你在购物点度过大部分时间。
但是在互联网领域、科学界,分享是一种价值观。在这种价值观的引导下诞生了一些高质量的免费软件,R语言就是其中的佼佼者。R语言是上帝给我们的珍贵礼物,你可以用R语言做一切数据统计分析方面的事情,尽情享用几百年来人类在数据统计方面的研究成果,各种算法应有尽有。最新的统计方法发表出来后通常会在R语言中率先实现应用,这让其他所有统计软件黯然失色。R语言在数据分析、数据挖掘领域的功能之强大,胜过前面提到的任何一款统计软件,并且使用这一软件不需要花一分钱。
国外著名的数据分析和挖掘社区KDnuggets每年都会做一次关于数据分析、大数据、数据挖掘、数据科学使用软件工具的调查,根据2015年的调查结果,R语言在参与评选的93款相关软件中排名第一,使用率达到了46.9%,江湖老大的地位俨然确立。排名前10的数据分析软件如图2-4所示。
图2-4 排名前10的数据分析软件(KDnuggets,2015)
老梁:真没想到,一个名称看上去如此简单、普通的软件,在数据分析领域的地位竟如此之高。
Miss陈:其实R语言诞生得很早,之前一直在科研、专业领域传播和应用,随着大数据的流行才真正进入大众的视线。
2.R语言的前世今生
老梁:经理,我很好奇R语言的来历。
Miss陈:那给你讲讲R语言的故事吧。
R语言源于S语言,S语言也是一种用于统计分析的计算机语言。S语言非常厉害,1998年美国计算机协会(ACM)给S语言的设计者发了一个奖:软件系统奖,用来表彰S语言取得的成就。这个奖很牛,因为得奖的都是系统级别的软件,比如Unix、TeX、TCP/IP、Word-Wide-Web、Java等,个个大有来头。在所有获得软件系统奖的软件中,S语言是唯一一个统计软件,可见其厉害之处。不过S语言是商业软件,跟SPSS、SAS一样,需要花钱购买。
1993年,新西兰奥克兰大学的两位统计学家,一位叫Ross Ihaka,另一位叫Robert Gentleman。他们两位志趣相投、心意相通,利用业余时间对S语言进行了改进,创造出了一种新的统计语言。由于两位统计学家的名字都是以R开头,这个新的统计语言也就顺理成章被命名为R。
当年这两位大牛将刚诞生不久的R语言放到了卡耐基·梅隆大学的计算机服务器上,供大家下载研究。这时用R语言的人极少,但也有不少人进行了下载研究,其中来自苏黎世理工学院的一位学者在用了R语言之后,大力劝说两位作者公开源代码,让R语言成为自由软件。两年后,即1995年,两位教授本着分享、协作的精神,将R语言源代码正式发布到自由软件协会的FTP服务器上,自此R语言正式以自由软件的身份面向全世界。
随后的20年,R语言充分体现了互联网时代国际化协作发展的特点:诞生于新西兰,邮件列表维护在瑞士,服务器架设在奥地利,Windows版本主程序维护在加拿大,附加包维护在德国,Mac OS版本维护在美国,全球近20个国家有镜像网站。核心开发团队有20人,成员来自世界各地的大学,如牛津大学、加拿大西安大略大学等,也有来自企业的成员,比如AT&T实验室的Simon Urbanek等。
就是这样一种组织、维护形式松散的计算机语言,依靠着志愿者坚持不懈的贡献,在不断发展和升级。现在世界各地大量的优秀统计学家、各个领域的统计学爱好者、计算机程序员都在为R语言贡献自己的力量,将大量统计方法以附加包(package)的形式发布出来,使其他不擅长编程的用户能以最快的速度用上最新的统计方法。
2012年,R语言可以下载的package达到3200个,用了17年;2015年,R语言可以下载的package翻倍达到6800个,仅用了3年。那些封闭源代码的商业统计软件很难有这样的发展速度,只能望尘莫及。R语言像滚雪球一样,依靠开源、分享、协作的方式,从开始不温不火,蓄积能量,到后来逐渐显示出威力,再到大数据时代彻底爆发,成就了R语言的今天。
老梁:大开眼界了,没想到还有这样的软件,它就是由跨国界、跨种族的精英共同创造的智慧结晶啊,不仅免费,还集全世界各领域数据分析家的努力和智慧于一身,真是一个伟大的软件。听了R语言的故事,我已经被R语言深深吸引了,等下我就去下载R语言,马上安装,马上学习。
3.R语言是算法聚宝盆
老梁:对了,经理,R语言中的package都是用来做什么的?
Miss陈:这些package是函数包,是为了解决某个问题或为实现某种统计算法而编写的函数集。在package中蕴藏着大量的统计算法,就像是一个聚宝盆,包含我们能想到的和不能想到的、学过的和没学过的、古老的和现代的、简单的和复杂的算法,应有尽有,可以称其为算法聚宝盆。其中部分算法如图2-5所示。
图2-5 R语言中的统计算法
老梁:经理,您说的算法是指什么呢?
Miss陈:算法可以简单理解为解决问题的计算方法。例如,我们每个月要给员工发工资,按照《中华人民共和国个人所得税法》,要计算每个员工的个人所得税,而个人所得税实行累进税率,其计算公式如下:
应纳个人所得税税额=应纳税所得额×适用税率-速算扣除数
上面的公式就是一个算法。如果编个函数,把这个公式用计算机语言来表示,再输入本月工资数额,计算出个人所得税,那么这个公式就可称为一个计算机算法。
老梁:哦,R语言中的package就是这些算法的集合吗?
Miss陈:是的。R语言中的package包罗万象,包含了各种各样的算法,涉及数据分析的各个领域,比如生物、经济、金融、心理学、医学、人工智能,等等。
老梁:涉及的范围真广啊!
Miss陈:现在流行的大数据分析,其背后也是各种统计分析算法在支撑,而不仅仅是简单的一些数据统计。比如你在浏览淘宝网页的时候,有没有注意网页的广告、推荐的商品,都符合你本人的购买倾向和喜好呢?
老梁:哎呀,是的,我正奇怪呢。最近上淘宝,看到有个页面叫“发现好货”,里面推荐的商品都是我最近浏览过的,或者是和我浏览过的商品相关的商品,更有我没有浏览过但觉得还不错的商品。所以打开这个页面后不由自主就看了好久,一不小心就买了不少东西。
Miss陈:这是由于淘宝的大数据分析做得很好,后台有算法在分析用户的购买倾向。比如可以根据用户的注册资料,将用户的购买行为进行分类,用分类算法建立预测模型。当你注册淘宝用户时,会填写个人资料,这些资料包括你的性别、所在地、年龄、职业、学历等,对吧?你填写的资料越详细,淘宝对你的分析就越精准。淘宝可以分析这些资料,根据你购买商品的行为建立预测模型,就能预测你的购买倾向,计算出你购买不同种类商品的概率是多少。当你再次浏览淘宝网页的时候,就会有针对性地向你推送你可能购买的商品,自然就能最大限度地激发你的购买欲望,购物成功率就会提高很多。
老梁:哎呀,原来是这样,看来以后资料不能填得太详细,否则自己的想法都被别人知道了。
Miss陈:银行对用户申请信用卡、贷款、股票账户开户的风险评估基本也是用这类算法来实现的。这类算法有不少呢,在R语言中都能找到对应的package,使用相当方便。很多商业软件才有的算法,比如神经网络、贝叶斯分类、决策树、随机森林、结构方程模型等,在R语言中都可信手拈来。
老梁:经理,R语言中有没有咱们人力资源管理领域的package呢?
Miss陈:人力资源属于管理领域,很少进行数据分析方面的研究,对算法的依赖性也不强,所以没有专门对应的package。但是现今的人力资源管理领域亟须提升数据分析水平,以应对当前大数据技术发展的趋势,从而提高人力资源管理水平。为此,我们应该积极挖掘人力资源数据价值,尝试将数据分析的方法引入工作实践中,创新我们的管理方法,解决管理中出现的问题。实际工作中,我们可以根据具体问题具体分析,明确数据分析方面的解决方案,然后再去寻找对应的算法。
老梁:明白了,我们做人力资源管理的对这些算法知之甚少,看来以后得加强学习啊。
4.R语言是绘图专家
老梁:您刚才提到R语言可以绘图,这方面R语言有什么特别之处吗?
Miss陈:R语言的绘图功能很强大。本来绘图只是R语言附带的功能,但得益于R语言的开放性,许多人又给R语言开发了专门的绘图包,使得R语言的绘图功能变得异常强大,几乎不输于任何商业数据绘图软件。图2-6列出了部分利用R语言绘制的数据图,你可以看看。
图2-6 R语言绘图功能展示
老梁:哇,这些图形看得我眼花缭乱,都是用R语言绘制的吗?
Miss陈:是的,上面列出的图形只是R语言绘图功能的冰山一角,你可以上网搜索一下,能看到更多的R语言绘制的数据图形。其实R语言本身的绘图功能已经不弱,再加上许多人开发了功能更加强大的绘图包,提供给R语言用户使用,所以R语言的绘图功能变得强大。其中比较重要的绘图包有ggplot2、lattice等。ggplot2包更是将R语言的绘图功能发扬光大,它将简单的图形语法融入R语言,使R语言能够绘制出各种惊艳、漂亮的统计图形,极大地扩大了R语言在图形领域的影响力。
5.人力资源管理人员使用R语言的技能需求
老梁:经理,我觉得R语言的功能太强大了,package浩瀚如海,作为人力资源管理人员,应该掌握R语言的哪些知识和技能呢?
Miss陈:根据人力资源管理人员的特点,建议按照以下顺序学习R语言相关基础知识。
(1)语法。其实R语言的语法很简单,多数时候几个函数就可以解决问题,并且这些函数用起来和Excel中的函数很相似。像循环控制、条件语句等都很少用到,除非要编写函数,但通常不需要这么做。R语言不需要很长的代码,一个函数加几个参数就能制作一个复杂的统计模型,是比较典型的函数式语言。
(2)数据类型和数据读取方法。R语言中的数据类型有几种,最常用的是数据框(dataframe),很多统计分析都是基于数据框来进行的。数据框的数据结构和数据库中的数据表类似,第一行是字段名,从第二行开始是记录,每个字段(每列)可以是不同类型的数据。然后,还需要掌握数据读取的方法,比如怎样从Excel中读取数据到R语言中。
(3)绘图。R语言绘图功能相当强大,一个plot函数就可以变化万千,绘制很多种图形。但强烈建议学习ggplot2绘图包,这种语法简单的绘图方式,一旦接触使用就会被吸引,使你再也不想离开R语言。
掌握上述三方面的知识,就具备了用R语言进行数据分析的基础能力。这些内容在许多介绍R语言的书中都可以学到。具备这些基础后,根据实际工作需要,结合具体问题寻找对应的算法包,就能够进行数据建模、数据分析等操作了。
比如,在实际工作中,我们发现大学生入职后一年内的离职现象比较突出,给公司造成了不良的影响,增加了员工招聘的成本,于是想到能否在招聘前就预测出大学生在入职一年内的离职概率,从而提高招聘的质量。带着这个问题,我们就可以去寻找相应的分析算法,结果发现逻辑回归、决策树、Boosting、随机森林、神经网络等算法都可以实现这个目的。于是我们可以选择其中一种算法,下载对应的package,学习其使用方法,研究其函数如何使用、对数据的要求、结果的解释,然后导入数据就可以进行分析和预测了。
老梁:那么是不是还要学习统计学方面的知识呢?
Miss陈:当然,不过这方面知识的学习曲线会很长,涉及数学、概率等内容,对人力资源管理人员来说有不小的难度。比如,专门讲解贝叶斯分类的书就有好几本书,作为人力资源管理人员,学习这些算法原理几乎不可能,因为我们没有时间、精力和基础。合适的做法是,阅读一些统计学方面的科普书籍,了解常见算法的作用、适用条件、数据要求、结果解释等内容,也就是了解算法的基本原理、数据输入和结果输出。我们可以把统计算法当成一个黑匣子,就像我们看电视,仅需知道如何使用遥控器开关电视,如何选择频道即可,不需要去知道电视机内部的结构和实现原理。
老梁:这么说来我就松了口气,看来要学习R语言也不像想象中那样困难,掌握基础的内容后,有选择性地学习package的用法,就可以在实际工作中使用了。
Miss陈:是的。对人力资源管理人员来说,诸如Excel、Word这样所见即所得的工具用惯了,要编写代码的确有障碍,其中最大的恐怕是心理障碍。不过,一旦克服了心理障碍,迈过这道坎,就会有令人振奋的收获,会发现新的世界。