全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
717 0
2020-11-04
从人力资源管理中获得真正的见解
数据科学是一门广泛的学科,尽管这个概念是最近才出现的,但每天都在发展。据伯克利信息学院称,数据科学生命周期有五个阶段,这一阶段并非彼此排斥。这五个阶段是数据捕获,数据维护,数据处理,数据分析和数据通信。后者是企业中最重要的活动。我们在这里提供数据可视化,数据报告,商业智能和决策制定。通常,在剩余阶段中花费的所有时间最终都将基于整个过程进行决策,因此我们可以不断改进。
在尝试解决数据科学问题时,可以使用许多技巧来解决它。例如,支持向量机(SVM),决策树,逻辑回归,神经网络等。最大的问题是它们几乎都是黑匣子,希望您可能知道算法在做什么,但是您的同事或随机的普通人可能不理解这些复杂模型背后的直觉。因此,作为数据科学家,您不仅应该从数据中提取价值,而且还应能够将结果转化为解决方案,然后进行交流。决策规则将帮助我们提取有关算法如何做出决策的明确结论。因此,我们稍后可以据此做出决策。
我们可以使用Python和一些著名的库来提取决策规则。我们将使用Kaggle竞赛提供的HR数据集。数据集的特征是满意度,上次评估,项目编号,平均每月小时数,公司花费的时间,工作事故,离职,最近五年的晋升,销售和薪水。“左”变量将是我们的目标。基本上,我们希望从算法中提取两件事,即目标变量的预测,在这种情况下,员工是否离职以及为什么离职。哪些功能会增加损耗的风险?这些功能将是数据集的其余部分,即我们将用于填充决策树的变量。基本上,根节点是我们的整个数据集,稍后将根据我们选择的策略(如基尼系数,卡方,熵或方差减少)进行拆分。数据集有10列和14
为了使树更易于解释,我们将树的最大深度设置为5,这样我们就可以从所有节点获得更具代表性的样本。分数仍然很不错,为0.97,我们可以更轻松地概括树提供的规则。像在所有方面一样,我们将在更高的精度和更易于解释的算法之间面临权衡。调用所有方法后,我们将获得一个点文件,然后可以使用文本处理器打开该文件。不用担心,它并不那么复杂。本质上,构建可视化决策树的步骤很多,您也可以使用python来完成。但是,仅使用Web即可可视化所有代码!您可以使用webgraphviz或任何其他工具。
您将自动获得决策树。如果要保证鲁棒性,则可能要考虑移动算法的参数。
做完了!我们将从树中提取规则。首先是一些概念:
熵:信息内容不可预测性的量度是我们从一个实例平均学习到多少信息。谈论熵时,我们正在寻找零。零表示节点中只有一个标签。
样本:每个节点中的观测值数量。
值:每个标签中观察值的数量。左边的一个是零值,右边的一个是数字1。在这种情况下,分别为in和left。
为了从树中提取决策规则,我们必须考虑末端的节点(末端节点),然后一直到根节点(向后),反之亦然(向前)。覆盖所有分支很重要。否则,我们的决定将不那么准确。要提取相关结论,我们必须用大量观测值来思考那些末端节点,无论它们是0还是1(在内部或在左侧)。最相关的包括1039、981、5261、631样本。
如果平均每月工作时间超过126小时,并且上次评估的结果在0.445至0.574之间,并且他或她的项目少于2个,并且满意度低于0.465,则他或她将倾向于离开项目。组织。
如果员工的满意度低于0.465,并且平均每月工作时间少于290小时,最后项目数在3到6之间,那么员工将继续留在组织中。
如果工人有3至5个项目,工作时间少于290小时,并且在组织中的工作时间少于4年,并且满意度超过0.465,那么他们将更倾向于留在公司中。
如果在组织中花费的时间在5到7之间,并且上一次评估得分超过0.8,平均每个月工作超过214个小时,并且满意度超过0.46,则他们很容易离开公司。
最后,绘制功能的重要性可能是一个好主意。这可以为我们提供一个有关工人最重视或至少最担心的东西的线索。您可以通过feature_importances_参数获取此信息。然后您只需要绘制它。
做出决定时,绝对满意的满意度非常重要,这也是公司的工作年限和最后一次评估,最后但并非最不重要的是,项目数量和每月工作时间也很重要。可以说,组织中的事故,晋升,薪水和职位无关紧要。
总之,这是从HR Kaggle竞赛中提取的决策规则。这意味着数据集是一个模拟,而不是现实世界中的数据库提取。拥有更多数据可能是有益的。拥有一个满意度指数是非常有帮助的,作为人力资源经理,如果您拥有一个非常相关的满意度指数,您可能不会完成所有这些过程,这完全取决于您的政策和管理理念。建立多学科团队非常重要,这样才能从各个角度分析您从此分析中获得的决策规则。该算法不是万能药,并且绝对不是您的最终决定,您必须根据分析提供的所有信息来设置策略。
请随时在人力资源管理环境中分享使用机器学习算法的经验,很高兴收到您的来信。
1
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群