全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111483940.7 (22)申请日 2021.12.07 (71)申请人 中信银行股份有限公司 地址 100020 北京市朝阳区光 华路10号院1 号楼6-30层、 32-42层 (72)发明人 张悦 王晓旭  (74)专利代理 机构 北京市兰台律师事务所 11354 代理人 操飞越 张峰 (51)Int.Cl. G06Q 10/04(2012.01) G06F 16/215(2019.01) G06Q 10/06(2012.01) G06Q 10/10(2012.01) G06Q 40/02(2012.01) (54)发明名称 一种银行行业离职预测方法、 装置、 设备及 可读存储介质 (57)摘要 本发明提供了一种银行行业离职预测方法、 装置、 设备及可读存储介质, 涉及离职预测技术 领域, 本发 明通过采用决策树模 型和朴素贝叶斯 模型结合, 利用决策树模型的数据准备过程较为 简单对数据的表达形式不敏感, 并且能处理数值 型或分类型数据, 其能弥补朴素贝叶斯模型中对 数据的敏感的问题; 同时朴素贝叶斯模型对缺失 数据较为不敏感, 算法实施较简单, 并且基于概 率理论有很好的稳健性, 能弥补决策树模型早训 练数据集中会存在噪声影 响, 会造成过度拟合使 预测精度下降的问题。 综上所述本方法通过基于 双算法的离职预测数学模型进行离职预测, 可以 有效减少有用信息的流失, 且模 型平均估计方法 较模型选 择方法相对更加稳健, 从而提升离职率 预测的准确度。 权利要求书4页 说明书15页 附图3页 CN 114254815 A 2022.03.29 CN 114254815 A 1.一种银 行行业离职预测方法, 其特 征在于, 包括: 获取原始数据, 所述原始数据包括已离职员工数据和未离职员工数据, 所述已离职员 工数据集和所述未离职员工数据集均包括每个员工所对应的年龄、 平均月工作时长、 绩效、 薪资水平和所在岗位信息; 获取预测数据, 所述预测数据包括预设数量的待预测员工的信息; 建立基于双算法的离职预测数学模型, 利用所述原始数据训练所述离职预测数学模型 得到训练后的所述离职预测数 学模型; 将所述预测数据作为训练后的所述离职预测数学模型的输入信 息, 求解所述离职预测 数学模型得到离职预测信息 。 2.根据权利要求1所述的银行行业离职预测方法, 其特征在于, 所述建立基于双算法的 离职预测数 学模型, 之前包括: 基于所述原始数据建立数据增加模型, 求解所述数据增加模型得到数据增加后的所述 原始数据。 3.根据权利要求2所述的银行行业离职预测方法, 其特征在于, 所述基于所述原始数据 建立数据增 加模型, 求 解所述数据增 加模型得到数据增 加后的所述原 始数据, 包括: 基于所述原始信息, 统计已离职员工数据的数据总量, 并记已离职员工数据的数据总 量为离职总量; 基于所述原始信息, 统计未离职员工数据的数据总量, 并记未离职员工数据的数据总 量为在职总量; 若离职总量小于第 一预设值, 则 基于所述已离职员工数据和所述第 一预设值建立数据 增加模型, 求 解所述数据增 加模型得到数据增 加后的所述已离职员工数据; 若在职总量小于第 二预设值, 则 基于所述未离职员工数据和所述第 二预设值建立数据 增加模型, 求 解所述数据增 加模型得到数据增 加后的所述未离职员工数据。 4.根据权利要求3所述的银行行业离职预测方法, 其特征在于, 所述若离职总量小于第 一预设值, 则基于所述已离职员工数据和所述第一预设值建立数据增加模型, 求解所述数 据增加模型得到数据增 加后的所述已离职员工数据, 包括: 根据第一预设值和离职总量计算得到数据差值; 循环体: 随机从所述已离职员工数据中抽取数据差值数量的已离职员工数据, 并记为 附加数据集, 并统计所述附加数据集和所述已离职员工数据中重复值, 所述重复值为重复 次数超过第三预设值的数据数量; 若所述重复值大于零, 则重复执 行循环体直到 重复值等于零; 将所述附加数据集添加到所述已离职员工数据集中。 5.根据权利要求1所述的银行行业离职预测方法, 其特征在于, 所述建立基于双算法的 离职预测数学模型, 利用所述原始数据训练所述离职预测数学模型得到训练后的所述离职 预测数学模型, 包括: 基于所述原始数据建立数据平衡模型, 求解所述数据平衡模型得到训练集和测试集, 所述训练集和所述测试集中所含的已离职员工数据数量和未离职员工数据数量比例 相同; 建立决策树模型; 建立朴素贝叶斯模型;权 利 要 求 书 1/4 页 2 CN 114254815 A 2利用所述训练集分别训练所述决策树模型和所述朴素贝叶斯模型得到训练后的所述 决策树模型和所述朴素贝叶斯模型; 根据训练后的所述决策树模型、 训练后的所述朴素贝叶斯模型和所述测试集建立模型 平均数学模型; 根据所述测试集、 模型平均数学模型、 训练后的所述决策树模型和所述朴素贝叶斯模 型建立融合预测模型, 所述融合预测模型的输入信息包括所述决策树模型的第一预测结 果、 所述朴素贝叶斯模型 的第二预测结果和所述模型平均数学模型 的第三预测结果, 所述 融合预测模型的输出信息为离职预测信息 。 6.根据权利要求5所述的银行行业离职预测方法, 其特征在于, 所述根据训练后的所述 决策树模型、 训练后的所述朴素贝叶斯模型和所述测试集建立模型平均数 学模型, 包括: 将所述测试集作为训练后的所述决策树模型的输入信 息, 求解所述决策树模型得到第 一预测结果; 将所述测试集作为训练后的所述朴素贝叶斯模型的输入信 息, 求解所述朴素贝叶斯模 型得到第二预测结果; 根据所述第一预测结果和 测试集, 计算得到第一 误差率; 根据所述第二预测结果和 测试集, 计算得到第二 误差率; 根据所述第一 误差率和第二 误差率计算得到第一权 重和第二权 重; 根据所述第 一权重和所述第 二权重建立融合数学模型, 所述融合数学模型的输入信 息 为所述决策树模型的预测结果和所述朴素贝叶斯模型的预测结果, 所述融合数学模型的输 出信息为第三预测结果。 7.一种银 行行业离职预测装置, 其特 征在于, 包括: 第一获取单元, 用于获取原始数据, 所述原始数据包括已离职员工数据和未离职员工 数据, 所述已离职员工数据集和所述未离职员工数据集均包括每个员工所对应的年龄、 平 均月工作时长、 绩效、 薪资水平和所在岗位信息; 第二获取 单元, 用于获取 预测数据, 所述预测数据包括预设数量的待预测员工的信息; 双模型建立单元, 用于建立基于双算法的离职预测数学模型, 利用所述原始数据训练 所述离职预测数 学模型得到训练后的所述离职预测数 学模型; 离职预测单元, 用于将所述预测数据作为训练后的所述离职预测数学模型的输入信 息, 求解所述离职预测数 学模型得到离职预测信息 。 8.根据权利要求7所述的银行行业离职预测装置, 其特征在于, 所述银行行业离职预测 装置还包括: 数据增加单元, 用于基于所述原始数据建立数据增加模型, 求解所述数据增加模型得 到数据增 加后的所述原 始数据。 9.根据权利要求8所述的银行行业离职预测装置, 其特征在于, 所述数据增加单元包 括: 离职人数统计单元, 用于基于所述原始信 息, 统计已离职员工数据的数据总量, 并记已 离职员工数据的数据总量 为离职总量; 在职人数统计单元, 用于基于所述原始信 息, 统计未离职员工数据的数据总量, 并记未 离职员工数据的数据总量 为在职总量;权 利 要 求 书 2/4 页 3 CN 114254815 A 3

.PDF文档 专利 一种银行行业离职预测方法、装置、设备及可读存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种银行行业离职预测方法、装置、设备及可读存储介质 第 1 页 专利 一种银行行业离职预测方法、装置、设备及可读存储介质 第 2 页 专利 一种银行行业离职预测方法、装置、设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 23:43:09上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。