基于数据挖掘预测在线游戏用户流失情况
数据挖掘适用于解决在线游戏面临的一个重要问题:在游戏开始头几分钟或几小时内出现大量用户流失的情况。7天处于非活跃状态的玩家被定义为流失用户,持续登陆网游的用户被定义为满意用户。休闲玩家的注意力很有限,可能今天离开游戏,明天甚至就想不起来自己曾安装并玩过这款游戏,是极易流失的用户,但需要区分休闲玩家和有事暂时无法登录游戏的玩家;最好的办法就是在新玩家登录游戏当天就预测他们离开的概率。本文以韩国网游《永恒之塔》为研究案例进行数据挖掘,研究促使用户离开的游戏内部因素,并尝试预测他们离开的概率以便采取措施让他们返回游戏。其研究结果也适用于多种网络服务和游戏类型。
这款游戏是一款纯订阅游戏,并采用7天免费试玩至20级的模式,但多数流失用户还不到付费阶段就已经离开游戏。公认的重要考虑因素有界面的易用性和简洁性,免费试玩模式的有效性,难度曲线,以及新手教程质量等方面。
通过数据挖掘算法朴素贝叶斯分类器、决策树、神经网络,最终确定的关键因素有:当前等级、之前等级及整体游戏时间,每分钟杀敌数(包括当前/之前/整体等级情况),每分钟完任任务(同上),平均每天游戏时长,玩游戏天数,缺勤率(游戏邦注:这里指玩家在七天免费试玩期间缺席的天数)。这些参数极大提升了召回率(因此降低了误报率),决策树最终开始尽情扩散出分枝。我们也看到不同数据挖掘算法针对所有等级的一致性,这表明预测过程已经趋于稳定,降低了随机性。朴素贝叶斯分类器在准确性上比决策树和神经网络算法相差10%。