全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
968 0
2024-10-20

一、基本信息

软件名称:R

版本:4.3.2

涉及包:openxlsx/fastshap/shapviz/ranger/ggplot2

数据来源:示例数据

方法简介:随机森林算法在分类问题上通过集成多个决策树,不仅提高了模型的准确性和稳定性,而且还能够处理复杂的数据集,同时提供关于特征重要性的有用信息。

二、方法介绍

       哈喽,集美们AND集帅们!!!!很久没写技术性推文了。一方面由于正式工作了吧,不再活力满满了;另一方面由于“懒病”犯了。其实吧,我觉得吧我看着很懒,实际一点也不勤快!!。此处容许我仰天长“笑”几分钟。 好了话不多说,直接进入今天的正题。为什么突然写这个推文了?因为我的一个临床集帅朋友让我帮忙写个计算器(此处重点要考)。为什么要做随机森林计算器?下面看个审稿人的灵魂拷问:AUC值很高,灵敏度、特异度都很高,模型性能很不错,所以你为啥不去应用呢??此时此刻,Author必定慌的一批。没事拯救“世界”的张来了,下面我将带着屏幕面前可爱的你,用随机森林做个病人疾病预测计算器(希望你的计算器可以造福更多的人类)。

       思路:大致思路是这样的,首先我们在R环境训练好模型(当然这里忽略了随机森林的最优参数调整,默认你导出的模型是最优模型),然后将导出的模型加载到Shiny环境中去,利用Shiny搭建前端及后端简要代码。(不出意外此时你应该是懵逼状态,你摸着良心问自己是不是)。

三、操作代码

本在线计算器功能:患病概率计算+特征Shap值展示

1.本次演示的数据为一组临床病人数据(总共四个变量,研究目的通过3个变量预测患不患病,其中平均SBP、DBPCV为连续变量、动脉瘤位置为分类变量)

复制代码

2.下面将进行随机森林模型构建,以及Shap可视化

复制代码

78e98a2d-adb0-46d5-8311-7815210c2d17.jpg

6bdcdf14-4f17-479f-a8dd-74f0d8e2dd82.jpg


附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群