当前位置: 首页 > news >正文

快速分析变量间关系(Boruta+SHAP+RCS)的 APP(streamlit)

快速分析变量间关系(Boruta+SHAP+RCS)的 APP(streamlit)

以下情况下,你需要这个快速分析的APP:

  1. 正式分析之前的预分析,有助于确定分析的方向和重点变量;
  2. 收集变量过程中,监测收集的变量是否合适。偶尔会遇到数据集中没有特征变量和结局变量相关,这如果发生在数据收集结束的阶段,将是灾难性的,所以我们需要不断的监测数据的收集。

下面介绍一个自动化程度较高的,有一定的准确度,且快速的数据探索APP。之前介绍过R语言版本,但是因为算力要求较多,没有部署到网络,所以撰写了目前的streamlit版本。
第一步,变量筛选模块,采用了Boruta算法的改进版leshy算法(arfs包),其中的参数‘important=‘naive’’,还可以选择‘shap’(因为运算慢,舍弃了),给大家推荐这个包。这个模块有回归和二分类两个模型,还各自内置了一个数据集,进行展示。
在这里插入图片描述
第二步,SHAP分析,这里主要展示全局解释的结果,包括汇总图和单变量的散点图,而局部解释的结果,如瀑布图,不符合这个APP的目的,暂时没有涉及。交互作用的部分(待添加)。
在这里插入图片描述
第三步,限制性立方样条曲线拟合,对某特征变量SHAP值变化的趋势进行拟合并确定关键的点对应的特征值,比如二分类模型,SHAP值为0时对应的特征值是两种结局概率相等的点,低于或者高于这个点的值都意味着倾向于发生某种结局。还设计了可以调整的曲线拟合参数的n_knots和degree,以及两条纵向的虚线来指示特定的点。
在这里插入图片描述

APP地址

https://focus-analysis.streamlit.app/

代码地址

https://github.com/liuyp2080/fast_analysis

心得体会

Web APP, 代码复杂程度较低,特别适合数据分析为主,编程代码为辅的人群,包括作为临床预测模型构建好之后进入临床应用的媒介。R语言的shinyAPP的瓶颈在于部署,需要算力较多的就需要花钱进行部署,在这一点上,streamlit可能是因为结合GPU,所以是更好的选择,所以深度学习模型,首选的是也是streamlit(机器学习和统计分析,可以尝试shinyAPP)。建立了一个web APP讨论的群组,欢迎大家加入,同时接受APP制作的委托,欢迎大家咨询!
在这里插入图片描述

http://www.lryc.cn/news/353226.html

相关文章:

  • 解决docker中container运行闪退终止的问题
  • Redis 性能管理
  • 节水“云”科普丨北京昌平VR节水云展馆精彩上线
  • linux的系统调用open, read函数(文件编程)使用demo
  • C语言基础——循环(2)+关机程序
  • cnVcXsrv 21.1.13.1—VcXsrv 21.1.13中文版本简单说明~~
  • 心链2---前端开发(整合路由,搜索页面,用户信息页开发)
  • wordpress主题模板兔Modown 9.1开心版附送erphpdown v17.1插件
  • openai api的初次尝试
  • Distributed Transactions Mit 6.824
  • Redis可视化工具:Another Redis Desktop Manager下载安装使用
  • Parquet文件格式详解(含行、列式存储区别)
  • 一文了解https为什么是安全的
  • [‘column‘]和[:,‘column‘]的区别
  • icloud如何高效利用
  • k8s二进制安装与部署
  • 驱动编译报error: negative width in bit-field ‘<anonymous>’错误
  • Go语言的命名规范是怎样的?
  • Vue3骨架屏(Skeleton)
  • 【文末附gpt升级方案】亚马逊与Hugging Face合作:定制芯片低成本运行AI模型的创新探索
  • 二叉树的链式实现
  • STM32中断编程入门
  • 《我的阿勒泰》读后感
  • Android.mk简单介绍、规则与基本格式
  • 【MySQL精通之路】InnoDB(3)-MVCC多版本管理
  • uniapp 对接 微信App/支付宝App 支付
  • cmake配置opencv与boost库
  • 【Kotlin 一】Kotlin入门知识简介、变量声明、数字类型
  • Java 微信小程序登录(openId方式)
  • 为何程序员35岁就开始被嫌弃了?程序员该如何避免中年危机?