当前位置: 首页 > news >正文

kaggle-ISIC 2024 - 使用 3D-TBP 检测皮肤癌-学习笔记

问题描述:
通过从 3D 全身照片 (TBP) 中裁剪出单个病变来识别经组织学确诊的皮肤癌病例
数据集描述:
图像+临床文本信息
评价指标:
pAUC,用于保证敏感性高于指定阈值下的AUC

主流方法分析(文本)
基于CatBoost、LGBM 和 XGBoost三者的组合,为每个算法创建了 XX个变体,总共XX个模型,进行集成学习。
CatBoost在传统梯度提升决策树(GBDT)基础上,引入了一系列关键技术创新,以提升处理类别型特征和缺失值的能力,以及整体模型性能,排序学习、目标导向的编码和缺失值处理。
LightGBM基于XGBoost基础上改进,基于Histogram(直方图)的决策树算法,单边梯度采样,互斥特征捆绑等
XGBoost,是基于预排序方法的决策树算法。这种构建决策树的算法基本思想是:首先,对所有特征都按照特征的数值进行预排序。其次,在遍历分割点的时候寻找一个特征上的最好分割点。最后,在找到一个特征的最好分割点后,将数据分裂成左右子节点。
参考超参数

lgbm_params = {'objective':        'binary','verbosity':        -1,'n_estimators':     300,'early_stopping_rounds': 50,'metric': 'custom','boosting_type':    'gbdt','lambda_l1':        0.08758718919397321, 'lambda_l2':        0.0039689175176025465, 'learning_rate':    0.03231007103195577, 'max_depth':        4, 'num_leaves':       128, 'colsample_bytree': 0.8329551585827726, 'colsample_bynode': 0.4025961355653304, 'bagging_fraction': 0.7738954452473223, 'bagging_freq':     4, 'min_data_in_leaf': 85, 'scale_pos_weight': 2.7984184778875543,"device": "gpu"
}
cb_params = {'loss_function':     'Logloss','iterations':        300,'early_stopping_rounds': 50,'verbose':           False,'max_depth':         7, 'learning_rate':     0.06936242010150652, 'scale_pos_weight':  2.6149345838209532, 'l2_leaf_reg':       6.216113851699493,'min_data_in_leaf':  24,'cat_features':      cat_cols,"task_type": "CPU",
}
xgb_params = {'enable_categorical':       True,'tree_method':              'hist','disable_default_eval_metric': 1,'n_estimators':             300,'early_stopping_rounds':    50,'learning_rate':            0.08501257473292347, 'lambda':                   8.879624125465703, 'alpha':                    0.6779926606782505, 'max_depth':                6, 'subsample':                0.6012681388711075, 'colsample_bytree':         0.8437772277074493, 'colsample_bylevel':        0.5476090898823716, 'colsample_bynode':         0.9928601203635129, 'scale_pos_weight':         3.29440313334688,"device":                   "cuda",
}

主流方法分析(图像),深度学习算法提取特征,将图像特征与文本特征一并送入提升树模型

  1. EVA02-small (eva02_small_patch14_336.mim_in22k_ft_in1k) 和EdgeNeXt (edgenext_base.in21k_ft_in1k)
  2. eva02_small,deit3_small,beitv2_base,convnextv2_tiny,swinv2_small, resnext50, convnextv2_nano
  3. swin_tiny,convnextv2_base,convnextv2_large,coatnet_rmlp_1
http://www.lryc.cn/news/527580.html

相关文章:

  • 滤波电路汇总
  • 1.Template Method 模式
  • MySQL分表自动化创建的实现方案(存储过程、事件调度器)
  • 基于回归分析法的光伏发电系统最大功率计算simulink建模与仿真
  • 计算机毕业设计【任务书】怎么写?
  • GRAPHARG——学习
  • 【Rust自学】15.6. RefCell与内部可变性:“摆脱”安全性限制
  • 14.模型,纹理,着色器
  • 【C语言分支与循环结构详解】
  • 新项目上传gitlab
  • qt-QtQuick笔记之常见项目类简要介绍
  • Continuous Batching 连续批处理
  • 海外问卷调查渠道查如何设置:最佳实践+示例
  • 把本地搭建的hexo博客部署到自己的服务器上
  • 初阶数据结构:链表(二)
  • postgresql根据主键ID字段分批删除表数据
  • 10.business english-global market
  • C 语言实现计算一年中指定日期是第几天 题】
  • 深入理解三高架构:高可用性、高性能、高扩展性的最佳实践
  • 【反悔堆】力扣1642. 可以到达的最远建筑
  • 关于使用Mybatis-plus的TableNameHandler动态表名处理器实现分表业务的详细介绍
  • docker 安装 redis 详解
  • 56. 合并区间
  • BOM对象location与数组操作结合——查询串提取案例
  • Jetson Orin Nano Super之 onnxruntime 编译安装
  • 开发环境搭建-3:配置 nodejs 开发环境 (fnm+ node + pnpm)
  • [SWPUCTF 2022 新生赛]js_sign
  • 农业信息化的基本框架
  • OpenAI的真正对手?DeepSeek-R1如何用强化学习重构LLM能力边界——DeepSeek-R1论文精读
  • Vue 3 中的父子组件传值:详细示例与解析