当前位置: 首页 > news >正文

2025 - 生信信息学 - GEO数据分析 - RF分析(随机森林)

GEO数据分析 - RF分析(随机森林)

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

01 准备数据文件

在这里插入图片描述

#install.packages("randomForest")#引用包
library(randomForest)
set.seed(123456)inputFile="diffGeneExp.txt"       #输入文件
setwd("/Users/wangyang/Desktop/BCBM/02randomForest-ANN")      #设置工作目录#读取输入文件
data=read.table(inputFile, header=T, sep="\t", check.names=F, row.names=1)
data=t(data)
group=gsub("(.*)\\_(.*)", "\\2", row.names(data))#随机森林树
rf=randomForest(as.factor(group)~., data=data, ntree=500)
pdf(file="forest.pdf", width=6, height=6)
plot(rf, main="Random forest", lwd=2)
dev.off()#找出误差最小的点
optionTrees=which.min(rf$err.rate[,1])
optionTrees
rf2=randomForest(as.factor(group)~., data=data, ntree=optionTrees)#查看基因的重要性
importance=importance(x=rf2)#绘制基因的重要性图
pdf(file="geneImportance.pdf", width=6.2, height=7.8)
varImpPlot(rf2, main="")
dev.off()#挑选疾病特征基因
rfGenes=importance[order(importance[,"MeanDecreaseGini"], decreasing = TRUE),]
rfGenes=names(rfGenes[rfGenes>1])     #挑选重要性评分大于1的基因
#rfGenes=names(rfGenes[1:30])         #挑选重要性评分最高的30个基因
write.table(rfGenes, file="rfGenes.txt", sep="\t", quote=F, col.names=F, row.names=F)#输出重要基因的表达量
sigExp=t(data[,rfGenes])
sigExpOut=rbind(ID=colnames(sigExp),sigExp)
write.table(sigExpOut, file="rfGeneExp.txt", sep="\t", quote=F, col.names=F)
http://www.lryc.cn/news/487434.html

相关文章:

  • Matlab深度学习(四)——AlexNet卷积神经网络
  • etcd defrag
  • golang语言整合jwt+gin框架实现token
  • 数据治理、数据素养和数据质量管理:文献综述
  • 【Linux】用户和用户组管理
  • 游戏引擎学习第16天
  • 如何通过对敏捷实践的调整,帮助远程团队提升研发效能?
  • Ubuntu Linux使用前准备动作 配置SSH
  • 疫情下的图书馆管理系统:Spring Boot技术
  • vue3完整安装并创建项目
  • 【Linux】Linux入门实操——进程管理(重点)
  • Linux-Apache
  • 高危,Laravel参数注入漏洞安全风险通告
  • 【Qt】使用QString的toLocal8Bit()导致的问题
  • Android上运行Opencv(TODO)
  • 动态IP黑白名单过滤的设计与实现(上篇设计思想)
  • LeetCode 力扣 热题 100道(五)最长回文子串(C++)
  • Docker--Docker Registry(镜像仓库)
  • maven手动上传jar到私服仓库:mvn deploy:deploy-file命令
  • 【机器学习】机器学习中用到的高等数学知识-1.线性代数 (Linear Algebra)
  • 无插件H5播放器EasyPlayer.js网页web无插件播放器选择全屏时,视频区域并没有全屏问题的解决方案
  • Idea中创建和联系MySQL等数据库
  • 【pytest】pytest注解使用指南
  • 在Unity中使用Epplus写Excel
  • 初识算法 · 模拟(2)
  • 【Java面试】—— 创建线程池的两种方式(执行流程、拒绝策略)(详细)
  • Docker在微服务架构中的应用
  • 苹果ASA归因对接以及API接入
  • Git常用操作学习
  • 2.5D视觉——Aruco码定位检测