当前位置: 首页 > news >正文

标准化、逻辑回归、随机梯度参数估计

机器学习入门

数据预处理:

  1. 将?替换为缺失值
data = data.replace(to_replace="?",value=np.nan)
  1. 丢掉缺失值
data.dropna(how="any)
#how=all删除全是缺失值的行和列
#haow=any删除有缺失值的行和列
  1. 将数据集划分成测试集和训练集
    data[column_name[1:10]]是自变量x
    data[column_name[10]是因变量y
from sklearn.cross_validation import train_test_split
X_train,X_test,y_train,y_test=train_test_split(data[column_names[1:10]],data[column_
  1. 查看训练集、测试集分布
y_train.value_counts()
y_test.value_counts()
  1. 进行标准化,上一篇说了标准化是什么。
from sklearn.preprocessing import StandardScaler
  1. 载入模型:逻辑回归(logistics),随机梯度参数估计(sgd)
# 逻辑回归
from sklearn.linear_model import LogisticRegression
# 随机梯度参数估计
from sklearn.linear_model import SGDClassifier
  1. 标准化
ss = StandardScaler()
x_train = ss.fit_transform(x_train)
x_test = ss.fit_transform(x_test)
  1. 初始化模型
lr = LogisticRegression()
sgdc = SGDClassifier()
  1. 训练模型,预测模型
# 模型训练
lr.fit(x_train,y_train)
# 预测模型
lr_y_predict = lr.predict(x_test)
sgdc.fit(x_train,y_train)
sgdc_y_predict = sgdc.predict(x_test)
  1. 衡量指标
from sklearn.metrics import classification_report
  1. 准确度
print ('Accuracy of LR Classifier:',lr.score(x_test,y_test))
print ('Accuracy of SGD Classifier:',sgdc.score(x_test,y_test))
  1. 生成报告
print(classification_report(y_test,lr_y_predict,target_names=['Benign','Malignant']))
print(classification_report(y_test,sgdc_y_predict,target_names=['Benign','Malignant']))

在这里插入图片描述

http://www.lryc.cn/news/178985.html

相关文章:

  • 【数据结构】【C++】封装哈希表模拟实现unordered_map和unordered_set容器
  • 26967-2011 一般用喷油单螺杆空气压缩机
  • Opengl之模板测试
  • iPhone苹果手机复制粘贴内容提示弹窗如何取消关闭提醒?
  • 释放潜力:人工智能对个性化学习的影响
  • 什么是Local Storage和Session Storage?它们之间有什么区别?
  • 单样本T检验|独立样本T检验|配对样本T检验(绘图)
  • 全面解读 SQL 优化 - 统计信息
  • Spring整合RabbitMQ——生产者
  • Spring的注解开发-Bean基本注解开发
  • 【Ubuntu18.04】Autoware.ai安装
  • SpringMVC 学习(一)Servlet
  • 26943-2011 升降式高杆照明装置 课堂随笔
  • 洛谷题解 | AT_abc321_c Primes on Interval
  • Quartus医院病房呼叫系统病床呼叫Verilog,源代码下载
  • ip的标准分类---分类的Ip
  • 理解并掌握C#的Channel:从使用案例到源码解读(一)
  • 如何让git命令仅针对当前目录
  • 【0223】源码剖析smgr底层设计机制(3)
  • Visual Studio 2019 C# winform CefSharp 中播放视频及全屏播放
  • 天选之子Linux是如何发展起来的?为何对全球IT行业的影响如此之大?
  • MDK报错:Undefined symbol assert_failed报错解决策略
  • LLM - Make Causal Mask 构造因果关系掩码
  • Python函数式编程(一)概念和itertools
  • Guava限流器原理浅析
  • 第四十二章 持久对象和SQL - 用于创建持久类和表的选项
  • 集合-ArrayList源码分析(面试)
  • 跨类型文本文件,反序列化与类型转换的思考
  • ubuntu20安装nvidia驱动
  • gma 2 成书计划