当前位置: 首页 > news >正文

使用决策树预测隐形眼镜类型

任务描述

本关任务:编写一个例子讲解决策树如何预测患者需要佩戴的隐形眼镜类型。使用小数据集,我们就可以利用决策树学到很多知识:眼科医生是如何判断患者需要佩戴的镜片类型,一旦理解了决策树的工作原理,我们甚至也可以帮助人们判断需要佩戴的镜片类型。

相关知识

为了完成本关任务,你需要掌握:1.如何处理隐形眼镜数据集,2.如何使用决策树来进行预测

如何处理隐形眼镜数据集

隐形眼镜数据集包含很多患者眼部状况的观察条件以及医生推荐的隐形眼镜类型。隐形眼镜类型包括硬材质、软材质以及不适合佩戴隐形眼镜。数据来源于UCI数据库,为了更容易显示数据,我么对数据做了简单的更改。

  1. import pandas as pd
  2. if __name__ == '__main__':
  3. with open('lenses.txt', 'r') as fr: #加载文件
  4. lenses = [inst.strip().split('\t') for inst in fr.readlines()]#处理文件
  5. lenses_target = [] #提取每组数据的类别,保存在列表里
  6. for each in lenses:
  7. lenses_target.append(each[-1])
  8. lensesLabels = ['age', 'prescript', 'astigmatic', 'tearRate'] #特征标签
  9. lenses_list = [] #保存lenses数据的临时列表
  10. lenses_dict = {} #保存lenses数据的字典,用于生成pandas
  11. for each_label in lensesLabels: #提取信息,生成字典
  12. for each in lenses:
  13. lenses_list.append(each[lensesLabels.index(each_label)])
  14. lenses_dict[each_label] = lenses_list
  15. lenses_list = []
  16. print(lenses_dict) #打印字典信息
  17. lenses_pd = pd.DataFrame(lenses_dict) #生成pandas.DataFrame
  18. print(lenses_pd)

我们讲原始的数据信息进行处理,将原始数据处理成有序的数据。

数据处理

编程要求

根据提示,在右侧编辑器补充代码,添加使用决策树预测的代码

测试说明

平台会对你编写的代码进行测试:


开始你的任务吧,祝你成功!

代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from io import StringIO
from sklearn.preprocessing import LabelEncoder, OneHotEncoderfrom sklearn import treeif __name__ == '__main__':with open('./src/step3/lenses.txt', 'r') as fr:                               #加载文件lenses = [inst.strip().split('\t') for inst in fr.readlines()]#处理文件lenses_target = []                                                #提取每组数据的类别,保存在列表里for each in lenses:lenses_target.append(each[-1])print(lenses_target)lensesLabels = ['age', 'prescript', 'astigmatic', 'tearRate']     #特征标签lenses_list = []                                                  #保存lenses数据的临时列表lenses_dict = {}                                                  #保存lenses数据的字典,用于生成pandasfor each_label in lensesLabels:                                   #提取信息,生成字典for each in lenses:lenses_list.append(each[lensesLabels.index(each_label)])lenses_dict[each_label] = lenses_listlenses_list = []#print(lenses_dict)                                              #打印字典信息# print(lenses_dict)                                              #打印字典信息############ 请在此处添加你的代码data = pd.DataFrame(lenses_dict)                       #生成pandas.DataFrameprint(data)#打印pandas.DataFramele = LabelEncoder()                      #创建LabelEncoder()对象,用于序列化data['age'] = data['age'].map({'young': 2, 'presbyopic': 1, 'pre': 0})  #序列化data['prescript'] = data['prescript'].map({'myope': 1, 'hyper': 0})data['astigmatic'] = data['astigmatic'].map({'no': 0, 'yes': 1})data['tearRate'] = data['tearRate'].map({'reduced': 1, 'normal': 0})print(data)#############

http://www.lryc.cn/news/222552.html

相关文章:

  • [ACTF2020 新生赛]BackupFile 1
  • 解决vuex刷新数据丢失
  • linux系统下读取当前硬盘的温度
  • python 深度学习 解决遇到的报错问题8
  • Linux pipe()系统调用示例
  • 音频中的采样率和比特率
  • Python常用脚本
  • Redis5 分布式系统之主从模式
  • 【黑马程序员】Maven 进阶
  • 231108 C语言memset当第三个参数为0,即设置个数为零也不报错
  • HMM与LTP词性标注之马尔科夫模型(HMM原理剖析)
  • Python自动化测试selenium指定截图文件名方法
  • Linux 实现文件后半部分的复制
  • 阿里开源中间件一览
  • Ubuntu20.04下Salome_meca 2022软件安装(支持GPU加速)
  • uniapp:打包ios配置隐私协议框
  • JS逆向爬虫---请求参数加密③【比特币交易爬虫】
  • 云计算:未来科技的超级英雄
  • 【Node.js入门】1.3 开始开发Node.js应用程序
  • ansible-playbook之file模块
  • Vue路由介绍及使用
  • 案例 - 拖拽上传文件
  • github 上传代码报错 fatal: Authentication failed for ‘xxxxxx‘
  • Linux虚拟网络设备之bridge
  • 最后一个大更新!Win11 2023正式发布:Copilot终于来了
  • pandas教程:Reading and Writing Data in Text Format (以文本格式读取和写入数据)
  • 软考高级系统架构设计师系列之:软考高级系统架构设计师论文专题
  • 目标检测中的评价指标
  • 【AI编程】ai编程插件汇总iFlyCode、codegeex
  • 算法通关村第八关|黄金挑战|二叉树的最近公共祖先