当前位置: 首页 > news >正文

kaggle题-房价预测(Pytorch),手把手教,全文代码解释

房价预测

在这里插入图片描述

本题是经典的通过表格数据去预测最终值,主要分为几大步骤:
一.将数据集修改为可以代入到网络模型的数字,因为给的数据大部分都是str类型,是无法直接放到网络模型里跑的,例如下图,很多标签值为str类型,并不是数字,那么解决办法就是将这些标签分类,强制让其变为数字类型
在这里插入图片描述

二.创建神经网络模型

三.训练网络,最终预测测试集

一.数据集制作和修改(数据的预处理)

对于表格数据集来说,无非就两个操作,1.将标签值为str字符型的变为float类型,2.将标签值为数字的标准化。

分析题目给的train_csv文件中标签值
在这里插入图片描述
发现第一个标签Id对于预测没用,那么在制作数据的时候首先需要去除第一个标签数据,可以使用.drop[‘id’],也可以用 iloc() 函数去除,直接筛选从第二个标签开始的值。

在这里插入图片描述

将train_csv文件拉到最后,发现最后一个标签值为SalePrice售价,我们本题要做的就是去预测售价,那么在train_csv文件中最后一个标签SalePrice就是我们训练集的label,因此在制作数据集时候,也不能要SalePrice标签,而前面除了Id的所有标签值就是我们训练集的数据,这个房子的各种属性值,比如房子修建时间,面积,或者是否挨着街道等,去用这些数据去预测它的房价。

import pandas                          #表格处理库
import torch                           #框架#读取数据
train_csv=pd.read_csv('/kaggle/input/house-prices-advanced-regression-techniques/train.csv')        
test_csv=pd.read_csv('/kaggle/input/house-prices-advanced-regression-techniques/test.csv')#重点:神经网络去训练数据必须都是Tensor张量模型,iloc将标签值分裂出来,转出来的数据类型为float32,
#因为要统一数据类型,训练集数据也要转为float32,float会提高预测精度,直接读出数据为一维,而训练
#集的数据为二维,所以用reshape将label数据变为二维
train_label=torch.tensor(train_csv.iloc[:,-1],dtype=torch.float32).reshape(-1,1)
http://www.lryc.cn/news/434408.html

相关文章:

  • PulseSensor心率传感器详解(STM32)
  • NISP 一级 | 3.1 网络基础知识
  • 模拟网络丢包常用方法以及工具
  • ABC 370 E - Avoid K Partition
  • C++: set与map容器的介绍与使用
  • 单片机-STM32 看门狗(八)
  • iOS 18.1将上线新功能,可惜这波国内的小伙伴无缘了
  • MySQL中DML操作(二)
  • LLMs技术 | 整合Ollama实现本地LLMs调用
  • 【C-实践】文件服务器(3.0)
  • LeetCode 2181.合并零之间的节点
  • 千益畅行,共享旅游卡,引领旅游新潮流
  • K均值聚类
  • 【Ubuntu】安装常用软件包
  • 探索全光网技术 | 全光网产品解决方案整理-(宇洪科技)
  • 资料分析(2)
  • 百元以下蓝牙耳机性价比之王品牌?四大高能性价比机型推荐
  • 考场考生行为检测数据集 7000张 带标注 voc yolo
  • 深度学习算法,该如何深入,举例说明
  • 舵机的原理及应用
  • Nacos与Eureka--微服务注册中心
  • Android 调试桥——ADB
  • 闲鱼放弃成为淘宝复刻版了吗?上线学生专属交易交流版块“学生鱼”频道
  • 【学习笔记11】如何找到twitter中自己的cookie?
  • 新办建筑智能化专项乙级设计资质,郑州企业需要达到哪些要求?
  • 项目管理:项目执行过程中的控制点——基线
  • NVIDIA驱动学习
  • 小小GCD、LCM拿下拿下
  • 如何集成Android平台GB28181设备接入模块?
  • mysql——关于表的增删改查(CRUD)