当前位置: 首页 > news >正文

04动手学深度学习(下)

数据预处理

创建一个人工数据集,并存储在csv(逗号分隔)文件

import osos.makedirs(os.path.join('..','data'),exist_ok=True)
data_file=os.path.join('..','data','house_tiny.csv')
with open(data_file,'w') as f:f.write('NumRooms,Alley,Price\n')  #列名f.write('NA,Pave,127500\n')   #每行表示一个数据样本f.write('2,NA,106000\n')f.write('4,NA,178100\n')f.write('NA,NA,140000\n')
import pandas as pddata=pd.read_csv(data_file)
print(data)
   NumRooms Alley   Price
0       NaN  Pave  127500
1       2.0   NaN  106000
2       4.0   NaN  178100
3       NaN   NaN  140000

为处理缺失值,典型方法包含插值和删除,这里采用插值的方法

inputs,outputs=data.iloc[:,0:2],data.iloc[:,2]  #其中使用iloc即index location进行元素定位
inputs=inputs.fillna(inputs.mean(numeric_only=True))  #将缺失值填充为原先值的均值
print(inputs)
   NumRooms Alley
0       3.0  Pave
1       2.0   NaN
2       4.0   NaN
3       3.0   NaN
inputs=pd.get_dummies(inputs,dummy_na=True).astype(int)
print(inputs)
   NumRooms  Alley_Pave  Alley_nan
0         3           1          0
1         2           0          1
2         4           0          1
3         3           0          1
import torchX,y=torch.tensor(inputs.values),torch.tensor(outputs.values)
X,y
(tensor([[3, 1, 0],[2, 0, 1],[4, 0, 1],[3, 0, 1]]),tensor([127500, 106000, 178100, 140000]))

转换为NumPy张量

a=torch.tensor([3.5])
a,a.item(),float(a),int(a)
(tensor([3.5000]), 3.5, 3.5, 3)

http://www.lryc.cn/news/603104.html

相关文章:

  • C++ 哈希算法、贪心算法
  • 【硬件】LVGL
  • 六轴机械臂cad【11张】三维图+设计说明书
  • 用latex+vscode+ctex写毕业论文
  • node后端-JWT认证
  • 使用Ettus USRP X440对雷达和EW系统进行原型验证
  • 自定义spring-boot-starter
  • Python defaultdict 的强大之处:告别繁琐的字典键检查: Effective Python 第17条
  • days34:零基础学嵌入式之数据存储——数据库
  • Sentinel 不同层面的流控保护
  • Java中实现定时任务执行的方式总结
  • 反欺诈系统:Oracle 到 ES 迁移实战
  • 【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 微博文章数据可视化分析-点赞区间实现
  • Java类加载机制详解
  • AI coding汇总持续更新
  • STM32启动流程
  • 【学习路线】Android开发2025:从入门到高级架构师
  • Unity_UI_NGUI_锚点组件
  • 【java面试day7】redis分布式锁
  • SpringBoot 发送邮件
  • 五自由度磁悬浮轴承转子不平衡质量的高性能控制策略全解析
  • 算法训练营day34 动态规划② 62.不同路径、63. 不同路径 II、343整数拆分、96.不同的二叉搜索树
  • Java响应式编程
  • ATF 运行时服务
  • ros2的package.xml和rosdep
  • 基于深度学习的医学图像分析:使用3D CNN实现肿瘤检测
  • 第十天:字符菱形
  • 一个Pycharm窗口添加多个项目来满足运行多个项目的需求
  • DDoS攻击防御:从5G到T级防护方案全对比
  • 企业级日志分析系统ELK