当前位置: 首页 > news >正文

Data processing flow

1. 找出第一年的address,有lat和long,自动生成

csv_log_lat_county.ipynb

import csv
from geopy.geocoders import Nominatim
from geopy.exc import GeocoderTimedOutgeolocator = Nominatim(user_agent="my-app")
data_csv = r"D:/year1.csv"
output_csv = r"D:\year1_address.csv"with open(data_csv, 'r') as f_in, open(output_csv, 'w', newline='') as f_out:reader = csv.reader(f_in)writer = csv.writer(f_out)header = next(reader)header.append('address')writer.writerow(header)lat_idx = header.index('Lat')long_idx = header.index('Long')for row in reader:if not row[lat_idx] or not row[long_idx]:continue lat = float(row[lat_idx])long = float(row[long_idx])try:location = geolocator.reverse(f"{lat}, {long}")address = location.addressrow.append(address)writer.writerow(row)print(address)except GeocoderTimedOut:print(f"Error geocoding {lat}, {long}. Skipping...")

2. 两个年份的表格contact,保证所有列数的标题相同,并且数量相同

import pandas as pddf1 = pd.read_csv(r"year2_address.csv")
df2 = pd.read_csv(r"year2_address.csv")# 现将表构成list,然后在作为concat的输入
frames = [df1, df2]result = pd.concat(frames)
print(result)
result.to_csv(r"D:\all_year1_year2.csv",index=True,header=True)

3. 对两个表格做出统计,分别分析各项数据

table_stastistics

最终表格发在邮箱

http://www.lryc.cn/news/177450.html

相关文章:

  • CAP理论与BASE理论
  • DRM全解析 —— ADD_FB2(3)
  • 【Java】SpringMVC ResponseBodyAdvice详解
  • python常见面试题五
  • SpringBoot结合Vue.js+axios框架实现增删改查功能+网页端实时显示数据库数据(包括删除多条数据)
  • 曙光亮相工博会,发布首款国产高端工业实时仿真计算系统
  • 「大数据-2.0」安装Hadoop和部署HDFS集群
  • 文档在线预览word、pdf、excel文件转html以实现文档在线预览
  • FFmpeg视音频分离器----向雷神学习
  • CentOS 8开启bbr
  • Redis的安装与基本使用
  • 2014 款金旅牌小型客车 发动机怠速抖动、加速无力
  • R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化...
  • 网站被劫持了怎么办
  • 【面试题精讲】Java包装类缓存机制
  • 网络相关知识
  • 商品冷启动推荐综述
  • GEO生信数据挖掘(二)下载基因芯片平台文件及注释
  • 淘宝电商必备的大数据应用
  • Docker版部署RocketMQ开启ACL验证
  • 【RabbitMQ实战】04 RabbitMQ的基本概念:Exchange,Queue,Channel等
  • APACHE NIFI学习之—RouteOnAttribute
  • 防火墙网络接口下面多个外网地址,只有第一地址可以访问通其他不通
  • 【HTTP】URL结构、HTTP请求和响应的报文格式、HTTP请求的方法、常见的状态码、GET和POST有什么区别、Cookie、Session等重点知识汇总
  • 苹果mac电脑显示内存不足如何解决?
  • 如何在Windows 10上安装Go并搭建本地编程环境
  • [Realtek sdk-3.4.14b]RTL8197FH-VG 2.4G to WAN吞吐量低于60%的问题分析及解决方案
  • 软件设计模式系列之十八——迭代器模式
  • 前端项目配置 prettier、eslint、lint-stages、husky、commitlint 、style-lint设置代码书写和提交规范
  • 如何开始着手一篇Meta分析 | Meta分析的流程及方法