当前位置: 首页 > news >正文

数据集笔记: Porto

数据来源:Taxi Trajectory Data_数据集-阿里云天池 (aliyun.com)

1 数据介绍

  • 葡萄牙波尔图市运行的所有442辆出租车的全年轨迹(从2013年7月1日至2014年6月30日)

2  读取数据

import  pandas as pdtra=pd.read_csv('C:/Users/16000/Downloads/train/train(1).csv')
tra

170万条轨迹

2.1 数据每一列的意义

TRIP_ID每次行程的唯一标识符
CALL_TYPE标识要求此服务的方式。可能包含三个可能的值之一:
  • ‘A’ 如果此行程是从中心调度的;
  • ‘B’ 如果此行程是直接要求特定站点的出租车司机的;
  • ‘C’ 其他(即在随机街道上要求的行程)。
ORIGIN_CALL

包含用于要求至少一项服务的每个电话号码的唯一标识符

如果CALL_TYPE='A',它标识行程的客户。否则,它假定为NULL值

ORIGIN_STAND

包含出租车站点的唯一标识符。

如果CALL_TYPE='B',它标识行程的起始点。否则,它假定为NULL值;

TAXI_ID包含执行每次行程的出租车司机的唯一标识符;
TIMESTAMP

Unix时间戳(以秒为单位)

标识行程的开始

DAYTYPE

标识行程开始的天类型。它假定三个可能的值之一:

  • ‘B’ 如果此行程开始于假日或任何其他特殊日子(即延长假期、浮动假期等);
  • ‘C’ 如果行程开始于类型B天的前一天;
  • ‘A’ 其他(即正常日子,工作日或周末)。
MISSING_DATA

当GPS数据流完整时为FALSE

当一个(或多个)位置缺失时为TRUE;

POLYLINE

以字符串形式映射的GPS坐标列表(即WGS84格式)

此列表包含行程每15秒的一对坐标。

最后一个列表项对应行程的目的地,而第一个代表其开始

 行程的总行驶时间定义为(点的数量-1)x 15秒。

例如,POLYLINE中有101个数据点的行程长度为(101-1)* 15 = 1500秒

3 python可视化一条轨迹

loc=tra.at[0,'POLYLINE']
loc
'''
'[[-8.618643,41.141412],[-8.618499,41.141376],[-8.620326,41.14251],[-8.622153,41.143815],[-8.623953,41.144373],[-8.62668,41.144778],[-8.627373,41.144697],[-8.630226,41.14521],[-8.632746,41.14692],[-8.631738,41.148225],[-8.629938,41.150385],[-8.62911,41.151213],[-8.629128,41.15124],[-8.628786,41.152203],[-8.628687,41.152374],[-8.628759,41.152518],[-8.630838,41.15268],[-8.632323,41.153022],[-8.631144,41.154489],[-8.630829,41.154507],[-8.630829,41.154516],[-8.630829,41.154498],[-8.630838,41.154489]]'
'''
#提取第一条轨迹的geometryloc_lst=json.loads(loc)
loc_lst = [[lat, lon] for lon, lat in loc_lst]
loc_lst
'''
[[41.141412, -8.618643],[41.141376, -8.618499],[41.14251, -8.620326],[41.143815, -8.622153],[41.144373, -8.623953],[41.144778, -8.62668],[41.144697, -8.627373],[41.14521, -8.630226],[41.14692, -8.632746],[41.148225, -8.631738],[41.150385, -8.629938],[41.151213, -8.62911],[41.15124, -8.629128],[41.152203, -8.628786],[41.152374, -8.628687],[41.152518, -8.628759],[41.15268, -8.630838],[41.153022, -8.632323],[41.154489, -8.631144],[41.154507, -8.630829],[41.154516, -8.630829],[41.154498, -8.630829],[41.154489, -8.630838]]
'''import numpy as np
loc_lst=np.array(loc_lst)
lat,lon=np.mean(loc_lst,axis=0)
lat,lon
#(41.14919347826088, -8.62801630434783)import foliumm=folium.Map(location=(lat,lon),zoom_start=15)folium.PolyLine(locations=loc_lst,weight=10).add_to(m)
m
#画图

http://www.lryc.cn/news/177648.html

相关文章:

  • 修改vscode底部栏背景和字体颜色
  • 加速企业AI实施:成功策略和效率方法
  • 【图论C++】树的重心——教父POJ 3107(链式前向星的使用)
  • hhh百度地铁广告太搞笑了;24家国内大模型公司面经;LLM法律应用实践;AI+教育产品图谱与工作流 | ShowMeAI日报
  • 项目管理:项目经理一定要避开这四大误区
  • 爬虫为什么需要 HTTP 代理 IP?
  • leetcode刷题笔记/代码随想录笔记——移除字符串中多余空格
  • dataGrip导出导入的方式
  • LeetCode279. 完全平方数
  • 【CMake】add_dependencies 命令
  • go语言unsafe.Pointer与uintptr
  • ddos打到高防cdn上会发生什么
  • 【单调栈】503. 下一个更大元素 II
  • C++ decltype类型
  • 【题解】JZOJ3854 分组
  • 区块链实验室(26) - 区块链期刊Blockchain: Research and Applications
  • 【学习笔记】[ARC153F] Tri-Colored Paths
  • 基于SSM的实习管理系统
  • 在Vue中通过ElementUI构建前端页面【登录,注册】,在IEDA构建后端实现前后端分离
  • TX2 open ttyTHS2
  • conan入门(二十八):解决conan 1.60.0下 arch64-linux-gnu交叉编译openssl/3.1.2报错问题
  • Xcode 15 运行<iOS 14, 启动崩溃问题
  • HTTPS协议概述
  • jmeterbeanshell调用jsonpath获取对应值
  • C++中实现雪花算法来在秒级以及毫秒及时间内生成唯一id
  • OPTEE Gprof(GNU profile)
  • MySQL 事务的操作指南(事务篇 二)
  • Oracle 查询 SQL 语句
  • gin 基本使用
  • 8月最新修正版风车IM即时聊天通讯源码+搭建教程