当前位置: 首页 > news >正文

基于python的百度迁徙迁入、迁出数据分析(五)

终于在第五篇文章我们进入了这个系列的正题:数据分析

这里我选择上海2024年5月1日——5月5日的迁入、迁出数据作为分析的基础,首先选择节假日的数据作为分析的原因呢,主要是节假日人们出行目的比较单一(出游、探亲),更容易反应节假日客流特征,当然也不排除以出差或者其他出行目的的人群。我们更多的是讨论倾向性。

先摆一下2024年5月1日——5月5日的迁出比例数据:

以上海2024年5月1日迁出城市前20为例,为什么取前20呢,首先前20的迁出比占了上海总迁出比的65.8%,超过半数的数据比例,另外原始数据有超过370+的地级市,在地图上展示很难抓住有效性信息,那索性我们就把视角放到较中观的视角,可以帮助我们发现一些不曾关注过的细节。

好了,直截了当开始分析,我们对数据进行可视化可以发现占上海总迁出比最大的城市是苏州15.67,稳居第一,超过第二名接近3倍,形成了''一超多强''的客流迁徙模型 ,通过自然间断法可以发现一超是''苏州市'',多强为周边的''南通市''、''杭州市''、''嘉兴市''、''湖州市'',相对较远的无锡市、绍兴市、宁波市等城市则为第三梯队;

纵观前20名的迁出城市除了阜阳,其他无一例外的都在长江三角洲城市群内,果然长江三角抱团效应很紧密,五一假期这种中大型节假日都舍不得离开长三角,当然也跟现在的短途出游为主流的消费观念一致,同时这里也发现了一个旅游''飞地'':镇江市,看了一眼数据,稳定排到30+的排名,它上面的排名有广州市、南昌市、长沙市等,看来镇江市虽然是长江三角洲城市群内的一员,但是在出行意愿上来看,对上海人的吸引力较弱;

从整个完整时间线分析,可以看出上海迁出周边热门城市的比例关系在5月3日也就是节中达到极值,这时间的客流达到了极致分化的状态,也就是出行目的很明确的状态,苏州以一城之力,吸引了上海接近4分之一的出行客流,稳稳拿下''一超''的称号;

先摆一下2024年5月1日——5月5日的迁入比例数据:

来看一下节假日来上海的伙伴都来自那里,这里还是选取5月1日前20名的迁入上海的城市为例,可以看出还是维持着''一超多强''的客流迁徙格局,通过自然间断法可以发现一超是''苏州市'',多强为周边的''南通市''、''杭州市''、''嘉兴市''、''宁波市'',这里宁波市的强势加入,代替了湖州市的4强地位,显然上海待湖州如初恋,但是湖州并不这么想,另外宁波之所以强势上位的原因,还是多亏了杭州湾跨海大桥大幅缩短了上海与宁波的物理距离,另外看第三梯队的阵形,中东部地区的朋友似乎更喜欢往上海跑;

从整个完整时间线分析,可以看出上海迁入周边热门城市的比例关系也在5月3日,甚至略有提前,达到出行目的很明确的状态;

这里放上百度官方的2024年五一出行指南:百度地图《2024年五一假期出行指南》 (baidu.com)

它给出预测会拥堵路段,沿海高速、杭州湾环线连通上海南下宁波、台州、舟山这些城市与上海的迁徙通道,江宜高速、沪陕高速连通上海北上南京、扬州这些城市,因为官方报告是全国版,所以影响因素还很多,这里仅做简要分析;

总结

  1. 区域凝聚力:上海与长江三角洲城市群之间的人员流动非常频繁,显示出区域内城市的紧密联系和相互依赖性。

  2. 苏州的主导地位:苏州在迁出和迁入数据中均占据首位,显示出其作为上海周边最受欢迎目的地的强大吸引力。

  3. 短途旅行趋势:五一假期期间,短途旅行成为主流,大多数迁出目的地集中在长江三角洲城市群内,反映了上海人的出行偏好。

  4. 交通基础设施的影响:宁波因其与上海之间便捷的交通连接(如杭州湾跨海大桥)而成为迁入上海的强势城市之一。

  5. 镇江市的独特情况:尽管位于长江三角洲城市群内,但镇江市在上海市民中的出行吸引力相对较弱,这可能与其地理位置或其他因素有关。

文章仅用于分享个人学习成果与个人存档之用,分享知识,如有侵权,请联系作者进行删除。所有信息均基于作者的个人理解和经验,不代表任何官方立场或权威解读。

http://www.lryc.cn/news/412195.html

相关文章:

  • SpringBoot 如何处理跨域请求
  • 大数据技术基础编程、实验和案例----大数据课程综合实验案例
  • 微信小程序-获取手机号:HttpClientErrorException: 412 Precondition Failed: [no body]
  • 大数据核心概念与技术架构简介
  • 快排 谁在中间
  • ORA-00911: invalid character
  • Pytorch实现线性回归Linear Regression
  • 十八次(虚拟主机与vue项目、samba磁盘映射、nfs共享)
  • P1340 兽径管理 题解|最小生成树
  • Python,Maskrcnn训练,cannot import name ‘saving‘ from ‘keras.engine‘ ,等问题集合
  • Linux常用工具
  • AI未来的发展如何
  • 若依替换首页上的logo
  • sed的使用示例
  • 学历不是障碍:大专生如何成功进入软件测试行业
  • 文件解析漏洞—IIS解析漏洞—IIS6.X
  • Sqlmap中文使用手册 - Brute force模块参数使用
  • ubuntu20.04 开源鸿蒙源码编译配置
  • 程序员面试 “八股文”在实际工作中是助力、阻力还是空谈?
  • 广告从用户点击开始到最终扣费的过程
  • Linux系统编程-信号进程间通信
  • Attention Module (SAM)是什么?
  • 【C语言】堆排序
  • ntp服务重启报错Failed to restart ntpd.service: Unit is masked.
  • 面试题-每日5到
  • 代码美学大师:打造Perl中的个性化代码格式化工具
  • 成为一名月薪 2 万的 web 安全工程师需要掌握哪些技能?
  • Linux中如何添加磁盘分区
  • 计算机毕业设计Hadoop+Hive专利分析可视化 面向专利的大数据管理系统 专利爬虫 专利数据分析 大数据毕业设计 Spark
  • git是什么?git和svn的区别。git的一些命令