当前位置: 首页 > news >正文

Excel爬虫使用实例-百度热搜

原来excel也能爬虫抓取数据,而且简单好用

在这里插入图片描述

  • 目标网址: https://top.baidu.com/board?tab=realtime

下面是一个excel爬虫的小小例子,爬取了百度热搜的前50(还有一个置顶的热搜没有1,2,3编号)
在这里插入图片描述
实现步骤:

  1. 打开excel

  2. 自网站
    在这里插入图片描述

  3. 输入网址,确定

https://top.baidu.com/board?tab=realtime

在这里插入图片描述

  1. 转换数据
    在这里插入图片描述
  2. 编辑
  • 推拽移动可以重排序
  • 右键可删除,重命名等操作
    在这里插入图片描述
  • 点×可以撤销标记
  1. 编辑完毕关闭并上载
    在这里插入图片描述
    得到:
    在这里插入图片描述

  2. 微调表格样式
    在这里插入图片描述
    在这里插入图片描述

  3. 若要再次编辑转换表格格式,可以在右侧的 查询&连接 右键编辑
    在这里插入图片描述
    查询和编辑关掉了可以在这里找到:
    在这里插入图片描述

  4. 若要更新热搜榜,同样可点击刷新
    在这里插入图片描述


简单又快速,还能重复利用

在这里插入图片描述

http://www.lryc.cn/news/440252.html

相关文章:

  • arcgisPro地理配准
  • SpringBoot开发——获取HTTP请求头(Header)的三种方法
  • 大模型入门3:理解LLAMA
  • React学习day07-ReactRouter-抽象路由模块、路由导航、路由导航传参、嵌套路由、默认二级路由的设置、两种路由模式
  • Unity项目的脚本继承关系
  • 【自动驾驶】决策规划算法(一)决策规划仿真平台搭建 | Matlab + Prescan + Carsim 联合仿真基本操作
  • grep 命令:文本搜索
  • python画图|中秋到了,尝试画个月亮(球体画法)
  • 【网络安全的神秘世界】攻防环境搭建及漏洞原理学习
  • pythonnet python图像 C# .NET图像 互转
  • spring security OAuth2 搭建资源服务器以及授权服务器/jdbc/jwt两种方案
  • 计算机视觉—3d点云数据基础
  • Matlab simulink建模与仿真 第十八章(Stateflow状态机)
  • Linux系统终端中文件权限的10位字符是什么意思
  • Qt QSerialPort串口编程
  • 扫雷游戏及其中的知识点
  • 【乐企-业务篇】开票前置校验服务-规则链服务接口实现(发票基础信息校验)
  • 【搜索算法】以扩召回为目标,item-tag不如query-tag能扩更多数量
  • SpringBoot入门(黑马)
  • Stream流操作
  • 【Linux】查看操作系统开机时初始化的驱动模块列表的一个方法
  • 快速入门Vue
  • ubuntu系统服务器离线安装python包
  • re题(30)BUUCTF-[HDCTF2019]Maze
  • day36+day37 0-1背包
  • PostMan使用变量
  • 多线程同步
  • 第159天:安全开发-Python-协议库爆破FTPSSHRedisSMTPMYSQL等
  • 软件测试 | APP测试 —— Appium 的环境搭建及工具安装教程
  • 计算机人工智能前沿进展-大语言模型方向-2024-09-13