当前位置: 首页 > news >正文

python_BeautifulSoup爬取汽车评论数据

爬取的网站:

完整代码在文章末尾

https://koubei.16888.com/57233/0-0-0-2

使用方法: 

from bs4 import BeautifulSoup

拿到html后使用find_all()拿到文本数据,下图可见,数据标签为:

content_text = soup.find_all('span', class_='show_dp f_r')

 因为优点,缺点,综述的classname一样,所以写了个小分类:

   for index,x in enumerate(content_text):if index % 3 == 0:with open("car_post.txt", "a", encoding='utf-8') as f:f.write(x.text+"\n")elif index % 3 == 1:with open("car_nev.txt", "a", encoding='utf-8') as f:f.write(x.text+"\n")else:with open("car_text.txt", "a", encoding='utf-8') as f:f.write(x.text+"\n")

结果预览 

 

消极: 

 积极:

 综述:

 

完整代码 

from bs4 import BeautifulSoup
import requests
for j in range(1,300):url="https://koubei.16888.com/57233/0-0-0-{}".format(j)headers={"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36 Edg/107.0.1418.35"}resp=requests.get(url,headers=headers)resp.encoding="utf-8"soup=BeautifulSoup(resp.text,"html.parser")content_text = soup.find_all('span', class_='show_dp f_r')for index,x in enumerate(content_text):if index % 3 == 0:with open("car_post.txt", "a", encoding='utf-8') as f:f.write(x.text+"\n")elif index % 3 == 1:with open("car_nev.txt", "a", encoding='utf-8') as f:f.write(x.text+"\n")else:with open("car_text.txt", "a", encoding='utf-8') as f:f.write(x.text+"\n")print(j)

 

http://www.lryc.cn/news/323690.html

相关文章:

  • 24.2 SpringCloud电商进阶开发
  • ES6—Module 的语法
  • GitHub gpg体验
  • 鸿蒙一次开发,多端部署(十一)交互归一
  • 基于python+vue文学名著分享系统的设计与实现flask-django-nodejs-php
  • [音视频学习笔记]七、自制音视频播放器Part2 - VS + Qt +FFmpeg 写一个简单的视频播放器
  • LeetCode每日一题——x 的平方根
  • 2024.3.22 ARM
  • 【Linux】信号的处理{信号处理的时机/了解寄存器/内核态与用户态/信号操作函数}
  • webgl浏览器渲染设置
  • 【国家计算机二级C语言】高分笔记
  • Java项目:71 ssm基于ssm+vue的外卖点餐系统+vue
  • Alibaba spring cloud Dubbo使用(基于Zookeeper或者基于Nacos+泛化调用完整代码一键启动)
  • Word为图表设置图注并在图表清单中自动生成
  • 新建maven项目中遇到的问题
  • 【剑指offer】24. 机器人的运动范围(java选手)
  • CMU 10-414/714: Deep Learning Systems --hw3
  • 前端小白的学习之路(lessscss)
  • 算法体系-15 第十五节:贪心算法(下)
  • 2.10 模型评估的方法有哪些?优缺点
  • Linux centos7安装nginx-1.24.0并且实现自启动
  • 001-Windows下PyTorch极简开发环境配置(上)
  • 分布式Raft原理详解,从不同角色视角分析相关状态
  • 大数据的实时计算和离线计算你理解吗?
  • OS Package Manager
  • 【滑动窗口、矩阵】算法例题
  • 【事务】开发用到的事务,TransactionDefinition实例详解,事务的传播机制
  • Linux信号处理
  • nuclei使用方法
  • 【并查集专题】【蓝桥杯备考训练】:网络分析、奶酪、合并集合、连通块中点的数量、格子游戏【已更新完成】