当前位置: 首页 > news >正文

Python爬虫 | 爬取豆瓣电影Top250的数据

简单记录一下,实现爬取豆瓣电影Top 250的数据。
这里我使用requests库来发送HTTP请求,以及BeautifulSoup库来解析HTML页面。

1.安装requestsBeautifulSoup库。

如果没有安装,可以通过以下命令安装:

pip install requests beautifulsoup4

2.具体实现代码

import requests
from bs4 import BeautifulSoup# 豆瓣电影Top 250的URL
base_url = "https://movie.douban.com/top250"# 存储电影信息的列表
movies = []# 豆瓣电影Top 250有10页,每页25部电影
for i in range(10):# 构造每一页的URLurl = f"{base_url}{i * 25}"response = requests.get(url)soup = BeautifulSoup(response.text, 'html.parser')# 找到所有电影的容器items = soup.find_all('div', class_='item')for item in items:# 电影名title = item.find('span', class_='title').get_text()# 评分rating_num = item.find('span', class_='rating_num').get_text()# 评价人数rating_people = item.find('div', class_='star').find_all('span')[-1].get_text().strip('人评价')# 将电影信息存储为字典movie = {'title': title,'rating_num': rating_num,'rating_people': rating_people}movies.append(movie)# 打印电影信息
for movie in movies:print(f"电影名: {movie['title']}, 评分: {movie['rating_num']}, 评价人数: {movie['rating_people']}")

3.注意事项

请遵守豆瓣的使用条款和条件,不要过度请求豆瓣的服务器,以免给豆瓣造成不必要的负担。

http://www.lryc.cn/news/482476.html

相关文章:

  • mac 中python 安装mysqlclient 出现 ld: library ‘ssl‘ not found错误
  • 完全清除:苹果手机照片怎么彻底删除
  • 高德地图多个图片组成标点(自定义点标记内容)
  • 02-1_MVCC版本链清理
  • 探索Python视频处理的瑞士军刀:ffmpeg-python库
  • 进程间通信 - 通道
  • 华为数通HCIA系列第5次考试-【2024-46周-周一】
  • 【Linux】如何通过终端命令查看当前可用网络 WIFI + 设置已配置网络的连接优先级 + 连接/断连网络
  • 华为路由策略配置
  • Debezium日常分享系列之:异步 Debezium 嵌入式引擎
  • leetcode206. Reverse Linked List
  • 【MATLAB源码-第291期】基于matlab的AMI编码解码系统仿真,输出各个节点波形。
  • springboot苍穹外卖实战:十一:复盘总结
  • 基于Python的药房管理系统
  • chat2db数据库图形化工具
  • 弱口令整改方案:借助双因子认证加强账号密码安全
  • 动态代理的优势是什么?
  • 将大型语言模型(如GPT-4)微调用于文本续写任务
  • 引入了JUnit框架 却报错找不到:java.lang.ClassNotFoundException
  • 深度学习:tensor的定义与维度
  • 基于Python的膳食健康系统
  • FFmpeg 4.3 音视频-多路H265监控录放C++开发十三:将AVFrame转换成AVPacket。视频编码原理.编码相关api
  • 算法——移除元素(leetcode27)
  • 『OpenCV-Python』安装以及图像的读取、显示、保存
  • python开发桌面应用(跨平台) 全流程
  • el-table-column prop值根据数组获取
  • MySQL_聚合函数分组查询
  • PPT 制作神器!Markdown 轻松变幻灯片!
  • 一七八、Node.js PM2使用介绍
  • 基于CSU18M92芯片的蓝牙体重秤方案