当前位置: 首页 > news >正文

macos 使用vscode 开发python 爬虫(开发二)

以下是一个示例,用于爬取一个公开的示例网站(http://books.toscrape.com),并提取书籍的标题和价格:

import requests
from bs4 import BeautifulSoup# 发起请求并获取网页内容
url = '可以用上面的链接🔗'
response = requests.get(url)
html_content = response.text# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(html_content, 'html.parser')# 提取书籍标题和价格
books = soup.find_all('article', class_='product_pod')for book in books:title = book.h3.a['title']price = book.find('p', class_='price_color').textprint('书名:', title)print('价格:', price)print('---')

这个示例使用了一个公开的书籍网站(http://books.toscrape.com),通过发送HTTP请求获取网页内容,并使用BeautifulSoup解析网页内容。然后,它找到所有的书籍信息,并提取书名和价格,并将它们打印出来。

运行脚本

python spider.py

请确保你已经安装了所需的Python库(requests和beautifulsoup4)以及它们的依赖项。你可以使用以下命令来安装这些库:

pip install requests beautifulsoup4

如果想要图片

print("Runoob")import requests
from bs4 import BeautifulSoup# 发起请求并获取网页内容
url = '可以用上面的链接🔗'
response = requests.get(url)
html_content = response.text# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(html_content, 'html.parser')# 提取书籍标题和价格
books = soup.find_all('article', class_='product_pod')for book in books:img_element = book.find('img', class_='thumbnail')img_url = img_element.get('src')title = book.h3.a['title']price = book.find('p', class_='price_color').textprint('图片:', img_url)print('书名:', title)print('价格:', price)print('---')
http://www.lryc.cn/news/127902.html

相关文章:

  • (已解决)redis.get报错com.alibaba.fastjson.JSONException: autoType is not support
  • 控价可以这样做
  • Spring学习笔记之Spring IoC注解式开发
  • C语言入门教程,C语言学习教程(非常详细)第二章 c语言初探
  • HOT99-下一个排列
  • JAVA基础知识(二)——程序流程控制
  • mysql知识点+面试总结
  • 前端大屏常用的适配方案
  • 技术债 笔记
  • 【Leetcode】102.二叉树的层序遍历
  • 上传文件报413Request EntityToo Large错误解决办法
  • Neo4j之MERGE基础
  • AbstractRoutingDataSource,spring配置多数据源问题
  • 日常BUG—— SpringBoot项目DEBUG模式启动慢、卡死。
  • Linux网络编程(TCP状态转换关系)
  • tauri-vue:快速开发跨平台软件的架子,支持自定义头部UI拖拽移动和窗口阴影效果
  • 做好以下几点,可以让我们延长周末体验感,好好放松!!!
  • Python 学习笔记——代码基础
  • Android Studio 无法正常导入项目
  • Grafana+Prometheus技术文档-进阶使用-监控spring-boot项目
  • PG常用SQL
  • 分模块开发的意义及开发步骤
  • vue-router中的一些 API
  • go-zero 是如何实现令牌桶限流的?
  • Oracle/PL/SQL奇技淫巧之ROWNUM伪列
  • “MongoDB基础知识【超详细】
  • 腾讯24届校招内推
  • 星际争霸之小霸王之小蜜蜂(二)--类的使用
  • AndroidStudio升级Gradle之坑
  • C# int ? 关键字使用方法