当前位置: 首页 > news >正文

【python爬虫】获取某一个网址下面抓取所有的a 超链接下面的内容

import requests as rq
from bs4 import BeautifulSoup as bs
import re# rooturl是传的是我需要查询和抓取的一个网址,可以是html js 等
def gethtml(rooturl, encoding="utf-8"):#默认解码方式utf-8response = rq.get(rooturl)response.encoding = encoding
#  .text是返回网页的源代码html = response.text
#    print(html)return html #返回链接的html内容# 然后将html 传给gethref()方法
def getherf(html):# 使用BeautifulSoup函数解析传入的htmlsoup = bs(html, features="lxml")
#  解析后用soup.find_all("a")找所有的a标签allnode_of_a = soup.find_all("a")
# 遍历a里面的hrefresult = [_.get("href") for _ in allnode_of_a]
# 输出resultprint(result)return result

request bs4  都需要进行安装 pip install request   pip install bs4

BeautifulSoup()函数返回的是一个解析过的对象,相当于把你的html文本做了处理;
调用这个解析过的对象的find_all()方法,即返回一个该html中 所有的a节点组成的列表;
再对表中每一个节点调用get()方法,获得该节点下"herf"标签(键)的所有值,也就是我们的要找“http://”打头的超链接了;

在前端html中 a 标签一般是这样体现的

html = gethtml('XXXX')

这里xxx指的是你爬取内容的网址(某个html 或者某个js)等文件都可以

最后爬出来我写的一个超链接了:

我的代码是参考是原博主的,他写的很详细,也解释的很清楚,建议大家看看原博主的文章

参考原文:

Python爬虫-获得某一链接下的所有超链接_pychram 找出页面中的所有链接元素_ywsdxxzj的博客-CSDN博客

http://www.lryc.cn/news/109220.html

相关文章:

  • AutoDL从0到1搭建stable-diffusion-webui
  • 手动调整broker扩容后的旧topic分区
  • 【LeetCode-简单】剑指 Offer 25. 合并两个排序的链表(详解)
  • Java版工程行业管理系统源码-专业的工程管理软件-em提供一站式服务
  • 【Spring】简化事件的使用,Spring提供了2种使用方式
  • 探究Spring事务:了解失效场景及应对策略
  • Maven Manifold 条件编译
  • 4.数组与基本数学函数
  • python与深度学习(十六):CNN和宝可梦模型二
  • PTA 1030 Travel Plan
  • MFC、Qt、WPF?该用哪个?
  • 使用logback记录日志
  • 企业工程项目管理系统源码(三控:进度组织、质量安全、预算资金成本、二平台:招采、设计管理) em
  • 【安装】XMind2022XMind2020安装教程(资源)
  • Windows下QT Creator安装MinGW 32bit编译器
  • Emacs之解决键值绑定冲突问题(一百二十三)
  • 瞄准产业应用,大模型加持的深兰科技AI虚拟数字人落地业务场景
  • 【网络基础进阶之路】基于MGRE多点协议的实战详解
  • Spark、RDD、Hive 、Hadoop-Hive 和传统关系型数据库区别
  • [运维]python 启用http 文件服务
  • electron-builder 打包 exe 异常错误集锦
  • 14-5_Qt 5.9 C++开发指南_基于HTTP 协议的网络应用程序
  • Kotlin委托
  • 分布式协议与算法——CAP理论、ACID理论、BASE理论
  • 接口测试 Jmeter 接口测试 —— 请求 Headers 与传参方式
  • 【redis】redis部署1主2从3哨兵demo搭建示例
  • C++数据结构之平衡二叉搜索树(一)——AVL的实现(zig-zag/左右双旋/3+4重构)
  • 免疫疗法勘察兵——DC细胞
  • Django实现音乐网站 ⑷
  • 2023年华数杯数学建模C题思路 - 母亲身心健康对婴儿成长的影响