当前位置: 首页 > news >正文

Web爬虫-edu_SRC-目标列表爬取

免责声明:本文仅做技术交流与学习...

爬取后,结合暗黑搜索引擎等等进行进一步搜索.

edu_src.py

import requests, time
from bs4 import BeautifulSoup
for i in range(1, 20):url = f'https://src.sjtu.edu.cn/rank/firm/0/?page={i}'print(f"正在获取第{i}页数据")s = requests.get(url).text# print(s)soup = BeautifulSoup(s, 'html.parser')edu1 = soup.find_all('tr')# print(edu1)for edu in edu1:try:edu_name = edu.a.text# print(edu_name)with open('edu_name.txt', 'a+',encoding='utf-8') as f:f.write(edu_name + '\n')except:passprint(f"{i}页已经写入!!!")

http://www.lryc.cn/news/377542.html

相关文章:

  • 云原生周刊:Harbor v2.11 版本发布 | 2024.6.17
  • 低版本火狐浏览器报错:class is a reserved identifier
  • 掌握高等数学、线性代数、概率论所需数学知识及标题建议
  • value_and_grad
  • AI 已经在污染互联网了。。赛博喂屎成为现实
  • Linux系统安装ODBC驱动,统信服务器E版安装psqlodbc方法
  • 品牌对电商平台价格的监测流程
  • osgearth提示“simple.earth: file not handled”
  • hbuilderx如何打包ios app,如何生成证书
  • 扩散模型荣获CVPR2024最佳论文奖,最新成果让评估和改进生成模型更加效率!
  • 通过CSS样式来禁用href
  • 汽车传动系统为汽车动力总成重要组成部分 我国市场参与者数量不断增长
  • 智慧校园软件解决方案:提升学校管理效率的最佳选择
  • 数据结构之B数
  • 计算机基础必须知道的76个常识!沈阳计算机软件培训
  • 7,KQM模块的驱动
  • 软件验收测试报告模版分享,如何获取专业的验收测试报告?
  • 【arm扩容】docker load -i tar包 空间不足
  • 基于PID的直流电机自动控制系统的设计【MATLAB】
  • MySQL----事务
  • 客观评价,可道云teamOS搭建的企业网盘,如Windows本地电脑一般的使用体验真的蛮不错
  • 当页面中有多个echarts图表的时候,resize不生效的修改方法
  • connect-caption-and-trace——用于共同建模图像、文本和人类凝视轨迹预测
  • iOS API方法弃用警告说明及添加
  • canvas绘制红绿灯路口(二)
  • Semantic Kernel 直接调用本地大模型与阿里云灵积 DashScope
  • 【人工智能】深度解读 ChatGPT基本原理
  • 【教程】2024年如何快速提取爆款视频的视频文案?
  • 【MySQL连接器(Python)指南】02-MySQL连接器(Python)版本与实现
  • Vim入门教程