当前位置: 首页 > news >正文

【python】爬虫

下载与批量下载

import requests
#第三方库,没有下载的下载一下 pip install requests#爬虫下载图片
res=requests.get("url")
print(res.content)#二进制字节流#写文件
with open("beauty.jpg","wb")as f:f.write(res.content)#批量下载短视频
headers={...}
params={...}
res=requests.get("url/post/",params=params,headers=headers)
print(res.json())
#只拿想要的
data=res.json().get(key)
video_urls=[data.get("desc"),data.get('video').get('play_addr').get('url_list')for item in data]for title,url in video_urls:res=requests.get(url)with open(f"./document/{title}.mp4","wb")as f:f.write(res.contnt)print('ok')

获取url的小技巧:
点击下载,查看网络中的请求GET的url拿过来即可

代码转换网站 转换成爬虫代码
在这里插入图片描述

openpyxl库

读写操作excel文件(.xlsx格式)

pip install openpyxlimport openpyxl
#file
workbook=openpyxl.load_workbook('name.xlsx')
#sheet
sheet=workbook['Sheet']
#单元格
value=sheet['A1'].value
sheet['C2'].value='666'
#save
workbook.save('name.xlsx')#create
workbook=openpyxl.Workbook()
sheet=workbook.active#获取默认工作表
sheet.append([1,2,3,4,5,7,6,8,9])#写入一行数据for i in range(100):#多行sheet.append([i,i+1,2,3,4,5,7,6,8,9])
#save
workbook.save('new_name.xlsx')

实战:爬数据写入excel

检查->网络->创建一个请求->复制cURL

找一个网站

import requests
import openpyxl
cookies={...}
headers={...}
response=requests.get('url?r=0&count=10&categories=%70....',cookies=cookies,headers=headers,
)
#url中常有count=10,可修改成想获取的条数
print(response.text)
print(response.json())data=response.json().get("items")
for item in data:if(item.get('type')=='a'):title=item.get("title")count=item.get("rating").get("count")#save to excel
#create
workbook=openpyxl.Workbook()
sheet=workbook.active#获取默认工作表for...#多行写入data
#save
workbook.save('new_name.xlsx')

在这里插入图片描述

http://www.lryc.cn/news/472568.html

相关文章:

  • 大语言模型数据类型与环境安装(llama3模型)
  • JS:列表操作
  • ECharts 折线图 / 柱状图 ,通用配置标注示例
  • 统计数据集的TXT、XML及JSON标注文件中各类别/每个标签的数量
  • Facebook登录客户追踪:了解用户访问路径,优化客户体验
  • NUUO摄像头 debugging_center_utils 远程命令执行漏洞复现
  • Nginx 的讲解和案例示范
  • 微信小程序元素水平居中或垂直居中
  • ClickHouse 神助攻:纽约城市公共交通管理(MTA)数据应用挑战赛
  • ELK + Filebeat + Spring Boot:日志分析入门与实践(二)
  • 使用 Docker Compose 将数据版 LobeChat 服务端部署
  • python如何完成金融领域的数据分析,思路以及常见的做法是什么?
  • 密码管理工具实现
  • 构造函数和new操作符 - 2024最新版前端秋招面试短期突击面试题【100道】
  • 6.Linux按键驱动-阻塞与非阻塞
  • Mac打开环境变量配置文件,source ~/.zshrc无法打开问题解决
  • 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-23
  • 【C#】搭建环境之CSharp+OpenCV
  • 100种算法【Python版】第25篇——Bidirectional Search算法
  • WebSocket与Socket
  • Python 3 维护有序列表 bisect
  • vue版本太低无法执行vue ui命令
  • 数据结构 之 二叉树的遍历------先根遍历(五)
  • Xss_less靶场攻略(1-18)
  • 【AI语音克隆整合包及教程】声临其境,让想象成为现实——第二代GPT-SoVITS引领语音克隆新时代!
  • echarts属性之dataZoom
  • SQLite 语法
  • 逗号运算符应用举例
  • Android 玩机知识储备
  • MyBatis 学习记录(六)之逆向工程