当前位置: 首页 > news >正文

利用python脚本,根据词条爬取百度图片(爬虫)

把广角,换成你的关键词就行


# -*- coding: utf-8 -*-
"""
Created on Wed Mar 29 10:17:50 2023
@author: MatpyMaster
"""
import requests
import os
import redef get_images_from_baidu(keyword, page_num, save_dir):header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}# 请求的 urlurl = 'https://image.baidu.com/search/acjson?'n = 0for pn in range(0, 30 * page_num, 30):# 请求参数param = {'tn': 'resultjson_com','logid': '7603311155072595725','ipn': 'rj','ct': 201326592,'is': '','fp': 'result','queryWord': keyword,'cl': 2,'lm': -1,'ie': 'utf-8','oe': 'utf-8','adpicid': '','st': -1,'z': '','ic': '','hd': '','latest': '','copyright': '','word': keyword,'s': '','se': '','tab': '','width': '','height': '','face': 0,'istype': 2,'qc': '','nc': '1','fr': '','expermode': '','force': '','cg': '',    # 这个参数没公开,但是不可少'pn': pn,    # 显示:30-60-90'rn': '30',  # 每页显示 30 条'gsm': '1e','1618827096642': ''}request = requests.get(url=url, headers=header, params=param)if request.status_code == 200:print('Request success.')request.encoding = 'utf-8'# 正则方式提取图片链接html = request.textimage_url_list = re.findall('"thumbURL":"(.*?)",', html, re.S)if not os.path.exists(save_dir):os.makedirs(save_dir)for image_url in image_url_list:image_data = requests.get(url=image_url, headers=header).contentwith open(os.path.join(save_dir, f'{n:06d}.jpg'), 'wb') as fp:fp.write(image_data)n = n + 1
if __name__ == "__main__":keyword = '广角'page_num = 1page_num = int(page_num)save_dir = '.\\图片\\'+keywordget_images_from_baidu(keyword, page_num, save_dir)

http://www.lryc.cn/news/328345.html

相关文章:

  • java复原IP 地址(力扣Leetcode93)
  • k8s的创建资源的流程图
  • Android RecyclerView 滑动后选中的条目居中显示
  • RPA-财务对账邮件应用自动化(客户对账机器人)
  • Delphi模式编程
  • flutter 自定义弹窗封装弹窗----在弹窗内实现部分窗体生命周期
  • go语言 私用仓库包下载
  • Math类
  • Git 入门教程
  • Linux网络配置(超详细)
  • [自研开源] 数据集成之分批传输 v0.7
  • 用 AI 编程-释放ChatGPT的力量
  • 【快速解决】解决谷歌自动更新的问题,禁止谷歌自动更新,如何防止chrome自动升级 chrome浏览器禁止自动升级设置方法
  • 【Leetcode每日一题】模拟 - 替换所有的问号(难度⭐)(42)
  • 再见 mysql_upgrade
  • .NET Core教程:入门与实践实例
  • docker环境配置过程中的常见问题
  • 精选2024年最佳项目管理系统!实用推荐与详细评测
  • 民航电子数据库:CAEMigrator迁移数据库时总是卡死
  • 数据结构 第6章 图(一轮习题总结)
  • 如何在智能交通系统中使用物联网技术提高道路安全和效率
  • 七大 QC 工具图的定义与示例(看这篇就够了)
  • 【JavaScript算法】DOM树层级显示
  • MySql实战--全局锁和表锁 :给表加个字段怎么有这么多阻碍
  • axios请求类型是文件流怎么显示报错信息
  • DataX 源码改造支持Mysql 8.X
  • 大数据学习-2024/3/29-oracle使用介绍
  • Vim - 文本编辑器 Vi vs Vim
  • SpringBoot 登录认证(二)
  • C#语言规范及特殊用法笔记