当前位置: 首页 > news >正文

Python程序员看见一个好看的手机壁纸网站,开撸!

人生苦短,我用python

最近好像没什么大事,

.那就采集一下小——姐——姐————看下吧~

python 安装包+资料:点击此处跳转文末名片获取

在这里插入图片描述

最近有同学的爬虫代码出了bug,给问我怎么改

在这里插入图片描述

于是就发现了这个好看的手机壁纸网站。

在这里插入图片描述

这个图片应该是违规的,放不出来的

看到那么多好看的壁纸,

我的pycharm已经饥渴难耐了(不是)

受害网址

在这里插入图片描述

python 安装包+资料:点击此处跳转文末名片获取
为了良性爬取,
这个代码就不完整的展示出来了

部分爬虫代码

导入工具

from urllib import parse
import requests
import parsel
import re

解析网站,爬取数据

for page in range(1, 10):print('正在爬取第{}页壁纸'.format(page))url = 'http://#### /tag/{}/page/{}/'.format(name, page)headers = {'Cookie': 'UM_distinctid=1747c5616688f-0da459aa281e74-3962420d-1fa400-1747c56166982d; CNZZDATA1278590218=744878758-1599811024-%7C1599811024','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}response = requests.get(url=url, headers=headers)selector = parsel.Selector(response.text)img_url = selector.css('#main a::attr(href)').getall()

设置爬取类目

string = input('请输入你要爬取的类目:')
name = parse.unquote(string)

保存图片

        path = 'C:\\Users\\Administrator\\Desktop\\手机壁纸\\' + new_title + '.jpg'with open(path, mode='wb') as f:f.write(data_response.content)print(title)

运行代码,效果如下图

python 安装包+资料:点击此处跳转文末名片获取

在这里插入图片描述

最后放两张好看的图片~

咳咳…今天的文章就是这样啦!

我绝对没有在水!!!

在这里插入图片描述在这里插入图片描述


👇问题解答 · 源码获取 · 技术交流 · 抱团学习请联系👇

http://www.lryc.cn/news/41783.html

相关文章:

  • 浏览器工作原理
  • 对在使用容器HashSet存放自定义对象时重写其类的hashcode和equals方法的几点认识
  • Java集群:单体架构升级到集群架构(二)实现session共享
  • MySQL索引及索引失效的分析(MySQL8.0.19)
  • 第一个 Django 应用
  • 001-ksum 求符合条件的 k 个数 1. Two Sum/15. 3Sum/18. 4Sum/
  • Nginx学习笔记(三)Linux环境下Nginx的安装和部署
  • 【十二天学java】day05--数组和循环高级
  • 用队列实现栈和用栈实现队列(C 语言)
  • albedo开源框架配置多数据源
  • 22张图带你了解IP地址有什么作用
  • 121.Android 简单的人工智能聊天项目,chatAi,AI聊天项目,GPTAi
  • C++ this指针详解
  • CSS 实现六边形柱状图
  • 什么是推挽输出,开漏输出?
  • 【图像分割】Unet系列深度讲解(FCN、UNET、UNET++)
  • list底层的简单实现(万字长文详解!)
  • 学习Linux只要学会这个命令就够了!
  • javascript基础
  • 【游戏逆向】某游戏技能库分析
  • Pytorch深度学习常用预训练网络模型的下载地址
  • 毕业设计 基于51单片机自动智能浇花系统设计
  • 熟悉常用的 Linux 操作和 Hadoop 操作
  • Vue2项目总结-电商后台管理系统
  • 【二】一起算法---队列:STL queue、手写循环队列、双端队列和单调队列、优先队列
  • <Linux>环境变量
  • 【MySQL】下载(超详细教程)
  • 再探pytorch的Dataset和DataLoader
  • 【2023.3.18 美团校招】
  • 程序员必须知道的HTML常用代码有哪些?