当前位置: 首页 > news >正文

python爬虫521

爬虫521

    • 记录

记录

最近想学爬虫,尝试爬取自己账号下的文章标题做个词云
csdn有反爬机制 原理我就不说啦 大家都写了
看到大家结果是加cookie
但是我加了还是521报错
尝试再加了referer 就成功了(╹▽╹)

import matplotlib
import requests
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import jieba# 定义URL和请求头
url = 'https://blog.csdn.net/community/home-api/v1/get-business-list?page=1&size=40&businessType=blog&orderby=&noMore=false&year=&month=&username=PUTAOAO'headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36',
'Cookie':'cookie',
'Referer':'https://blog.csdn.net/PUTAOAO?type=blog'}# 发送GET请求
response = requests.get(url, headers=headers)# 检查响应状态码
if response.status_code == 200:# 转换响应内容为JSON格式re=response.json()# 获取评论列表ll = re['data']['list']print(ll)# 初始化内容列表content = []# 遍历评论列表,提取内容并添加到内容列表for l in ll:content.append(l['title'])# 合并所有评论内容为一个字符串full_content = ' '.join(content)print(full_content)# 生成词云wc = WordCloud(font_path='C:\Windows\Fonts\STXINGKA.TTF',width=800, height=600, mode="RGBA", background_color='white').generate(full_content)# 显示词云plt.imshow(wc, interpolation='bilinear')plt.axis('off')plt.show()
else:print(f"请求失败,状态码:{response.status_code}")

在这里插入图片描述

http://www.lryc.cn/news/430357.html

相关文章:

  • CSS中flex:1是什么属性
  • 网络硬件升级指南:提升性能的策略与实践
  • XSS-过滤特殊符号的正则绕过
  • CocosCreator3.8 IOS 构建插屏无法去除的解决方案
  • Linux软件编程---数据库
  • Spring 源码解读专栏:从零到一深度掌握 Spring 框架
  • 帆软-秋招提前批-笔试
  • 嵌入式AI快速入门课程-K510篇 (第七篇 系统BSP开发)
  • 代码随想录算法训练营day52:图03:101. 孤岛的总面积;102. 沉没孤岛;103. 水流问题
  • 开源大模型本地私有化部署
  • 站长为什么要搭建个人博客网站
  • Golang | Leetcode Golang题解之第355题设计推特
  • Redis如何实现发布/订阅?
  • EmguCV学习笔记 VB.Net 4.4 图像形态学
  • HarmonyOS 开发
  • 拒绝拖延!Kimi助你一天内速成论文初稿!
  • Python画笔案例-005 绘制迷宫
  • 【鸿蒙学习】HarmonyOS应用开发者高级认证 - 应用性能优化二(代码层面)
  • 【Docker】如何将A机器内的镜像,导入到B机器?
  • 动手实现基于Reactor模型的高并发Web服务器(一):epoll+多线程版本
  • 爬虫案例4——爬取房天下数据
  • 网络硬盘录像机NVR程序源码NVR全套运用方案
  • 03:电容的充放电特性及应用举例
  • 【专题】2023-2024中国游戏企业研发竞争力报告合集PDF分享(附原数据表)
  • 会话跟踪方案:Cookie Session Token
  • jemeter压力测试入门
  • SpringBoot3 简单集成 Spring AI 并使用
  • 【C/C++】程序设计基础知识(数据类型与表达式、控制语句、数组与结构)
  • python库——sklearn的关键组件和参数设置
  • CAS-ViT实战:使用CAS-ViT实现图像分类任务(一)