当前位置: 首页 > news >正文

Python语言一键整理xhs评论 基于github的开源项目 MediaCrawler

数码博客日志:用Python与MediaCrawler实现xhs评论一键整理

博主的PC系统是Windows,已经提前部署好了Anaconda、Python等开发环境,并安装了Pycharm。

虽然博主对Python知识仅有一些基础了解,但在几个小时内成功实现了一键整理xhs特定帖子的评论。

步骤 1:安装Nodejs

首先,博主安装了Nodejs,并将其部署到系统环境中。这个步骤为接下来的项目部署提供了必要的环境支持。

步骤 2:部署GitHub上的开源项目 - MediaCrawler

接着,博主通过Powershell部署了GitHub上的开源项目MediaCrawler,这个工具能够帮助抓取并整理xhs上的帖子和评论内容。

步骤 3:调整项目代码

在本地项目文件夹中,博主进入到项目的根目录,并根据需要对关键代码文件进行了一些调整。特别是修改了base_config.pyxhs_config.py文件,以便能够灵活地检索和整理评论数据。

步骤 4:运行项目并整理评论

在文件夹地址栏输入cmd,按回车键后打开命令行窗口,输入以下代码即可开始整理评论并导出为Excel文件:

示例1:关键词检索

base_config.py文件中设定检索的关键词,使用如下命令进行检索:

python main.py --platform xhs --lt qrcode --type search

示例2:整理特定帖子的评论

xhs_config.py中输入xhs帖子的链接,然后执行命令来整理该帖子的评论:

python main.py --platform xhs --lt qrcode --type detail

注意事项

以上内容仅用于个人查询和学习参考。请勿过度使用或用于商业目的。

通过简单的调整和部署,博主成功利用Python和MediaCrawler工具整理了xhs的评论数据。即使对于Python的掌握程度仅限于基础,通过开源项目和调试代码,依然可以在短时间内实现自己的需求。

http://www.lryc.cn/news/622951.html

相关文章:

  • MySQL 全文索引指南
  • Spring框架(AOP)
  • “openfeign“调用接口上传文件报错:Failed to deleted temporary file used for part [file]
  • 博士招生 | 香港大学 机器增强认知实验室 招收博士生/实习生/访问学生
  • 安卓11 12系统修改定制化_____修改系统默认域名解析规则 实现屏蔽广告 屏蔽应用更新等功能
  • CVE-2021-4300漏洞复现
  • css实现圆角+边框渐变+背景半透明
  • Camera相机人脸识别系列专题分析之十九:MTK ISP6S平台FDNode原生代码
  • 34 HTB Cat 机器 - 中等难度
  • Three.js三大组件:场景(Scene)、相机(Camera)、渲染器(Renderer)
  • GitHub PR 提交流程
  • 防火墙虚拟系统配置实验
  • 平滑方法(smoothing)
  • SpringBoot自动配置原理(二)
  • 算法训练营day53 图论④ 110.字符串接龙、105.有向图的完全可达性、106.岛屿的周长
  • 记与客户端的一次“无谓之争”
  • 算法训练营day52 图论③ 101.孤岛的总面积、102.沉没孤岛、103.水流问题、104.建造最大岛屿
  • UniApp 页面传参方式详解
  • 数据结构——单链表oj(续)
  • RK3568 NPU RKNN(五):RKNN-ToolKit-lite2板端推理
  • 企业级Java项目金融应用领域——银行系统(补充)
  • 小白挑战一周上架元服务——元服务开发06
  • 24. async await 原理是什么,会编译成什么
  • 硬核北京 | 2025世界机器人大会“破圈”,工业智能、康养科技…… 亦庄上演“机器人总动员”
  • 石头科技披露半年报:营收79.03亿元,同比大增78.96%
  • 5 索引的操作
  • 强化学习入门教程(附学习文档)
  • 我的世界Java版1.21.4的Fabric模组开发教程(十九)自定义生物群系
  • 小迪安全v2023学习笔记(六十三讲)—— JS加密断点调试
  • 【图论】分层图 / 拆点