当前位置: 首页 > news >正文

微信公众号历史文章采集教程思路

大家好,我是淘小白!

今天来说下微信公众号历史记录文章采集的教程和思路,希望能够帮助的到大家~

1、历史消息入口 

现在新版本的微信已经找不到历史记录的入口了,需要对这个入口进行拼接,方法如下:

随便找一篇作者的文章,浏览器中打开,查看源代码:

提取这个字段,拼接成下面的网址;

https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=Mzg4MDk0NzA3Mg==&scene=124#wechat_redirect

biz=后面的就是我们需要替换的字段;

现在我们提取到这个历史记录的链接了,然后再继续往下操作。

2、把拼接好的链接发给任意好友,或者发给文件传输助手

3、打开链接查看是否是历史文章页面

4、进入到这个页面往下拉,我们可以看到是历史文章页面,那么下面我们就需要对这个页面进行抓包了

5、使用的工具是fiddler,fiddler需要进行简单的设置,安装一下证书

fiddler可以正常抓包之后,然后我们下拉微信公众号的历史记录页面,会得到下面的抓包数据。

6、抓包

 这样我们就可以看到列表页,和列表页数据下面的内容页网址了

如下图所示:

文章页网址数据:

提取到文章页的网址之后,就是内容的采集了在,这里就不做详细的介绍了。

7、注意事项:

7.1微信历史文章的列表页是有时效性的,失效了就得抓包

7.2在采集的时候,注意使用微信客户端的请求头和cookie

7.3fiddler要好好设置一下,不懂设置的,可能会报443,设置好之后,就可以正常抓包了,不懂的可以百度一下

7.4这里只是给大家写一个思路,按照这个思路来写就可以了。

http://www.lryc.cn/news/227238.html

相关文章:

  • 大模型应用--prompt工程实践
  • 新零售时代,传统便利店如何转型?
  • openEuler 系统使用 Docker Compose 容器化部署 Redis Cluster 集群
  • C# ZXing 二维码,条形码生成与识别
  • [vim]Python编写插件学习笔记1 - 开始
  • 深入理解JVM虚拟机第二十篇:静态变量和局部变量的对比以及栈帧对垃圾回收的意义以及JVM中栈帧与堆内对象的应用关系图示
  • 【计算机网络基础实验】实验二 有线IP互通网络实践
  • 【Orangepi Zero2 全志H616】驱动串口实现Tik Tok—VUI(语音交互)
  • 【Spring】静态代理
  • tomcat web.xml文件中servlet的load-on-startup
  • 记chrome打不开网址,无法搜索问题
  • Spring面试题:(五)Spring注解开发@Component,@Autowired,@Bean,@Configuration
  • 【Qt-23】ui界面设计-ToolBar
  • nodejs 异步架构
  • 腾讯云优惠券介绍、作用、领取方法及使用教程
  • 浅谈智能变电站自动化系统的应用与产品选型
  • 适用于初学者的 .NET MAUI
  • Web3项目灵魂所在之智能合约编写(Web3项目一实战之二)
  • python-jupyter实现OpenAi语音对话聊天
  • 恒源云之oss上传数据、云台下载数据
  • 大数据-之LibrA数据库系统告警处理(ALM-12039 GaussDB主备数据不同步)
  • 【左程云算法全讲6】链表相关
  • 从HDFS到对象存储,抛弃Hadoop,数据湖才能重获新生?
  • 灰度与二值化
  • No183.精选前端面试题,享受每天的挑战和学习
  • [C国演义] 第十八章
  • 发送失败的RocktMQ消息,你遇到过吗?
  • Unity中全局光照GI的总结
  • 毫米波雷达技术在自动驾驶中的关键作用:安全、精准、无可替代
  • Jetson平台180度鱼眼相机畸变校正调试记录