当前位置: 首页 > news >正文

【爬虫】某某查cookie逆向

代码仅供技术人员进行学习和研究使用,请勿将其用于非法用途或以任何方式窃取第三方数据。使用该代码产生的所有风险均由用户自行承担,作者不对用户因使用该代码而造成的任何损失或损害承担任何责任。

加密参数

加密参数主要是cookie,其中只有三个cookie最重要,BAIDUID BAIDUID_BFESS 和一个ab开头的cookie

cookie获取

BAIDUID和BAIDUID_BFESS在访问百度系的产品时会由服务器返回,可以通过访问百度搜索引擎或者网站的首页进行获取,建议使用Session

ab开头的cookie

这个ab开头的cookie是绑定了你的UA的,所以不能用同一个cookie而使用不同的UA,UA和cookie和必须绑定

    def get_cookie(self, baidu_id, user_agent):s = '{}AIA{}'.format(user_agent, baidu_id)m = hashlib.md5(s.encode())a = m.hexdigest()time_str = str(time.time()).replace('.', '')[:13]i = a + time_strJS1 = '''function a () { return "ab" + ("" + +new Date((new Date).getFullYear(),(new Date).getMonth(),(new Date).getDate(),(new Date).getHours())).substring(0, 9)}'''JS2 = '''function a (i) {s = [i[0], i[1], i.substring(2, i.length - 2), i[i.length - 2], i[i.length - 1]]o = s[0] + s[3] + s[2] + s[1] + s[4]return o}'''ctx1 = execjs.compile(JS1)ABname = ctx1.eval('a()')ctx2 = execjs.compile(JS2)ABvaule = ctx2.call('a', i)return {'BAIDUID': baidu_id,str(ABname): ABvaule,'BAIDUID_BFESS': baidu_id,}

通过这个cookie的生成逻辑可以看出他的值是由UA组成的 然后进行了MD5再进行了一些移位操作。
到现在网站需要的三个cookie已经全部拿到了

JA3指纹

到这里,其实代理IP的质量高一些,已经可以进行正常的采集,但是大多数情况下会出现采集一段时间后会疯狂的出现302跳转到旋转滑块,这是因为他检测了我们的JA3指纹

JA3指纹绕过

关于JA3指纹绕过可以看一下我之前的文章
python JA3指纹绕过

最后的一些思路

1、可以为BAIDUID搭建一个cookie池
2、不知道BAIDUID是否在服务端绑定了IP,即便突破了JA3还是会出现一些验证的情况

http://www.lryc.cn/news/522186.html

相关文章:

  • 【进程与线程】进程的状态
  • 阻塞赋值和非阻塞赋值
  • Maven在Win10上的安装教程
  • 攻防世界_SQL注入
  • Ruby语言的数据结构
  • Jmeter配置服务代理器 Proxy(二)
  • Spring Boot 中实现 WebSocket 的方式
  • C语言初阶习题【29】杨氏矩阵
  • [操作系统] 深入理解操作系统的概念及定位
  • Java中对list数据进行手动分页(可直接复用版)
  • 【HarmonyOS NEXT】鸿蒙跳转华为应用市场目标APP下载页
  • 《研发管理 APQP 软件系统》——汽车电子行业的应用收益分析
  • 【IDEA 2024】学习笔记--文件选项卡
  • Android SystemUI——服务启动流程(二)
  • iOS - 内存对齐
  • 小游戏前端地区获取
  • AIGC时代:如何快速搞定Spring Boot+Vue全栈开发
  • MDX语言的多线程编程
  • Vue.js组件开发-实现输入框与筛选逻辑
  • 配置Allure环境变量【macOS版】
  • AndroidStudio升级到2024.2.2项目AGP升级8.8.0版本记录
  • Require:利用MySQL binlog实现闪回操作
  • 计算机网络 (40)域名系统DNS
  • UE5游戏性能优化指南
  • Gitlab Runner安装与配置
  • 如何有效防止和解决IP劫持问题
  • 2006-2020年各省人均水资源量数据
  • C++基础入门(二)
  • 互联网架构困境:网络与信息安全
  • HIVE技术