当前位置：首页 > news >正文

【chromedriver编译-绕过selenium机器人检测】

news 2025/7/13 19:21:35

有小伙伴说使用selenium没能绕过机器人检测，盘他。
selenium机器人检测有2种，一是cdp检测，二是webdriver特征检测。cdp检测前面的博客已写过，这里就提下webdriver特征检测。

一、selenium简介

Selenium 是一个强大的工具，用于Web浏览器自动化，更常被用于爬虫。
但selenium需要通过webdriver来驱动chrome，每次运行selenium时，都要先找到对应版本的chromedriver.exe。
chromedriver自动化会对浏览器的部分属性进行修改，非常容易被识别为机器人。
pypeeteer却没有这种烦恼，它不需要中间驱动，所以还是建议大家使用pyppeteer。但如果你已经写了上万行selenium代码了，那还是编译一个驱动吧。

二、机器人识别网站

1.https://www.browserscan.net/bot-detection

在这里插入图片描述

2.https://fingerprintjs.github.io/BotD/main/

在这里插入图片描述

很明显，常规网站都能检测到selenium机器人。

三、检测原理

1：cdp检测，
cdp检测的原理一般是利用console.debug()函数来实现，当你打开consle控制台时，console.debug()才会真正的被调用。
一旦console.debug()函数被触发，我们就可以认定你打开了F12控制台。


<!DOCTYPE html>
<html><head><title>Detect Chrome DevTools Protocol</title><script>function genNum(e) {return 1000 * e.Math.random() | 0;}function catchCDP(e) {if (e.chrome) {var rng1 = 0;var rng2 = 1;var acc = rng1;var result = false;try {var errObj = new e.Error();var propertyDesc = {configurable: false,enumerable: false,get: function () {acc += rng2;return '';}};Object.defineProperty(errObj, "stack", propertyDesc);console.debug(errObj);errObj.stack;if (rng1 + rng2 != acc) {result = true;}} catch {}return result;}}function isCDPOn() {if(!window)return;const el = document.querySelector('span#status');if(!el)return;el.innerText = catchCDP(window) ? "yes":"no";}function init() {isCDPOn();setInterval(isCDPOn, 100);}document.addEventListener("DOMContentLoaded", init);</script>
</head><body><p>CDP Detected: <span id="status">-</span></p>
</body></html>

2 ：webdriver特征检测

将下面的js代码复制粘贴进F12控制台：

// 定义正则表达式
let regex = /^([a-z]){3}_.*_(Array|Promise|Symbol|JSON|Object|Proxy)$/;
// 获取window对象的所有属性名称
let allProps = Object.getOwnPropertyNames(window);
// 过滤出符合正则表达式的属性名称
let filteredProps = allProps.filter(prop => regex.test(prop));
// 输出匹配的属性名
console.log(filteredProps);

在这里插入图片描述

注意：这就是这2个站检测selenium机器人的核心逻辑。

四、编译crhomedriver.exe
打开chromium源码文件：\chrome\test\chromedriver\chrome\devtools_client_impl.cc

1 绕过cdp检测

找到下面的代码

void V8Console::Debug(const v8::debug::ConsoleCallArguments& info,const v8::debug::ConsoleContext& consoleContext) {TRACE_EVENT0(TRACE_DISABLED_BY_DEFAULT("v8.inspector"), "V8Console::Debug");ConsoleHelper(info, consoleContext, m_inspector).reportCall(ConsoleAPIType::kDebug);
}

替换为

void V8Console::Debug(const v8::debug::ConsoleCallArguments& info,const v8::debug::ConsoleContext& consoleContext) {//TRACE_EVENT0(TRACE_DISABLED_BY_DEFAULT("v8.inspector"), "V8Console::Debug");//ConsoleHelper(info, consoleContext, m_inspector)//    .reportCall(ConsoleAPIType::kDebug);
}

2 绕过webdriver特征检测

找到下面的代码


std::string script ="(function () {""window.cdc_adoQpoasnfa76pfcZLmcfl_Array = window.Array;""window.cdc_adoQpoasnfa76pfcZLmcfl_Object = window.Object;""window.cdc_adoQpoasnfa76pfcZLmcfl_Promise = window.Promise;""window.cdc_adoQpoasnfa76pfcZLmcfl_Proxy = window.Proxy;""window.cdc_adoQpoasnfa76pfcZLmcfl_Symbol = window.Symbol;""window.cdc_adoQpoasnfa76pfcZLmcfl_JSON = window.JSON;""}) ();";params.Set("source", script);

替换为：

std::string script ="(function () {"//"window.cdc_adoQpoasnfa76pfcZLmcfl_Array = window.Array;"//"window.cdc_adoQpoasnfa76pfcZLmcfl_Object = window.Object;"//"window.cdc_adoQpoasnfa76pfcZLmcfl_Promise = window.Promise;"//"window.cdc_adoQpoasnfa76pfcZLmcfl_Proxy = window.Proxy;"//"window.cdc_adoQpoasnfa76pfcZLmcfl_Symbol = window.Symbol;"//"window.cdc_adoQpoasnfa76pfcZLmcfl_JSON = window.JSON;""}) ();";params.Set("source", script);

3.编译：

ninja -C out/Default chromedriver

注意：编译完后，会在out/Default目录下生成一个chromedriver.exe文件，这就是驱动。

五、验证

将生成的chromedriver.exe拿过来，运行下面的python代码：


from selenium import webdriver
from selenium.webdriver.chrome.service import Service
import time# 指定chromedriver的路径
s = Service(r"chromedriver.exe")  # 请将这里替换为你的chromedriver路径# 初始化Chrome选项
chrome_options = webdriver.ChromeOptions()
chrome_options.binary_location = r"C:\Users\Administrator\AppData\Local\Chromium\Application\chrome.exe"  # 请将这里替换为你的Chrome浏览器路径
chrome_options.add_argument("--no-sandbox")
chrome_options.add_argument("--fingerprints=11111111")# 使用Service对象初始化driver
driver = webdriver.Chrome(service=s, options=chrome_options)
driver.delete_all_cookies()# driver.get("https://www.browserscan.net/bot-detection")
driver.get("https://fingerprintjs.github.io/BotD/main/")
time.sleep(99999)

指定chromedriver的路径

s = Service(r"chromedriver.exe") # 请将这里替换为你的chromedriver路径

初始化Chrome选项

chrome_options = webdriver.ChromeOptions()
chrome_options.binary_location = r"C:\Users\Administrator\AppData\Local\Chromium\Application\chrome.exe" # 请将这里替换为你的Chrome浏览器路径
chrome_options.add_argument(“–no-sandbox”)
chrome_options.add_argument(“–fingerprints=11111111”)

使用Service对象初始化driver

driver = webdriver.Chrome(service=s, options=chrome_options)
driver.delete_all_cookies()

driver.get(“https://www.browserscan.net/bot-detection”)

driver.get(“https://fingerprintjs.github.io/BotD/main/”)
time.sleep(99999)

在这里插入图片描述

可以看到，依旧是自动化控制，官网却已经检测不到了。browserscan也一样。

六、成品

有能力的小伙伴建议自己把流程全部跑一边，编译个自己的指纹浏览器和驱动。

查看全文

http://www.lryc.cn/news/442689.html

【JavaEE精炼宝库】HTTP | HTTPS 协议详解

Go语言基础学习01

基于SSM+Vue+MySQL的酒店管理系统

在WPF中保存控件内容为图片

C#用SDK打开海康工业相机,callback取图Bitmap格式，并保存

C语言字符学习初级优先看这个就够了

Python JSON

【华为杯】2024华为杯数模研赛F题解题思路

Object Pascal 结构化程序设计

机器学习算法与实践_03概率论与贝叶斯算法笔记

如何使用Privoxy将SOCKS5代理转换为HTTP代理?

AJAX(一）HTTP协议(请求响应报文)，AJAX发送请求，请求问题处理

Git进阶（十五）：Git LFS 使用详解

操作系统 | 学习笔记 | | 王道 | 5.1 I/O管理概述

关于es的一个多集群、多索引切换的实现

Linux系统编程（基础指令）上

【STM32 Blue Pill编程】-定时器PWM模式

数字英文验证码识别 API 对接说明

稳了，搭建Docker国内源图文教程

零工市场小程序：推动零工市场建设

回归预测 | Matlab实现SSA-HKELM麻雀算法优化混合核极限学习机多变量回归预测

VCNet论文阅读笔记

Python 装饰器使用详解

Vue使用qrcodejs2-fix生成网页二维码

兼容多个AI应用接口，支持用户自定义切换AI接口

[docker]入门

《让手机秒变超级电脑！ToDesk云电脑、易腾云、青椒云移动端评测》

Nginx处理带有分号“；“的路径

Spring Boot框架下的心理教育辅导系统开发

PyTorch 图像分割模型教程

一、selenium简介

二、机器人识别网站

1.https://www.browserscan.net/bot-detection

2.https://fingerprintjs.github.io/BotD/main/

三、检测原理

1 绕过cdp检测

2 绕过webdriver特征检测

五、验证

指定chromedriver的路径

初始化Chrome选项

使用Service对象初始化driver

driver.get(“https://www.browserscan.net/bot-detection”)

六、成品

相关文章：