当前位置: 首页 > news >正文

关注搜索引擎蜘蛛压力

以前在建站的时候,他们说蜘蛛来抓取的频率越多越好,因为蜘蛛来抓取说明了网站更新速度快,受搜索引擎的欢迎,但是在最近的网站统计中,发现很多蜘蛛爬取的频次非常的高,比如有的蜘蛛一天能来网站几万次,要知道网站的带宽是有限制的,比如很多网站的带宽只有几M,这就像一个大门一样,如果很多人往里面挤,肯定是挤不进来的,如果蜘蛛大量的访问,势必导致正常访问的用户被挡在门外,或者访问速度会受到限制,影响正常的业务访问。

因此,我们不能任由蜘蛛频繁的抓取,那么怎么办呢?一般情况下有这三种方案:

1、不想让蜘蛛抓取的目录,在robots里面屏蔽。

2、通过各大搜索引擎站长平台对蜘蛛的抓取次数进行限制,如果网站每天更新大量的内容,可以适当放宽蜘蛛的抓取次数,如果访问不高,可以限制在几千以内就可以了。

3、对于不想让某些蜘蛛抓取的,可以直接在robots屏蔽这个蜘蛛。

还有一些蜘蛛是假蜘蛛,他们会冒充真蜘蛛对网站进行大量的抓取,这个时候就要对网站部署合适的防火墙等,筛选出假蜘蛛进行屏蔽。

在做了以上的步骤以后,我们就能将蜘蛛的抓取控制在一个合理的范围,既不影响蜘蛛的抓取,也不影响正常的用户访问。

http://www.lryc.cn/news/525973.html

相关文章:

  • Python3 OS模块中的文件/目录方法说明三
  • 2024年终总结:技术成长与突破之路
  • mysql-06.JDBC
  • 使用python调用JIRA6 进行OAuth1认证获取AccessToken
  • HTML5使用favicon.ico图标
  • 黑龙江锅包肉:酸甜香酥的东北经典
  • Unity阿里云OpenAPI 获取 Token的C#【记录】
  • winfrom项目,引用EPPlus.dll实现将DataTable 中的数据保存到Excel文件
  • 【C++基础】多线程并发场景下的同步方法
  • C语言#define TSLP0 (TSLP_Regdef *)TSENSORO BASE ADDR)的含义?
  • 微信小程序wxs实现UTC转北京时间
  • 提示词的艺术 ---- AI Prompt 进阶(提示词框架)
  • WPF常见面试题解答
  • TypeScript 学习
  • 24_游戏启动逻辑梳理总结
  • C++/CLI(Common Language Runtime)关键点详解
  • Transfoemr的解码器(Decoder)与分词技术
  • CDSN 2024博客之星总评选-主题文章创作,我的AI之路-起手篇
  • Android BitmapShader简洁实现马赛克,Kotlin(二)
  • 蓝桥杯 阶乘的和(C++完整代码+详细分析)
  • 【Bug 记录】el-sub-menu 第一次进入默认不高亮
  • SpringCloud两种注册中心
  • 陕西羊肉泡馍:味蕾上的西北风情
  • 蓝桥杯试题:整数反转
  • Moretl FileSync增量文件采集工具
  • day1代码练习
  • 【Pytest】结构介绍
  • Django基础之ORM
  • 【以音频软件FFmpeg为例】通过Python脚本将软件路径添加到Windows系统环境变量中的实现与原理分析
  • 检测到联想鼠标自动调出运行窗口,鼠标自己作为键盘操作