什么是爬虫和反爬虫?
2020-11-26 21:09:09

什么是爬虫?现在,携趣小编就为大家简单介绍一下爬虫和反爬虫的相关知识。

    1.jpg

爬虫是使用相关技术手段,批量获取网站信息的一种方式。 

反爬虫是使用相关技术手段,阻止别人批量获取自己网站信息的一种方式,两者为一矛盾体。 

误伤:在反爬虫的过程中,错误的将普通用户识别为爬虫,误伤率高的反爬虫策略,效果再好,也

不能使用。

拦截:成功地阻止爬虫访问。拦截率的概念,拦截率越高的反爬虫策略,误伤的可能性就会相应成正比越高。 

常见的反爬虫手段:

  1、当单个IP访问超过阈值时,予以封锁。

  2、当单个session访问超过阈值时,予以封锁。

  3、当果单个userAgent访问超过阈值时,予以封锁。

  4、以上三种相互组合的情况。

点击携趣www.xiequ.cn或添加客服,助您轻松跨入“互联网大数据”时代!


阅读前一篇

用静态IP上不了网怎么回事?