什么样的是免费代理IP?
2020-10-10 16:01:06

代理IP的作用比较多,主要是网络爬虫来使用,对于这个爬虫是如何解决代理IP的问题呢?如果使用的是免费代理IP,我们是怎么抓取的,又是如何检测的呢?要获得有效的免费代理IP,并不是那么简单的。

特别是要在抓取到的免费的代理ip中,过滤后剩下的ip的访问成功率基本在90%+,更是难了,小编为大家介绍下一些技巧:

  1.代理ip的存活时间,越长越稳定,当然这个是在你搭建抓取后,来进行计算。

  2.其实最简单的方式就是根据服务器开放的端口来判断,如果服务器有开放80,3389,3306,22之类的端口,那么说明服务器还有别的服务在运行,挂掉的几率很小,如果是政府、学校的服务器,那么更加稳定。当然也有可能开放别的端口。

  3.代理类型的重新检测,通过访问不同的http和https网站,判断代理到底是http还是https,并且进行划分,http的代理,那就访问http网址的时候使用,https的代理给https访问提供服务,这样访问的几率才能提高。

  4.服务器的访问速度判断,需要访问多个不同的网址,来取平均数,这样的访问速度才比较稳。

  所以根据这几点,我重新写了一套代理ip池的项目,目前抓取ip4500+,长期稳定的ip在60+左右,虽然少,但是相当稳定。

  当然这些代理IP起不了多大的作用,只适合一些比较少的项目使用的,比如做网络营销之类的,如果想要考虑大项目的使用代理IP量,这必然是不合适的。但是可以考虑使用付费的代理IP,比如说携趣代理的。

阅读前一篇

如何使用代理IP刷点击?