由于开python培训有讲过爬虫的缘故,这个问题已经被ask无数次了,一般问的基友也都是爬虫防ban用的,总体来讲,质量好的都不便宜,便宜的质量都比较渣,一分钱一分货。
1)通过程序扫出来的代理
通过程序扫IP段、端口找出来的临时性代理。
诸如百度搜索“HTTP代理”,写着“每日更新”、“国内高匿免费”什么的都是这类,购买的话都很廉价。
基本都大同小异,没有哪个好那个坏,几个平台提供的代理至少有3成的重复率。
动态IP代理 IP代理 HTTPS代理 代理服务器 长效代理 长效IP
2)ADSL拨号服务器
ADSL拨号,断线重连切IP,限定地区拨号、全国拨号都有。相对较稳定,至少比扫描出来的强很多,但切换IP耗时较长,需要几秒到1分钟之间。
所以如果采集是每访问一次切一次IP的话,效率会很慢,只能等当前IP被对方ban掉的时候在拨号换新的IP。
3)第三方访问
比如通过“谷歌网页翻译”、“有道网页翻译”、“http代理浏览器”等第三方访问渠道请求目标网页。
速度慢,且采集捕获目标内容的时候多了很多干扰。
4)代理IP软件
代理IP软件本身靠谱代理还是挺稳定的,就是人得在电脑旁边,手动换一次。但是偶尔查查几万关键词的百度排名、几万页面收录,用代理IP软件还是挺悠闲的,这点量级总共也换不了多少次。
动态IP代理 IP代理 HTTPS代理 代理服务器 长效代理 长效IP
5)自建代理
买一台动态IP服务器,利用squid+stunnel搭建一台HTTP高匿代理服务器,Tinyproxy也行。squit用来实现http代理,stunnel在代理的基础上建一条隧道实现加密。
如果觉得ip数量少,就多买几台服务器,依次配置squid——
由于是自建代理,都是独享且是真实的IP,所有相当稳定。
6)自建代理服务商
如果上面方法自己懒得搞,也没有关系。找个做类似服务的商家,开个api端口即可。
更多资讯,请点击携趣www.xiequ.cn或添加客服咨询。

