代理IP有什么用?做什么用的?
Python爬虫就是一个探测机器,它的基本操作就是模拟人的行为去各个网站溜达,把看到的信息背回来。就像一只虫子在一幢楼里不知疲倦地爬来爬去。
HTTP代理的分类
根据代理ip的匿名程度,代理IP可以分为下面四类:
透明代理:能够直接“隐藏”你的ip地址,但是还是可以查到你是谁。
匿名代理:匿名代理比透明代理进步了一点,别人只能知道你用了代理,无法知道你是谁。
混淆代理:与匿名代理相同,假设使用混淆代理,别人还是能知道你在用代理,但是会得到一个假的IP地址,伪装的更逼真
高匿代理:可以看出来,高匿代理让别人根本无法发现你是在用代理,所以是最好的选择。
在使用的使用,毫无疑问使用高匿代理效果最好
而且,进行大批量的爬虫时,仅仅使用一两个代理是完全不够用的,ip一定被封就无法继续抓取数据了,所以需要大量的高匿IP。
HTTP和HTTPS的不同
http是非常常见的应用层协议,是超文本传输协议的简称,其传输的内容都是明文的。
http是HTTP协议运行在TCP之上。所有传输的内容都是明文,客户端和服务器端都无法验证对方的身份。
代理IP是怎么一回事?有什么做用?
代理服务器是依靠一种特殊的协议,简单的说,你如果通过代理服务器上网,你与任何人通信都要经过代理服务器,它起到一个中间人的作用,从而你的行踪就被保护了。就像黑客总喜欢用代理服务器攻击别人一样,最受攻击的主机日志中记录的都是代理服务的ip地址,所以行踪就隐蔽了,但是也不是绝对安全的,因为整个过程就是一个递归的过程,所以通过逆流法也是可以找到真凶的,所以又有了多级代理的概念。这样追踪起来就很麻烦了。
超级难题.如何防止:黑客饶过代理IP查到真实IP.具有意义性的一个问题,
黑客如果妄想代理可以给他带来安全是不可能的
代理协议很容易被攻破
除非你是高手中的高手
几十层跳板
如果要查找到代理后的真实IP
可以使用追踪路由这种方法
如果黑客只知道我代理服务器的IP,能否攻击到我的电脑?
上楼说的真没礼貌,现在黑客都用扫描IP段来找容易入手的肉鸡,即使用了代理服务器,也没用,代理服务器能攻陷了,你的电脑一样遭殃,即使不攻击代理服务器,你登陆到某些网站,它自动下载一些小工具就能找出你本地的IP了。
黑客攻击用代理服务器上网的电脑时,是通过代理的IP地址,还是其原本的IP地址?
当然是用代理服务器IP了,而且一般是利用多层代理,这样才比较安全