网络代理ip地址设置
当我们在 dig 命令里加上 + tcp 的选项时,就可以强制 DNS 查询使用 TCP 协议进行数据传输。
我们知道网络传输就像是在某个管道里传输数据包,这个管道有一定的粗细,叫 MTU。超过 MTU 则会在发送端的网络层进行切分,然后在接收端的网络层进行重组。而重组是需要有个缓冲区的,这个缓冲区的大小有个最小值,是 576Byte。
IP 层分片后传输会加大丢包的概率,且 IP 层本身并不具备重传的功能,因此需要尽量避免 IP 层分片。
如果传输过程中真的发生了分片,需要尽量确保能在接收端顺利重组,于是在最保险的情况下,将 MTU 设置为 576。(有些过于谨慎,现在大部分场景下 MTU=1500)。
因为 TCP 本身会分段,分段后的长度正好小于等于 MTU 的长度。并且丢包后还会重传,因此可以确保数据正常传输。
我们可以对比上面 UDP 和 TCP 的那两张图,会发现,除了 DNS 的请求和响应两个数据包,TCP 场景下还多了三次握手和四次挥手这几个包。
迭代查询是指,发出 DNS 后,对方如果不知道这个域名的 IP 是什么,会告诉我有可能知道这件事的机器的 IP,我自己再去问有可能知道的机器,不断重复直到问到结果。
看起来递归查询好像很方便,但其实是将查询的过程转嫁给了其他 DNS 服务器。所以很多时候,这两者是同时存在的。
那本机在发出 DNS 请求时,会要求最近的 DNS 服务器将结果查好了再给回本机(step1),所以这时候是要求的递归查询。
本机是轻松了,然而最近的 DNS 服务器(有可能是你的家用路由器)却需要忙活起来了,它需要采用迭代查询的方式,最坏的情况下,它需要:
RA(Recursion Available)是指服务端实际采用的查询方式,它只会在响应包里出现。
因为大部分 URL 所涉及到的域名服务器都不太相同,比如和 涉及到的一、二、三级域名服务器就不一样,因此也没必要维护 TCP 长链接做复用。
所以相比之下,在数据量较小的场景下,使用 UDP 就可以省下握手挥手的消耗,因此 UDP 才是更优解。
这个,单纯是历史原因了。上面提到基于 UDP 的 DNS 报文不应该超过 512Byte,刨去 DNS 本身的报头信息,算下来大概能放13 个 IP(IPV4)。
具体的计算过程不太重要,我就省略了,对计算过程感兴趣的话,可以看下这篇文章最下面的参考文献。
虽然现在大部分机器 MTU=1500 了,但由于还可能存在 MTU=576 的机器,需要向前兼容,因此也不建议随意调整。
比如,很久以前看电视的时候,有位砖家提到 全球 DNS 根服务器只有 13 台,其中 x 台部署在漂亮国,只要它们切断访问,那我们的网络就会受影响 balabala。
但其实,13 个 IP 不代表只有 13 台服务器。准确点来说,应该说是13 组服务器,每个组都可以无限扩展服务器的个数,多个服务器共用同一个 IP。
我们假设有这么一个路由器,它想要访问某个 IP 的机器。从路由器到目的机器有非常多条路径,路由器可以通过跳数等信息来计算每条路径的成本,得到最优的路径。将最优路径汇成一张表,也就是我们常说的路由表。
比如下面的图里,绿色的线和红色的线都能到达同样的目的地,但显然,绿色的路径更短,所以路由表记录了成本更低的绿色路线。
那么现在假设我们将这个网状结构里的两个点的网络 IP 设为一样,路由器其实不知道这是两个不同的机器,对它来说,这只是两条不同的路径,但都是通向同一个 IP。
现在我们再加个条件,路由器和其中一台机器都在国内,另一台机器在国外。对路由器来说,由于国内的机器离得近,传输成本低,而国外的机器远,传输成本高,所以路由器生成的最优路线是打到国内的机器。
基于这样的思路,我们只要镜像一份国外的 DNS 域名服务器信息到国内机房里。我们就不再需要请求国外服务器了。
所以,就算其他国家的根域名服务器挂了,也不会对我们有什么影响,事实上国内已经有非常多的镜像服务器了,稳得很。
那稍微扩展一下,假设在上海和广东都设置了相同 IP 的镜像服务,那对于上海的用户来说,他们的路由器会优先将请求打到上海的镜像服务网络代理ip地址设置。而广东的用户则会优先打到广东的机器里,从而实现了就近访问。
上海的镜像服务挂了,那对应的上海用户路由器里的路由表,就会将路径更新为广东的镜像机器。上海用户的请求就会打到广东的镜像服务中。从而实现高可用(或者说灾备)。
nginx 作为常见的反向代理服务器,背后可以连 N 个服务端。当客户端想要请求后端时,客户端根本不需要知道是哪个服务器在为它提供服务,只管拿 nginx 最后返回的结果就行了。像这种,屏蔽掉具体有哪些服务器的代理方式就是所谓的反向代理。
正因为不知道背后有哪些服务器,因此可以做到无限扩展,挂了一台其他也能顶上,因此实现了负载均衡和高可用。
之前写过一篇文章《为什么有 HTTP 协议,还要有 websocket 协议?》,提到过对于网络游戏场景,需要有服务器主动推数据到客户端。由于 nginx 与客户端和服务端之间会建立TCP 长链接,因此客户端在收到服务端的消息之后,能沿着这条连接响应服务端。
而如果这时候不用 nginx,单纯使用任播,那服务器将消息主动推给客户端之后,客户端响应时,消息不保证还能给回原来的服务器。毕竟“任播”的含义就是,只要能访问任意一台服务器就行了。
当然这两个本来也不是一个维度的东西,拿来比较其实并不合适,我只是举了个反例来帮助大家捋一捋两者之间的差异。
・DNS 在传输层既能使用 UDP 也能使用 TCP 协议。当传输数据量小于 512Byte 时会使用 UDP,否则使用 TCP。
・虽然根域只有 13 个 IP,但不代表只有 13 台服务器,准确的说,应该是十三组服务器,每组服务器都共用同一个 IP,国内已经有非常多的镜像服务器,利用任播技术,只要能就近访问到其中一台就行了。
・国内国外如果都有相同 IP 的目的机器,那对于路由器来说,无非就是有两条路径可以抵达相同的目的地,一个远一些,一个近一些。基于成本,会将更近的路径放到路由表中。
・任播技术虽然也能在一定程度上实现负载均衡和高可用,但它跟 nginx 并不是一个维度的东西,不能替代 nginx。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。