北大青鸟java培训：IT编程开发分布式系统都存在哪些不足之处？

2023-02-23 21:43:02Python020

北大青鸟java培训：IT编程开发分布式系统都存在哪些不足之处？,第1张

分布式编程开发系统相信大家应该不陌生了吧。

而关于分布式的缺陷或者说问题大家是否有去研究呢?今天我们就一起来了解一下，关于分布式系统中存在的几个问题吧。

网络并不是可靠的你应该明白，分布式系统中不同节点间的通信是基于网络的。

网络使得它们连接起来共同协作。

然而，光缆被挖断的事件相信你也看到过不是一两次了。

除此之外，网卡异常、交换机故障、遭受恶意攻击等导致的网络拥塞、网络中断、报文丢失的种种迹象皆意味着网络随时可能无法正常运作，是不可靠的。

此时，需要在你的系统设计中，尽可能地考虑到：当前节点所依赖的其他节点由于各种原因无法与之正常通信时，该如何保证其依然能够提供部分或者完整的服务。

这个概念在软件域被定义为“鲁棒性”。

不同节点之间的通信是存在延迟的网络连接的是处于不同物理位置上的节点，学过物理和数学你的应该明白，两点之间是存在“距离”的，而我们的分布式系统需要在这个距离之上进行数据的传递，本质上就是物质的传递。

同时应该你也知道，物质的运动速度不会超过光速。

所以，不同节点之间的通信是需要经过一段时间的，也就意味着会存在延迟。

具体的延迟是由所用的传输介质、节点当前的负载大小所决定的。

带宽是有上限的这个点，我相信你是知道的，因为当你通过QQ、钉钉之类的工具传输或者下载一个大文件时候，就发现它是存在上限的，这个上限是根据你的网络带宽大小决定的。

但是，为什么你还是有可能会掉入这个陷阱里呢?电脑培训http://www.kmbdqn.cn/发现这往往由于你对所传输的数据的大小和频率没有充分的认识，导致了你觉得达到上限是一个很久远的事情，不用考虑它。

分布式并不直接意味着是“敏捷”了可能你曾经有过这样的想法，当在规模较大的集中式系统中工作的时候，每次和许多人在一个代码库里提交代码，老是遇到冲突、排队等待上游模块先开发等等。

这时你会想，如果改造成分布式系统，这些问题都没了，工作效率高多了。

既然是分布式系统，系统间通信的技术就不可避免的要掌握。

首先，我们必须掌握一些基本知识，例如网络通信协议（例如TCP / UDP等），网络IO（Blocking-IO，NonBlocking-IO，Asyn-IO），网卡（多队列等）。了解有关连接重用，序列化/反序列化，RPC，负载平衡等的信息。

在学习了这些基本知识之后，您基本上可以在分布式系统中编写一个简单的通信模块，但这实际上还远远不够。现在，您已经进入了分布式字段，您已经对规模有很多要求。这意味着需要一种通信程序，该程序可以支持大量连接，高并发性和低资源消耗。

大量的连接通常会有两种方式：

大量client连一个server

当前在NonBlocking-IO非常成熟的情况下，支持大量客户端的服务器并不难编写，但是在大规模且通常是长连接的情况下，有一点需要特别注意，即服务器挂起时不可能所有客户端都在某个时间点启动重新连接。那基本上是一场灾难。我见过一些没有经验的类似案例。客户端规模扩大后，服务器基本上会在重新启动后立即刷新。大量传入连接中断（当然，服务器的积压队列首先应设置为稍大一些）。可以使用的通常方法是在客户端重新连接之前睡眠一段随机的时间。另外，重连间隔采用避让算法。

一个client连大量的server

有些场景也会出现需要连大量server的现象，在这种情况下，同样要注意的也是不要并发同时去建所有的连接，而是在能力范围内分批去建。

除了建连接外，另外还要注意的地方是并发发送请求也同样，一定要做好限流，否则很容易会因为一些点慢导致内存爆掉。

这些问题在技术风险上得考虑进去，并在设计和代码实现上体现，否则一旦随着规模上去了，问题一时半会还真不太好解。

高并发这个点需要掌握CAS、常见的lock-free算法、读写锁、线程相关知识（例如线程交互、线程池）等，通信层面的高并发在NonBlocking-IO的情况下，最重要的是要注意在整体设计和代码实现上尽量减少对io线程池的时间占用。

低资源消耗这点的话NonBlocking-IO本身基本已经做到。

伸缩性

分布式系统基本上意味着规模不小。对于此类系统，在设计时必须考虑可伸缩性。在体系结构图上绘制的任何点，如果请求量或数据量继续增加，该怎么办？通过添加机器来解决。当然，此过程不需要考虑无限的情况。如果您有经验的建筑师，从相对较小的规模到非常大型的范围，那么优势显然并不小，而且它们也将越来越稀缺。。

横向可扩展性（Scale Out）是指通过增加服务器数量来提高群集的整体性能。垂直可伸缩性（Scale Up）是指提高每台服务器的性能以提高集群的整体性能。纵向可扩展性的上限非常明显，而分布式系统则强调水平可伸缩性。

分布式系统应用服务最好做成无状态的

应用服务的状态是指运行时程序因为处理服务请求而存在内存的数据。分布式应用服务最好是设计成无状态。因为如果应用程序是有状态的，那么一旦服务器宕机就会使得应用服务程序受影响而挂掉，那存在内存的数据也就丢失了，这显然不是高可靠的服务。把应用服务设计成无状态的，让程序把需要保存的数据都保存在专门的存储上(eg. 数据库)，这样应用服务程序可以任意重启而不丢失数据，方便分布式系统在服务器宕机后恢复应用服务。

伸缩性的问题围绕着以下两种场景在解决：

无状态场景

对于无状态场景，要实现随量增长而加机器支撑会比较简单，这种情况下只用解决节点发现的问题，通常只要基于负载均衡就可以搞定，硬件或软件方式都有；

无状态场景通常会把很多状态放在db，当量到一定阶段后会需要引入服务化，去缓解对db连接数太多的情况。

有状态场景

所谓状态其实就是数据，通常采用Sharding来实现伸缩性，Sharding有多种的实现方式，常见的有这么一些：

2.1 规则Sharding

基于一定规则把状态数据进行Sharding，例如分库分表很多时候采用的就是这样的，这种方式支持了伸缩性，但通常也带来了很复杂的管理、状态数据搬迁，甚至业务功能很难实现的问题，例如全局join，跨表事务等。

2.2 一致性Hash

一致性Hash方案会使得加机器代价更低一些，另外就是压力可以更为均衡，例如分布式cache经常采用，和规则Sharding带来的问题基本一样。

2.3 Auto Sharding

Auto Sharding的好处是基本上不用管数据搬迁，而且随着量上涨加机器就OK，但通常Auto Sharding的情况下对如何使用会有比较高的要求，而这个通常也就会造成一些限制，这种方案例如HBase。