检测并发写入
检测并发写入
- 节点
1 接收来自A 的写入,但由于暂时中断,从不接收来自B 的写入。 - 节点
2 首先接收来自A 的写入,然后接收来自B 的写入。 - 节点
3 首先接收来自B 的写入,然后从A 写入。

如果每个节点只要接收到来自客户端的写入请求就简单地覆盖了某个键的值,那么节点就会永久地不一致,如上图中的最终获取请求所示:节点
最后写入胜利,LWW
实现最终融合的一种方法是声明每个副本只需要存储最近的值,并允许更旧的值被覆盖和抛弃。然后,只要我们有一种明确的方式来确定哪个写是“最近的”,并且每个写入最终都被复制到每个副本,那么复制最终会收敛到相同的值。不过,当客户端向数据库节点发送写入请求时,客户端都不知道另一个客户端,因此不清楚哪一个先发生了。事实上,说“发生”是没有意义的:我们说写入是并发(concurrent)的,所以它们的顺序是不确定的。
即使写入没有自然的排序,我们也可以强制任意排序。例如,可以为每个写入附加一个时间戳,挑选最“最近”的最大时间戳,并丢弃具有较早时间戳的任何写入。这种冲突解决算法被称为最后写入胜利(LWW, last write wins
“此前发生”的关系和并发
我们如何判断两个操作是否是并发的?为了建立一个直觉,让我们看看一些例子:
- 两个写入不是并发的:
A 的插入发生在B 的增量之前,因为B 递增的值是A 插入的值。换句话说,B 的操作建立在A 的操作上,所以B 的操作必须有后来发生。我们也可以说B 是因果依赖(causally dependent)于A 。 - 当每个客户端启动操作时,它不知道另一个客户端也正在执行操作同样的
Key 。因此,操作之间不存在因果关系。
如果操作
因此,只要有两个操作
并发性,时间和相对性
如果两个操作同时发生,似乎应该称为并发——但事实上,它们在字面时间上重叠与否并不重要。由于分布式系统中的时钟问题,现实中是很难判断两个事件是否同时发生的为了定义并发性,确切的时间并不重要:如果两个操作都意识不到对方的存在,就称这两个操作并发,而不管它们发生的物理时间。人们有时把这个原理和狭义相对论的物理学联系起来,它引入了信息不能比光速更快的思想。因此,如果事件之间的时间短于光通过它们之间的距离,那么发生一定距离的两个事件不可能相互影响。
在计算机系统中,即使光速原则上允许一个操作影响另一个操作,但两个操作也可能是并行的。例如,如果网络缓慢或中断,两个操作间可能会出现一段时间间隔,且仍然是并发的,因为网络问题阻止一个操作意识到另一个操作的存在。
捕获" 此前发生" 关系
来看一个算法,它确定两个操作是否为并发的,还是一个在另一个之前。为了简单起见,我们从一个只有一个副本的数据库开始。一旦我们已经制定了如何在单个副本上完成这项工作,我们可以将该方法概括为具有多个副本的无领导者数据库。下图显示了两个客户端同时向同一购物车添加项目(如果这样的例子让你觉得太麻烦了,那么可以想象,两个空中交通管制员同时把飞机添加到他们正在跟踪的区域)最初,购物车是空的。在它们之间,客户端向数据库发出五次写入:

- 客户端
1 将牛奶加入购物车。这是该键的第一次写入,服务器成功存储了它并为其分配版本号1 ,最后将值与版本号一起回送给客户端。 - 客户端
2 将鸡蛋加入购物车,不知道客户端1 同时添加了牛奶(客户端2 认为它的鸡蛋是购物车中的唯一物品) 。服务器为此写入分配版本号2 ,并将鸡蛋和牛奶存储为两个单独的值。然后它将这两个值都反回给客户端2 ,并附上版本号2 。 - 客户端
1 不知道客户端2 的写入,想要将面粉加入购物车,因此认为当前的购物车内容应该是[ 牛奶,面粉] 。它将此值与服务器先前向客户端1 提供的版本号1 一起发送到服务器。服务器可以从版本号中知道[ 牛奶,面粉] 的写入取代了[ 牛奶] 的先前值,但与[ 鸡蛋] 的值是并发的。因此,服务器将版本3 分配给[ 牛奶,面粉] ,覆盖版本1 值[ 牛奶] ,但保留版本2 的值[ 蛋] ,并将所有的值返回给客户端1 。 - 同时,客户端
2 想要加入火腿,不知道客端户1 刚刚加了面粉。客户端2 在最后一个响应中从服务器收到了两个值[ 牛奶] 和[ 蛋] ,所以客户端2 现在合并这些值,并添加火腿形成一个新的值,[ 鸡蛋,牛奶,火腿] 。它将这个值发送到服务器,带着之前的版本号2 。服务器检测到新值会覆盖版本2 [ 鸡蛋] ,但新值也会与版本3 [ 牛奶,面粉] 并发,所以剩下的两个是v3 [ 牛奶,面粉] ,和v4 :[ 鸡蛋,牛奶,火腿] - 最后,客户端
1 想要加培根。它以前在v3 中从服务器接收[ 牛奶,面粉] 和[ 鸡蛋] ,所以它合并这些,添加培根,并将最终值[ 牛奶,面粉,鸡蛋,培根] 连同版本号v3 发往服务器。这会覆盖v3[ 牛奶,面粉] (请注意[ 鸡蛋] 已经在最后一步被覆盖) ,但与v4[ 鸡蛋,牛奶,火腿] 并发,所以服务器保留这两个并发值。
箭头表示哪个操作发生在其他操作之前,意味着后面的操作知道或依赖于较早的操作在这个例子中,客户端永远不会完全掌握服务器上的数据,因为总是有另一个操作同时进行但是,旧版本的值最终会被覆盖,并且不会丢失任何写入。

请注意,服务器可以通过查看版本号来确定两个操作是否是并发的——它不需要解释该值本身(因此该值可以是任何数据结构
- 服务器为每个键保留一个版本号,每次写入键时都增加版本号,并将新版本号与写入的值一起存储。
- 当客户端读取键时,服务器将返回所有未覆盖的值以及最新的版本号。客户端在写入前必须读取。
- 客户端写入键时,必须包含之前读取的版本号,并且必须将之前读取的所有值合并在一起(来自写入请求的响应可以像读取一样,返回所有当前值,这使得我们可以像购物车示例那样连接多个写入
。 ) - 当服务器接收到具有特定版本号的写入时,它可以覆盖该版本号或更低版本的所有值(因为它知道它们已经被合并到新的值中
) ,但是它必须保持所有值更高版本号(因为这些值与传入的写入同时发生) 。
当一个写入包含前一次读取的版本号时,它会告诉我们写入的是哪一种状态。如果在不包含版本号的情况下进行写操作,则与所有其他写操作并发,因此它不会覆盖任何内容:只会在随后的读取中作为其中一个值返回。
合并同时写入的值
这种算法可以确保没有数据被无声地丢弃,但不幸的是,客户端需要做一些额外的工作:如果多个操作并发发生,则客户端必须通过合并并发写入的值来擦屁股
以购物车为例,一种合理的合并兄弟方法就是集合求并,在购物车的例子中,最后的两个兄弟是
然而,如果你想让人们也可以从他们的手推车中删除东西,而不是仅仅添加东西,那么把兄弟求并可能不会产生正确的结果:如果你合并了两个兄弟手推车,并且只在其中一个兄弟值里删掉了它,那么被删除的项目会重新出现在兄弟的并集中。为了防止这个问题,一个项目在删除时不能简单地从数据库中删除
因为在应用程序代码中合并兄弟是复杂且容易出错的,所以有一些数据结构被设计出来用于自动执行这种合并,例如,
版本向量
之前我们使用单个版本号来捕获操作之间的依赖关系,但是当多个副本并发接受写入时,这是不够的。相反,除了对每个键使用版本号之外,还需要在每个副本中使用版本号。每个副本在处理写入时增加自己的版本号,并且跟踪从其他副本中看到的版本号。这个信息指出了要覆盖哪些值,以及保留哪些值作为兄弟。
所有副本的版本号集合称为版本向量(version vector
另外,就像在单个副本的例子中,应用程序可能需要合并兄弟。版本向量结构确保从一个副本读取并随后写回到另一个副本是安全的。这样做可能会创建兄弟,但只要兄弟姐妹合并正确,就不会丢失数据。