暂无图片
什么是反向故障检测?
我来答
分享
2022-12-24
什么是反向故障检测?

什么是反向故障检测?

我来答
添加附件
收藏
分享
问题补充
3条回答
默认
最新
大海

由于不总是能传播故障的信息,并且通过通知每个成员来进行传播可能成本较高,因此出现了一种称为FUSE(Failure Notification Service,故障通知服务)的方法,它专注于可靠且廉价的故障传播,即使在网络分区的情况下也能工作。

为了检测进程故障,该方法将所有活动进程进行分组。如果其中一组变得不可用,则所参与者都能检测到该故障。即,每次检测到单个进程故障,它被转换并传播为组故障。它可以检测任何形式的网络中断、网络分区和节点故障。

组中的进程定期向其他成员发送ping消息,以查询它们是否仍处于活动状态。如果其中一个成员由于崩溃、网络分区或链路故障而无法响应此消息,则发出这个ping的成员本身将停止响应ping消息。

所有故障都通过系统从故障源传播到所有其他参与者。参与者逐渐停止响应ping消息,将单点节点故障转换为组故障。

在这里,我们利用不通信作为一种传播的手段。这种方法的一个优点是保证每个成员都能了解组的故障并对其做出充分的反应。它的一个缺点是:将单个进程与其他进程分开的链路故障也可能会被转换为组故障,但这其实也可以看作是一个优点应由具体的用例所决定。

暂无图片 评论
暂无图片 有用 2
暂无图片
题主
2022-12-24
应用程序可以使用其自身对故障传播的定义来应对这种情况。
Oracle
2022-12-25
学习了,都没听够,收藏了https://www.modb.pro/issue/19170
yBmZlQzJ

不懂,看谁会。

暂无图片 评论
暂无图片 有用 2
Oracle
暂无图片 评论
暂无图片 有用 3
回答交流
提交
问题信息
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~
暂无图片墨值悬赏