当前位置: 首页 > news >正文

高级分布式系统-第6讲 分布式系统的容错性--故障/错误/失效/异常

分布式系统容错性的概念

分布式系统的容错性: 当发生故障时, 分布式系统应当在进行恢复的同时继续以可接受的方式进行操作, 并且可以从部分失效中自动恢复, 且不会严重影响整体性能。

具体包括以下4个方面的内容:

可用性( availability) : 系统可以正确操作, 根据用户的行为来执行预定功能。

可靠性( reliability) : 系统可以无故障地持续运行。

安全性( safety) : 系统在偶然出现故障时, 能正确操作、 输出而不会造成任何灾害。 也称故障-安全性或者故障导向安全性。

可维护性( maintainability) : 发生故障的系统被恢复的难易程度。

分布式系统容错性-----故障/错误/失效/异常

故障、 错误和失效是容错系统中三个重要的概念, 它们之间的关系如下图所示:

故障( Fault) : 引起错误的直接原因( 异常条件) 。

错误( Error) : 由故障引起的子系统( 组件) 的不正确的内部状态。

失效( Failure) : 组件( 子系统) 在特定时刻的实际行为与预期行为之间产生了不一致的结果。

异常( Abnormity) : 错误与正常之间的一种预期外状态或者行为

故障的分类

错误的几个阶段:

激活错误: 一旦错误被计算访问或者影响了访问的流程( 如干扰) , 就激活了错误。

检测发现错误: 当计算访问错误后, 在值域或时域偏离的状态通过检测被发现。

如一个二进制数据的破坏, 可通过简单的奇偶校验检测发现。

消除错误: 用一个在值域和时域无偏离的新值覆盖了错误。

没有被激活、 检测发现或消除的错误称为潜伏错误( latent error) , 可能产生严重后果。

错误传播: 内部错误被激活并且已扩散到该组件( 子系统) 之外, 引发了其他的错误。

失效的严重性分类

失效的影响轻微, 其代价与系统的正常应用的损失在同一个数量级,这类失效称为良性失效。

失效可能导致灾难性后果, 其代价比系统正常应用损失高出几个数量级, 这类失效称为恶性失效( 或者危险失效) 。

失效是良性的还是恶性的, 完全取决于应用的特性。

可能发生恶性失效的应用称为安全关键( safety critical) 应用

http://www.lryc.cn/news/278758.html

相关文章:

  • 网络多线程开发小项目--QQ登陆聊天功能(服务端推送新闻、离线留言和文件)
  • Jtti:有哪些方法可以提升Tomcat的性能?
  • LeetCode 2085. 统计出现过一次的公共字符串
  • 130基于MATLAB并结合IBD算法的盲迭代反卷积法进行图像复原
  • Flying HTML生成PDF添加水印
  • MySQL 8.0 InnoDB Tablespaces之Temporary Tablespaces(临时表空间)
  • 轴承滚珠故障的理论推导与计算(修订中...)
  • NVMe系统内存结构 - PRP与PRP List
  • 系列二、Spring Security中的核心类
  • 基于多反应堆的高并发服务器【C/C++/Reactor】(中)HttpRequest 提取请求行、解析请求行和优化 以及解析请求头并存储
  • 数据结构-测试1
  • 【设计模式】01-前言
  • SpringBoot源码分析
  • 约数个数和约数之和算法总结
  • 数据结构-怀化学院期末题(322)
  • 小手也能用的高性能鼠标,自定义空间还挺高,雷柏VT9Pro mini上手
  • CDN加速原理详解
  • sqlachemy orm create or delete table
  • 科普小米手机、华为手机、红米手机、oppo手机、vivo手机、荣耀手机、一加手机、realme手机如何设置充电提示音
  • zookeeper应用场景之分布式的ID生成器
  • Java--Spring项目生成雪花算法数字(Twitter SnowFlake)
  • 紫光展锐M6780丨画质增强——更炫的视觉体验
  • 控制el-table的列显示隐藏
  • 2024上海国际冶金及材料分析测试仪器设备展览会
  • 商业定位,1元平价商业咨询:豪威尔咨询!平价咨询。
  • 2. Presto应用
  • 工业级安卓PDA超高频读写器手持掌上电脑,RFID电子标签读写器
  • Prompt提示工程上手指南:基础原理及实践(一)
  • Redis如何保证缓存和数据库一致性?
  • 学完C/C++,再学Python是一种什么体验?