• 1.摘要
  • 2.基本信息
  • 3.内容介绍
  • 4.事务定义
  • 5.故障分类
  • 6.闭环故障

系统故障

2
计算机程序停止运行

故障是指系统不能执行规定功能的状态。在计算机中,系统故障是指系统在运行过程中,由于某种原因,造成系统停止运行,以致事务在执行过程中以非正常的方式终止,致使内存中的信息丢失,而存储在外存上的数据未受影响。2017年12月1日,《公共服务领域英文译写规范》正式实施,规定系统故障标准英文名为Out of Order。

基本信息

  • 中文名

    系统故障

  • 外文名

    Out of Order

  • 学科

    计算机

  • 定义

    由于某种原因造成系统停止运行

  • 有关术语

    事务

  • 领域

    操作系统

  • 相关条例

    公共服务领域英文译写规范

内容介绍

1/3

故障是计算机程序的语法错误或逻辑错误。 系统故障是指系统在运行过程中,由于某种原因,以致事务在执行过程中以非正常的方式终止。按故障的部件可将故障分为硬件故障和软件故障。硬件故障是指故障因硬件系统失效。软件故障是指程序运行一些非法指令,如特权指令。

2017年12月1日,《公共服务领域英文译写规范》正式实施,规定系统故障标准英文名为Out of Order。

事务定义

事务是用于访问和修改各种数据项的一个程序单位。事务也可以被看做是一系列相关读和写操作。被访问的数据可以分散地存放在同一文件的不同记录中,也可放在多个文件中。只有对分布在不同位置的同一数据所进行的读和写(含修改)操作全部完成时,才能再以托付操作(Commit Operation)来终止事务。只要有一个读、写或修改操作失败,便须执行夭折操作(Abort Operation)。读或写操作的失败可能是由于逻辑错误,也可能是系统故障所导致的。

一个夭折的事务,通常已执行了一些操作,因而可能已对某些数据做了修改。为使夭折的事务不会引起数据的不一致性,须将该事务内刚被修改的数据项恢复成原来的情况,使系统中各数据项与该事务未执行时的数据项内容完全相同。此时,可以说该事务“已被退回”(rolled back)。不难看出,一个事务在对一批数据执行修改操作时,要么全部完成,并用修改后的数据去代替原来的数据,要么一个也不修改。

事务记录(Transaction Record)

为了实现上述的原子修改,通常须借助于称为事务记录的数据结构来实现。这些数据结构被放在稳定存储器中,用来记录在事务运行时数据项修改的全部信息,故又称为运行记录(Log)。该记录中包括有下列字段:

· 事务名:用于标识该事务的惟一名字;

· 数据项名:指被修改数据项的惟一名字;

· 旧值:修改前数据项的值;

· 新值:修改后数据项将具有的值。

在事务记录表中的每一记录,描述了在事务运行中的重要事务操作,如修改操作、开始事务、托付事务或夭折事务等。在一个事务 T i 开始执行时, 〈T i 开始〉记录被写入事务记录表中;在 T i 执行期间,在 T i 的任何写(修改)操作之前,便写一适当的新记录到事务记录表中;当 T i 进行托付时,把一个〈T i 托付〉记录写入事务记录表中。[3] 

故障分类

按故障的持续时间分类

按故障的持续时问可将故障分为永久故障、瞬时故障和间歇故障。永久故障由元器件的不可逆变化所引发,其永久地改变元器件的原有逻辑.直到采取措施消除故障为止;瞬时故障的持续时间不超过一个指定的值.并f1只引起元器件当前参数值的变化,而不会导致不可逆的变化;间歇故障是可重复出现的故障,主要由元件参数的变化、不正确的设计和工艺方面的原因所引发。

按故障的发生和发展进程分类

按故障的发生和发展过程可将故障分为突发性故障和渐发性故障。突发性故障出现前无明显的征兆,很难通过早期试验或测试来预测;渐发性故障是由于元器件老化等其他原因,导致设备性能逐渐下降并最终超出正确值而引发的故障.因此具有一定的规律性,可进行状态监测和故障预防。