Server Administrator 使用事件类型来区分系统中影响特定重要组件的事件。组件状态三种最常见的事件类型为:正常、警告和严重/故障。
此帮助模块定义了事件类型、状态和严重性的术语。如果您需要有关 Server Administrator 用于对事件进行分类和标识组件运行状况的其它术语的详细信息,请阅读此帮助部分。
Server Administrator 是在报告组件的运行状况,或是在对事件进行分类,以下是可以用来进行区分的事件属性:正被监测的组件或冗余,以及类型、状态和该组件正在经历事件的严重性。
[返回页首]
Server Administrator 根据类型、严重性和状态对组件和某些组件的冗余进行分类。
在某种意义上,系统中的所有组件都很重要。但是,Systems Management Applications(例如 Server Administrator)选出了一些需要特别注意的组件。 运行良好的计算机系统特别依赖于适宜电压的稳定电源以正常运行系统组件。 电源经过系统的交流电源 (AC) 转换器传送至系统的电源设备。系统组件还要求机箱内部的温度处于可工作的范围。 运行程序和对数据进行计算都需要随机存取存储器工作状态良好。因此,电源转换器、电源设备、风扇和系统内存成为 Server Administrator 监测的最重要的组件。
Server administrator 还监测冗余组件的运行状况并报告系统的冗余状况。
根据系统对企业实体或组织的任务的重要程度,系统中安装的某些系统组件具有已设计好的冗余。如果系统对于组织的任务至关重要,则系统很可能具有冗余组件。 冗余组件用于替代其出现故障的同类组件。冗余有助于避免系统因关机或组件损坏而停机。
整个系统完全冗余表示所有设备均在正常限定范围内工作。如果系统需要四个风扇用于完全冗余,且四个风扇全部都在工作,则系统具有风扇组件的完全冗余。如果两个主风扇中的一个出现故障,则每个风扇均有一个备用风扇。除了一般的预防性维护,完全冗余无需采用其它任何措施。
降级冗余表示完全冗余所需的某些组件无法工作。这时系统可以运行,但组件出现故障时,工作的组件不足以使可运行组件能够替代故障组件。例如,如果完全冗余需要四个风扇,则三个可运行风扇表示降级冗余。在出现故障时,两个主风扇中的一个有备用风扇。
无冗余表示系统只有避免系统出现故障的最少数量的工作组件。没有可工作的冗余组件。如果需要四个风扇用于完全冗余,且只有两个风扇可以工作,则出现故障时,两个主风扇都没有备用风扇。
[返回页首]
事件按类型分类。事件类型包括正常、警告和严重。
正常事件表示组件在维持其正常运作所允许的范围内运行。应用于状况正常组件的另一个术语是“OK”(良好)。如果组件良好,或事件为正常,系统操作员不必采取纠正措施。
如果管理型组件未处于最佳运行状态,但仍可以运行,则将出现警告事件。警告事件为系统操作员提供了一些准备时间。对警告事件采取的适当措施通常是进行进一步调查并计划对组件进行维护。警告同时也提醒系统操作员在组件恢复正常前要对组件多加注意。高级用户(Power Users)和管理员(Administrators)可以为警告事件定义最小和最大值。定义警告范围的权限使超级用户和管理员可以设定需要的反应时间,以处理开始出现性能降低迹象的工作组件。
严重事件表示组件在正常工作范围之外运行,或者根本无法运行。根本无法运行的组件通常称为不可恢复组件。系统制造商定义组件的临界范围,因为制造商最了解组件涉及的工程工作以及正常功能。相对于警告,严重表明情况更加紧急,系统操作员会更加重视这类组件性能下降的情况。对严重或故障组件采取的适当措施包括立即关机或尽快安排更换组件。
[返回页首]
组件或系统属性的状态包括可运行、降级或无法运行。
可运行温度表示机箱内的温度探测器读取的温度在正常的运行范围内。
降级温度表示机箱内的温度探测器读取的温度在警告范围(由触发警告所需的最高和最低运行温度定义)内。机箱内的温度要么低于正常的最低温度,要么高于正常的最高温度。
降级冗余表示工作组件不足以确保每个重要组件在出现故障时都有备用组件可以替换。
无法运行的组件或组件属性表示组件在故障状态下或无法恢复的范围内运行。以温度为例,如果系统仍然在运行,而温度远远高于或低于正常温度范围,则可能会触发系统热关机,或者可能会损害或破坏系统组件。
[返回页首]
组件的每个事件类型和状态都根据其严重性进行评估。事件的严重性包括通知、次要、重要和严重。
正常事件或组件的状况为可运行状态,与正常事件相关的严重性为通知。Server Administrator 对正常事件采取的唯一措施是通知。Server Administrator 通知系统操作员组件正常。
根据组件的状态,警告事件可能为次要或严重。例如,如果 卸下风扇冗余系统中的某个风扇,该事件的严重性为次要。
某些警告事件可以指出系统面临的主要危险。如果某个风扇长时间 没有装入系统,事件可能会成为重要事件,因为可能会影响 冗余功能。如果组织的任务要求冗余,而系统中的该组件长期缺失,则可能会导致组件出现故障时没有可用的备用组件,从而最终导致系统出现故障。
检测到组件处于故障范围内的事件是严重事件。风扇、交流电源线或内存模块等组件的故障会危及系统的运行和数据保存。
[返回页首]
下表列出了重要组件的实例事件,并说明了事件类型、严重性和状态之间的关系。
组件 | 事件或警报类型 | 严重性 | 状态 |
交流电源线 | 正常 | 通知 | 可运行 |
交流电源线 | 故障 | 严重 | 降级 |
电源设备 | 故障 | 严重 | 降级 |
冗余(针对电源系统) | 正常 | 通知 | 可运行 |
冗余(针对电源系统) | 降级 | 次要 | 降级 |
冗余(针对电源系统) | 缺失 | 重要 | 降级 |
温度 | 正常 | 通知 | 可运行 |
温度 | 警告 | 次要 | 降级 |
温度 | 故障 | 严重 | 降级 |
热 | “Shutdown”(关机) | 严重 | 无法运行 |
[返回页首]