Définitions des types d'événements et intégrité des composants

Server Administrator classe les événements affectant certains composants critiques de votre système en fonction du type d'événement. Les trois types d'événements les plus courants affichés pour la condition d'un composant sont Normal, Avertissement et Critique.

Ce module d'aide définit les termes ayant trait aux types d'événements, à leurs états et à leurs gravités. Lisez ce module d'aide si vous voulez plus de détails sur les différents termes utilisés par Server Administrator pour classifier les événements et identifier l'intégrité des composants.

Types d'événements et gravités associées

Si Server Administrator rapporte l'intégrité d'un composant ou classifie un événement, les attributs distinctifs sont les suivants : le composant ou la redondance qui sont surveillés et le type, l'état et la gravité de l'événement subi par le composant.

[Retour au début]

Composant ou redondance

Server Administrator classifie les composants et la redondance de certains composants selon le type, la gravité et l'état.

Composant

Tous les composants d'un système ont une importance. Les applications de gestion de systèmes, comme Server Administrator, isolent certains composants pour leur donner une attention spéciale. Les systèmes informatiques intègres comptent particulièrement sur une alimentation constante de courant électrique à une tension appropriée au fonctionnement de leurs composants système. Le courant électrique est fourni par le commutateur de courant alternatif du système aux blocs d'alimentation du système. Les composants des systèmes doivent également avoir une plage opérationnelle de températures à l'intérieur du châssis. Les applications qui s'exécutent et font des calculs sur des données nécessitent une mémoire vive qui fonctionne bien. De ce fait, le commutateur d'alimentation, les blocs d'alimentation, les ventilateurs et la mémoire système sont parmi les composants les plus importants contrôlés par Server Administrator.

Redondance

Server Administrator surveille l'intégrité des composants redondants et émet un rapport sur l'état de la redondance du système.

Selon l'importance d'un système par rapport à la mission de l'entreprise ou de l'organisation, certains composants de système sont installés dans le système avec une redondance calculée. En général, un système qui est essentiel à la mission d'une organisation a des composants redondants. Un composant redondant est conçu pour prendre la relève lorsque son composant compagnon tombe en panne. La redondance permet de protéger un système contre les temps d'arrêt causés par des pannes ou des composants endommagés. Les états de la redondance suivants sont possibles :

Redondance totale

La redondance totale de tout le système signifie que tous les périphériques fonctionnent à l'intérieur des limites normales. Si un système doit avoir quatre ventilateurs pour une redondance totale et qu'ils fonctionnent tous, le système a une redondance totale de ventilation. Si un des deux ventilateurs principaux est en panne, chaque ventilateur en a un en réserve. La redondance totale n'exige aucune action autre que l'entretien préventif normal. 

Dégradation de la redondance

La dégradation de la redondance signifie que certains composants nécessaires pour une redondance totale ne fonctionnent pas. Le système fonctionne, mais trop peu de composants fonctionnent pour permettre à un composant opérationnel de prendre la relève en cas de panne d'un autre composant. Par exemple, si quatre ventilateurs sont requis pour une redondance totale, trois ventilateurs fonctionnels représentent une redondance dégradée. Seul un des deux ventilateurs principaux en a un de secours s'il tombe en panne. 

Perte de la redondance

La perte de la redondance indique que le système n'a qu'un nombre minimum de composants qui fonctionnent pour empêcher une panne du système. Aucun composant redondant ne fonctionne. Si quatre ventilateurs sont requis pour une redondance totale et que seulement deux ventilateurs fonctionnent, aucun des ventilateurs principaux n'en a un en réserve s'ils tombent en panne.

[Retour au début]

Type

Un événement est classifié par type. Des exemples de types d'événements sont Normal, Avertissement et Critique. 

Normal 

Les événements de type normal indiquent qu'un composant fonctionne dans une plage de valeurs qui permet au composant de bien fonctionner dans le système. Un autre terme souvent appliqué aux composants dont l'état est normal est OK. Lorsqu'un composant est OK ou qu'un événement est normal, l'opérateur du système n'a aucune action correctrice à effectuer.

Avertissement 

Des événements d'avertissement se produisent lorsqu'un composant géré ne fonctionne pas de façon optimale, mais qu'il fonctionne tout de même. Les événements d'avertissement donnent le temps d'agir aux opérateurs de système. L'action appropriée pour un événement d'avertissement est souvent d'étudier davantage la situation et de planifier l'entretien du composant. Les avertissements indiquent également à l'opérateur du système qu'il devrait faire plus attention à un composant jusqu'à ce que le composant revienne à la normale. Les utilisateurs privilégiés et les administrateurs peuvent définir les valeurs minimale et maximale d'un événement d'avertissement. En définissant la plage d'avertissement, les utilisateurs privilégiés et les administrateurs peuvent incorporer le temps de réaction souhaité pour s'occuper d'un composant opérationnel qui commence à montrer des signes de performance dégradée.

Critique/Panne

Un événement critique/de panne indique qu'un composant fonctionne en dehors des limites de bon fonctionnement ou qu'il ne fonctionne pas du tout. Un composant qui ne fonctionne pas du tout est souvent appelé irrécupérable. Le fabricant du système définit la plage critique/de panne d'un composant car c'est le fabricant qui connaît le mieux la mécanique du composant et son bon fonctionnement. Un événement critique ou de panne a une connotation plus urgente qu'un avertissement et les opérateurs de système prennent ce type de dégradation des performances d'un composant plus au sérieux. Les actions appropriées pour un composant qui a un problème critique ou tombe en panne peuvent inclure un arrêt immédiat du système ou le remplacement d'un composant dans les délais les plus brefs.

[Retour au début]

État

L'état d'un composant ou d'un attribut du système est opérationnel, dégradé ou non opérationnel. 

Opérationnel

Une température opérationnelle signifie que les capteurs de température à l'intérieur d'un châssis mesurent des températures qui se situent dans la plage normale de fonctionnement. 

Dégradé

Une température dégradée signifie que les capteurs de température à l'intérieur d'un châssis mesurent des températures qui se situent dans la plage d'avertissement définie par les températures minimale et maximale de fonctionnement requises pour un avertissement. La température dans le châssis est soit en dessous des normes de la température minimale, soit au dessus de celles de la température maximale.

Une dégradation de la redondance signifie que trop peu de composants fonctionnent pour assurer que chaque composant crucial en a un autre qui peut prendre la relève en cas de panne.

Non opérationnel

Un composant ou un attribut de composant non opérationnel signifie que le composant fonctionne en dehors de la plage fonctionnelle ou est irrécupérable. En prenant la température comme exemple, si le système fonctionne encore, la température est si loin au dessus ou en dessous de la plage normale qu'elle peut déclencher un arrêt du système pour des raisons thermiques ou endommager ou détruire des composants système. 

[Retour au début]

Gravité

Chaque type d'événement et état d'un composant a une gravité. Les gravités pour les événements sont Informatif, Mineur, Majeur et Critique/Panne.

Informatif

La condition normale d'un événement ou d'un composant est un état opérationnel et la gravité associée à un événement normal est informative. La seule action que Server Administrator effectue pour un événement normal est informative. Server Administrator informe l'opérateur de système que le composant est normal.

Secondaire

Un événement d'avertissement peut être mineur ou critique selon le composant. Par exemple, si vous enlevez un ventilateur dans un système de ventilation redondante, la gravité de cet événement est mineure.

Majeur

Certains événements d'avertissement peuvent indiquer des risques majeurs pour le système. Si un ventilateur n'est pas dans le système pour une période de temps prolongée, l'événement peut devenir majeur car la redondance devient compromise. L'absence prolongée d'un composant d'un système dont la mission au sein d'une organisation exige une redondance peut entraîner des pannes de composants sans dispositifs de réserve et pourrait mener à une panne du système.

Critique 

Les événements qui décèlent des composants dans la plage de panne sont critiques. Les pannes de composants tels que les ventilateurs, les cordons de courant alternatif ou les modules de mémoire compromettent le fonctionnement du système et la préservation de ses données.

[Retour au début]

Relation entre le type d'événement, la gravité et l'état

Le tableau suivant fournit un exemple d'événements pour des composants importants et montre les relations entre le type d'événement, la gravité et l'état.

Composant Type d'événement ou d'alerte Gravité État
Cordon de courant alternatif Normal Informatif Opérationnel
Cordon de courant alternatif Panne Critique Dégradé
Bloc d'alimentation Panne Critique Dégradé
Redondance (système d'alimentation) Totale Informatif Opérationnel
Redondance (système d'alimentation) Dégradé Secondaire Dégradé
Redondance (système d'alimentation) Perdu Majeur Dégradé
Température Normal Informatif Opérationnel
Température Avertissement Secondaire Dégradé
Température Panne Critique Dégradé
Thermique Arrêt Critique Non opérationnel

[Retour au début]