Sur la page Overview , vous trouverez une vue consolidée de votre incident d'alerte actuel. La page Issues & activity contient des vues de vos problèmes actifs et de vos incidents récents.
Pourquoi c'est important
Les pages Overview et Issues & activity fournissent des analyses sur les performances (ou non) de votre système. Vous pouvez rapidement basculer entre Overview, Issues et Incidents pour rechercher les problèmes critiques affectant votre système.
Page d'aperçu
La page d'aperçu affiche une vue d'ensemble des incidents d'alerte récents et actuels. Avec cette page, vous obtiendrez des informations rapides et détaillées sur le nombre d'incidents critiques dont vous disposez, sur le nombre d'incidents qui ont été fermés et sur les politiques qui créent le plus d'incidents. Cette page affiche également les principales sources de votre incident mis en sourdine.
Titre du dashboard | Qu'est-ce que c'est |
---|---|
Incident ouvert par priorité (séries chronologiques) | Une vue de série chronologique qui compte le nombre d'incidents ouverts au cours d'une période donnée. Ce graphique ne suit que les événements ouverts. Il ne suit pas l’état ouvert ou fermé de l’incident. |
Incident ouvert par priorité (diagramme circulaire) | Ce graphique utilise les mêmes données que le graphique de séries chronologiques du même nom. Il vous montre rapidement la répartition entre l’avertissement et l’incident critique. Cliquez sur le graphique à secteurs pour filtrer la page entière par avertissement ou incident critique. |
Durée incident clôturés | Une distribution de la durée pendant laquelle chaque incident est resté ouvert (durée), avant d'être fermé. En général, il est préférable d'avoir des durées plus courtes pour votre incident. Si vous constatez de nombreux incidents de longue durée, vous souhaiterez peut-être écrire un filtre personnalisé pour les étudier plus en profondeur. |
Incident en sourdine | Si vous avez écrit des règles de mise en sourdine, vous les verrez ici. Si vous n'utilisez aucune règle de mise en sourdine, vous verrez un incident à 100 % « Non mis en sourdine ». Cliquez sur ce graphique pour filtrer par incident en sourdine afin de voir rapidement d'où ils viennent. |
Principales politiques créant des incidents | Un tableau des cinq principales politiques générant le plus d’incidents. Cliquez sur le nom d’une politique pour filtrer la page entière en fonction de l’incident de cette politique. |
Conditions principales créant un incident | Un tableau des cinq principales conditions générant le plus d’incidents. Cliquez sur le nom d’une politique pour filtrer la page entière en fonction de l’incident de cette condition. |
Principales sources d'incidents | Un graphique de l’entité générant le plus d’incidents. S'il est disponible, il utilise le nom de l'entité. Sinon, il utilisera le type d'événement. Cliquez sur une entité pour filtrer toute la page par l'incident de cette entité. |
Problèmes
Sur la page Issues & activity , les problèmes sont des groupes d’incidents qui décrivent le problème sous-jacent de vos symptômes. Lorsqu'un nouvel incident est créé, le service de renseignement incident ouvre un problème et évalue d'autres problèmes ouverts pour détecter des corrélations. Un problème contiendra un éventail de toutes les métadonnées de tous les incidents qu'il contient.
Le flux de problèmes inclut tous vos problèmes et peut être recherché et filtré à l'aide du composant en haut de la page.
Par défaut, le flux des problèmes est filtré pour afficher uniquement les problèmes actifs. Vous pouvez également filtrer par priorité du problème, source, condition d'alerte, politique d'alerte, entité ou ID du problème.
Par défaut, les problèmes sont triés par problème le plus récemment créé.
Cliquez sur un problème pour ouvrir sa page.
Les colonnes d'alimentation des problèmes
Nom de la colonne | Valeurs |
---|---|
État | Créé, actif, reconnu, en cours d'investigation, fermé |
Priorité | Faible, moyen, élevé, critique |
Nom du problème | Le nom du problème |
Créé | Quand le problème a été créé (en temps absolu ou relatif) |
Durée | Combien de temps s'est écoulé depuis la création du problème |
Entité | Une liste des entités impactées. Si la liste est trop longue pour être affichée, passez la souris sur la valeur pour voir la liste. |
Résumé de l'analyse | La sortie du module d'apprentissage machine pour le problème |
Chemin | Le chemin Sources -> Destination |
Incidents | Le nombre d'incidents liés |
Incidents
Sur la page Issues & activity , les incidents sont des événements qui décrivent les symptômes affectant votre système au fil du temps. Ces symptômes sont détectés par vos outils monitoring , qui évaluent vos flux de données et événements.
New Relic incident Les métadonnées proviennent de l'une des sources suivantes :
- Hériter de toutes les balises de la condition d'alerte qui l'a déclenchée
- Toutes les facettes, valeurs et conditions where sont ajoutées en tant que balise si la condition d'alerte NRQL contient une facette ou une condition where
- Toutes les balises d'une entité sont ajoutées si le résultat de la condition d'alerte NRQL peut être mappé à cette entité unique
Les métadonnées d'incident externe sont celles qui ont été reçues en tant que tag.*.
Le flux d'incidents inclut tous vos incidents : New Relic incident et incident externe.
Vous pouvez filtrer le flux par source, état de l'incident et priorité.
Comportement par défaut
Par défaut, le flux est trié par dernière mise à jour en haut.
Cliquez sur la ligne d’un incident pour voir les détails de l’incident.
Colonnes de flux d'incidents
Nom de la colonne | Valeurs |
---|---|
État | Ouvert, Fermé |
Priorité | Faible, Moyen, Élevé, Critique |
Nom de l'incident | Le nom de l'incident |
Créé | Quand l'incident a été créé (en temps absolu ou relatif) |
Durée | Combien de temps s'est écoulé depuis que l'incident a été créé |
Entité | Une liste des entités impactées par l'incident. Si la liste est trop longue pour être affichée, passez la souris sur la valeur pour voir la liste. |
Résumé de l'analyse | La sortie du module d'apprentissage machine pour l'incident |
Source | Le système source de l'incident |
Événements | Le nombre d'événements agrégés dans l'incident |