Avec monitoring d'infrastructure de New Relic, vous pouvez créer des conditions d'alerte directement dans le contexte de ce que vous monitoring actuellement avec New Relic.
Par exemple, si vous avez utilisé la barre de filtre pour filtrer un ensemble spécifique d'hôtes et que vous remarquez un problème, vous pouvez créer une alerte à partir de l'UI d'infrastructure. Pour créer l'alerte, sélectionnez une vue de filtre enregistrée et personnalisez la condition d'alerte directement à partir du graphique que vous visualisez. Cela vous aide à gérer et à monitorer de manière proactive le système d'alerte de votre environnement.
Vous souhaitez tester la condition d'alerte avec notre agent infrastructure ? Créez un compte New Relic gratuitement ! Aucune carte de crédit requise.
Créer une condition d'alerte pour infrastructure
Les conditions d'alerte s'appliquent aux politiques d'alerte. Vous pouvez sélectionner une politique existante ou créer une nouvelle politique avec des notifications par e-mail à partir de notre interface utilisateur d'infrastructure. Si vous souhaitez utiliser d'autres types de canal de notification, créez une nouvelle politique à partir de l'UI .
Important
L'API REST d'infrastructure a une limite de 3 700 conditions d'alerte, y compris les conditions actives and désactivées. L'API, qu'elle soit utilisée directement ou via l'UI, rejettera toutes requests d'ajout de condition d'alerte supplémentaire au-delà de la limite de 3 700 conditions d'alerte.
Pour ajouter une condition d'alerte infrastructure à une règle d'alerte :
Allez à one.newrelic.com > All capabilities > Infrastructure. Passez la souris sur un graphique sur lequel vous souhaitez générer une alerte, sélectionnez les ellipses icône, puis sélectionnez Create alert condition.
Tapez un nom de condition significatif.
Sélectionnez le Alert type ou reportez-vous aux exemples pour décider quel type sélectionner.
Créez des filtres individuels ou copiez tous les filtres de la barre de filtre d'entité pour identifier les hôtes que vous souhaitez que la condition d'alerte utilise.
Définissez le seuil Critical (obligatoire) et Warning (facultatif, si disponible) pour déclencher la notification d'alerte.
Facultatif : pour créer les critères de condition de manière proactive mais ne pas recevoir de notification d’alerte à ce stade, désactivez l’ optionEnabled .
Sélectionnez une politique existante pour la nouvelle condition.
OU
Sélectionnez l’option permettant de créer une nouvelle politique et d’identifier l’e-mail pour la notification d’alerte.
Facultatif : ajoutez une URL de runbook.
Facultatif : définissez la limite de temps Close open incidents after pour fermer automatiquement les incidents ouverts après un certain temps (la valeur par défaut est de 24 heures pour les conditions d'infrastructure).
Sélectionnez Create.
Important
Si New Relic n'a pas reçu d'attribut d'un service cloud d'intégration au cours des 60 dernières minutes, nous appelons cela un « attribut silencieux » et il ne sera pas disponible pour être utilisé comme condition d'alerte dans l'UI. Dans cette situation, vous pouvez utiliser l' API pour créer une condition d'alerte pour l'attribut silencieux.
Autres méthodes d'état d'alerte infrastructure
Vous pouvez également utiliser ces autres méthodes pour créer une condition d’alerte d’infrastructure :
Afficher l'alerte hôte événement
Toute personne incluse dans le canal de notification de la politique reçoit directement une notification d'alerte. De plus, toute personne disposant d'autorisations sur votre compte New Relic peut visualiser les incidents infrastructure d'alerte et les incidents individuels via l'interface utilisateur.
- Allez à one.newrelic.com > All capabilities > Infrastructure > Events.
- Pour modifier les hôtes ou la période, utilisez la fenêtre de recherche, la barre de filtre d'entité ou les fonctions de temps.
- Dans la liste Events , sélectionnez l’incident d’alerte.
- Pour afficher des informations détaillées dans les alertes concernant l’incident sélectionné, sélectionnez le lien.
Mettre à jour ou supprimer les informations d'alerte de l'hôte
Pour modifier, désactiver (ou réactiver) ou supprimer les informations d’alerte de l’hôte :
- Allez à one.newrelic.com > All capabilities > Infrastructure > Settings > Alerts.
- Facultatif : utilisez la fenêtre de recherche ou la case à cocher Select all pour localiser une ou plusieurs conditions d'alerte.
- Sélectionnez l'une des fonctions disponibles pour modifier, désactiver, activer ou supprimer les conditions sélectionnées.
Utilisez des alertes pour monitorer l'ensemble de votre infrastructure
Alerts fournit un outil d'alerte unique et coordonné pour tous vos produits New Relic. Cela vous permet de gérer les règles d'alerte et les conditions qui se concentrent sur les métriques de l'entité qui vous intéresse le plus, telles que les conteneurs Docker , les JVM, etc.
Alert features | Features in infrastructure monitoring |
---|---|
état d'alerte |
|
Informations sur les alertes |
|
Qègle d'alerte | Afficher, ajouter, modifier, désactiver ou supprimer :
|
canal de notification | Pour afficher, ajouter, modifier ou supprimer les options de notification disponibles:
|
Ajouter une description
L'utilisation du champ Description est disponible pour ces types de conditions d'alerte :
- Conditions NRQL : ajoutez une description à l’aide de l’ API NerdGraph.
- conditions d'infrastructure : ajouter une description en utilisant l'UI ou l'API REST.
Le texte que vous placez dans le champ Description d'une condition d'alerte est transmis en aval à l'incident et à la notification associés. Une description peut être utilisée à plusieurs fins, notamment :
- Capture de la raison de la condition d’alerte.
- Définition du signal monitoré.
- Définir les prochaines étapes.
- Ajouter des métadonnées au système en aval.
Vous pouvez utiliser la substitution de modèle pour insérer des valeurs de l'attribut dans l'événement incident associé. Le format du modèle est {{attributeName}}
. Pour l'attribut que vous pouvez utiliser lors de la création d'une description, voir incident événement attribut.
Un attribut disponible est l’attribut spécial {{tag.*}}
. Ce préfixe d'attribut est utilisé pour accéder à l'une des valeurs tag incluses avec le signal cible, ou à l'une des balises d'entité associées au signal cible.
S'il existe des balises d'entité associées à votre incident, elles sont alors accessibles à l'aide du nom tag entité. Un exemple de ceci serait {{tag.aws.awsRegion}}
. Lorsque des balises d'entité sont disponibles, vous les voyez incluses avec l' incident et affichées lorsque vous visualisez l' incident.
Ce champ a une taille maximale de caractères de 4 000.
Ajouter ou modifier l'URL d'un runbook
Le processus de création de condition d'alerte inclut une option permettant de définir une URL pour les instructions runbook . Cela vous permet d'accéder à des informations ou à des procédures standard pour gérer un incident. Avant d'ajouter ou de mettre à jour le lien, assurez-vous d'utiliser une URL valide.
Pour ajouter, mettre à jour ou supprimer l'URL du runbook d'une condition d'alerte :
- Sélectionnez une condition d’alerte et apportez des modifications au lien Runbook URL .
- Sauvegarder la condition.
Pour être enregistrée, l'URL doit être une URL valide.
délai d'incident
Le délai d' incident vous permet de définir une période de temps après laquelle l'incident sera fermé de force. Par défaut, la limite de temps d'incident est de 24 heures pour les conditions d'infrastructure.
Pour ajouter ou mettre à jour la limite de temps d’incident d’une condition d’alerte :
- Sélectionnez une condition d’alerte et modifiez la limite de temps de l’incident.
- Sauvegarder la condition.
condition d'alerte qui génère une requête NRQL trop longue
La condition d'alerte créée pour infrastructure s'appuie sur une requête NRQL en coulisses, et les requêtes NRQL ont une limite de 4096 caractères. Cela signifie que si votre condition génère une requête NRQL très complexe qui filtre sur de nombreux éléments (par exemple, incluant de nombreux hôtes ou de nombreuses balises), elle dépassera cette limite et affichera un message d'erreur indiquant que la condition a échoué.
Pour résoudre ce problème, réduisez le nombre d’éléments que vous utilisez dans votre condition d’alerte. Par exemple:
Problème | Solution |
---|---|
Hôtes |
|
Entité |
|
Pour plus d'informations, consultez les bonnes pratiques pour le filtrage des alertes infrastructure dans le forum d'assistance de New Relic.