Partie 4 de la mise en œuvre : Alertes et autres solutions proactives

Il s'agit de la quatrième et dernière partie de notre guide de mise en œuvre.

Lors des étapes d'implémentation précédentes, vous avez instrumenté votre stack et vous êtes familiarisé avec la plateforme New Relic. C’est le moment idéal pour réfléchir à des solutions proactives qui vous avertiront rapidement des problèmes et vous aideront à éviter les pires scénarios. À cette étape, vous découvrirez certaines solutions importantes dans ce domaine, notamment :

Alertes
Moniteur synthétique
Errors Inbox

Réfléchissez à votre stratégie d’alerte

/ <img title="Alerts UI" alt="Alerts UI" src="/images/alerts_screenshot-full_alerting-ui.webp" /> /

L'interface utilisateur New Relic vous donne une vue de l'état de la condition d'alerte dans un compte.

Avant de configurer des alertes, nous vous recommandons de prendre le temps de réfléchir à vos objectifs et à votre stratégie d’alerte. Plus votre organisation est grande, plus cela est important.

Lorsque vous n'avez pas de stratégie d'alerte et que vous configurez plutôt des alertes rapidement et de manière aléatoire pour résoudre des problèmes ponctuels, cela peut entraîner l'envoi d'un trop grand nombre de notifications d'alerte. Lorsque cela se produit, votre équipe souffrira de fatigue en raison des alertes auxiliaires et commencera à ignorer les alertes. En consacrant un peu de temps à réfléchir à votre stratégie d’alerte, vous vous assurerez de configurer des alertes de manière intelligente, qui pourront évoluer à mesure que votre organisation se développe ou que vous ajoutez davantage de données à New Relic.

Pour vous acheminer les messages notification d'alerte, nous utilisons workflows (les règles de création de notification en cas d'incident et les données envoyées) et notification destinations (où les notifications sont envoyées). Nous vous recommandons de planifier la manière dont ces éléments seront configurés afin qu'ils soient cohérents et maintenables dans toute votre organisation. Si vous intégrez un autre service, tel que Slack ou PagerDuty, réfléchissez à la manière dont vous contrôlerez et maintiendrez cette intégration à long terme.

Éviter la fatigue due aux alertes auxiliaires doit être un objectif central de votre stratégie d’alerte. Une stratégie que vous pourriez appliquer consiste à catégoriser vos alertes en fonction de la gravité de l’impact sur l’entreprise. Les alertes les plus graves ou les plus critiques doivent être émises avec le plus de bruit et être transmises aux parties prenantes en mesure de réagir, tandis que celles qui ont moins d'impact sur l'entreprise doivent être émises plus discrètement, avec un « rayon d'explosion » plus petit.

Par exemple, vous pouvez envisager de définir certains protocoles de gravité des alertes que vous pouvez appliquer à l'ensemble de l'organisation et utiliser des workflows pour garantir que les alertes sont acheminées correctement. Les équipes peuvent appliquer un routage légèrement différent pour chaque gravité, mais l’introduction d’un langage commun et d’une compréhension de l’impact au sein de l’organisation peut s’avérer payante à mesure que vos efforts d’alerte se développent.

Gravité	Impact	Public	intégration
Sev 1 / P1	Critique	SRE d'astreinte, responsable de niveau C / commandant d'incident /, propriétaire de produit concerné et équipes DevOps	PagerDuty, Slack, e-mail
Sev 2 / P2	Haut	Équipes Product Owner et DevOps concernées	PagerDuty, Slack
Sev 3 / P3	Moyen	Équipes DevOps	Mou
Bac à sable / Niveau 4 / P4	Faible / Aucun	Équipes DevOps	Bac à sable Slack

Un exemple de la manière dont une organisation pourrait définir certains protocoles de sécurité d’alerte.

Afin de garantir la qualité à long terme des alertes, vous pouvez envisager de planifier des examens réguliers de votre état d'alerte pour vous assurer que toute fatigue due aux alertes est traitée et que les alertes sont correctement catégorisées. Cela impliquera d’analyser la fréquence à laquelle les alertes se déclenchent et les délais de réponse et de résolution.

Pour savoir comment démarrer avec les alertes :

Pour commencer rapidement à configurer une condition d'alerte et une destination notification , consultez notre documentation sur la création de votre première alerte.
Pour obtenir des conseils détaillés sur la planification et la mise en œuvre d'une stratégie d'alerte, consultez notre guide de gestion de la qualité des alertes.

Voici quelques documents sur l'automatisation de vos alertes :

Monitoring synthétique

Notre monitoring synthétique vous offre une suite d'outils automatisés et scriptables pour monitorer vos sites Web, vos transactions commerciales critiques et vos points de terminaison d'API. Ces outils vous permettent d'exécuter un moniteur simple pour vérifier les temps de disponibilité et les fonctionnalités de base, ou de créer des scripts complexes qui imitent les actions et les workflows d'un utilisateur réel.

Pour bien utiliser Synthetics, votre équipe doit identifier les parcours clients critiques pour l'entreprise et les API dépendantes, et configurer le moniteur Synthétique pour les suivre. Vos rapports de monitoring Synthétique peuvent faire partie de votre charge de travail ou d'un autre tableau de bord.

Vous pouvez vérifier l'état et les métriques de votre moniteur avec l'index du moniteur.

Pour commencer à utiliser Synthetics, consultez Introduction à Synthetics et Créer un moniteur.

Errors Inbox

Notre fonctionnalité de boîte de réception des erreurs vous aide à détecter, hiérarchiser et agir de manière proactive sur les erreurs avant qu'elles n'affectent votre utilisateur final. Vous recevrez des alertes chaque fois qu'une erreur critique ayant un impact sur les clients survient via votre canal de communication préféré, comme Slack.

L'interface utilisateur de la boîte de réception des erreurs vous permet de consulter facilement les erreurs de votre charge de travail.

Pour utiliser la boîte de réception des erreurs, vous devez avoir configuré une charge de travail. Ressources pour commencer :

Quelle est la prochaine étape ?

Ce guide vous a aidé à établir une base d’observabilité solide, mais ce n’est que la première étape vers l’excellence en matière d’observabilité. Ensuite, vous souhaiterez peut-être vous concentrer sur l’apprentissage des points les plus subtils de New Relic et l’optimisation de votre configuration. Quelques idées pour les prochaines étapes :

Si vous pensez que vous avez encore besoin de plus d’instrumentation, parcourez et installez davantage d’outils d’observabilité.
Lisez la documentation des outils et des fonctionnalités que vous utilisez pour en savoir plus sur les options configuration et de personnalisation.
Comprendre et optimiser votre ingestion de données.
Suivez un cours de la New Relic University sur l'interrogation des données et suivez d'autres cours.
Pour approfondir la planification de vos objectifs d’observabilité et atteindre l’excellence en matière d’observabilité, consultez notre série sur la maturité de l’observabilité. Il comprend des guides pour garantir une instrumentation optimale, l'observabilité en tant que code, la gestion de la qualité des alertes, et bien plus encore.

Cette traduction automatique est fournie pour votre commodité.

Partie 4 de la mise en œuvre : Alertes et autres solutions proactives

Réfléchissez à votre stratégie d’alerte .css-21sua1{background:none;border:none;width:0;padding:0;}

Monitoring synthétique

Errors Inbox

Quelle est la prochaine étape ?

Réfléchissez à votre stratégie d’alerte