Comprendre et utiliser l'UI de tracing distribué

Tracing distribué vous aide à monitorer et analyser le comportement de vos systèmes distribués. Après avoir activé le tracing distribué, vous pouvez utiliser nos outils UI pour rechercher des traces et les analyser.

Si vous cherchez à résoudre des erreurs dans une transaction qui couvre plusieurs services :

Ouvrez la page UI de tracing distribué.
Triez votre trace à l'aide d'un filtre pour trouver cette demande spécifique et afficher uniquement la trace contenant des erreurs.
Sur la page des détails de la trace, examinez l’étendue le long de l’itinéraire de demande à l’origine de l’erreur.
En notant la classe d’erreur et le message, accédez au service à partir de son étendue dans la trace afin de voir que l’erreur se produit à un rythme élevé.

Lisez la suite pour explorer les options de l’ UI de tracing distribué.

Ouvrir l'UI de tracing distribué

Pour afficher la trace d’un service spécifique :

Accédez à one.newrelic.com > All entities.
Sous Your system dans le panneau de gauche, sélectionnez l’entité qui contient la trace que vous souhaitez inspecter.
Cliquez sur Distributed tracing dans le volet de gauche.

Ou, pour afficher la trace sur tous vos comptes :

Allez à one.newrelic.com > All Capabilities.
Cliquez sur la tuile Traces .

Conseil

Si vous n'avez pas accès aux comptes de certains services dans une trace, nous masquerons certains détails de ces services.

Filtrez vos données de portée

Nous disposons d'une variété d'outils pour vous aider à trouver des traces et des portées afin que vous puissiez résoudre les problèmes. La page d'ouverture de tracing distribuée est remplie avec une liste de traces par défaut. Vous pouvez rapidement affiner cette liste à l'aide de ces outils :

La barre de requête Find traces est un moyen rapide d'affiner votre recherche de trace. Vous pouvez commencer à taper dans la barre de requête ou utiliser la liste déroulante pour créer une requête composée.

les retours de requête sont basés sur l'attribut span, et non sur l'attribut trace . Vous définissez des étendues qui ont certains critères et la recherche affiche les traces qui contiennent ces étendues.

Si vous utilisez un filtre multi-attributs, il est affecté par le premier attribut sélectionné. Rapports des tracing distribués sur deux types de données : transaction événement et spans. Lorsque vous sélectionnez un attribut dans le filtre, le type de données auquel cet attribut est attaché dicte l'attribut disponible. Par exemple, si vous filtrez sur un attribut attaché à un événement de transaction, seul l'attribut d'événement de transaction est disponible lorsque vous tentez d'ajouter un filtre sur des valeurs d'attribut supplémentaires.

Les requêtes de trace sont similaires à NRQL (notre langage de requête), à quelques exceptions près :

Les valeurs de chaîne ne nécessitent pas de guillemets (par exemple, vous pouvez utiliser appName = MyApp ou appName = 'MyApp')
L'opérateur like ne nécessite pas % (par exemple, vous pouvez utiliser appName like product ou appName like %product%).
Voici deux exemples d’utilisation de la barre de requête :
La requête dans l'image ci-dessous trouve une trace de :
Passer par les applications WebPortal et Inventaire Service
Avoir un appel datastore Inventory Service qui prend plus de 500 ms
Contient une erreur dans n'importe quelle étendue.
Aller à one.newrelic.com > All capabilities > Apps > Distributed tracing
La requête dans l'image ci-dessous trouve une trace de :
Contient les étendues qui passent par l'application WebPortal et où une erreur s'est produite sur n'importe quelle étendue de l'application WebPortal
Contient les étendues où l'attribut customer_user_email contient une valeur se terminant par hotmail.com n'importe où dans la trace.
Aller à one.newrelic.com > All capabilities > Apps > Distributed tracing

Outre la barre de requête en haut de la page, vous pouvez utiliser une variété de filtres dans le volet de gauche pour trouver la trace qui vous intéresse.

Infinite tracing data:Sélectionnez cette option uniquement pour afficher la trace liée à la fonctionnalité Infinite Tracing.
Multi span traces only:Utilisez ceci pour masquer la trace à portée unique.
Error filters:Sous Errors sélectionnez les erreurs à filtrer.
Histogram filters:En dessous de Errors en bas du volet de gauche, vous pouvez cliquer sur More filters pour afficher les filtres d'histogramme. Faites glisser les curseurs pour modifier les valeurs, telles que Trace duration:
- Faites glisser l'extrémité gauche du curseur pour des comparaisons supérieures à.
- Faites glisser l'extrémité droite du curseur pour les comparaisons inférieures à.
- Faites glisser chaque extrémité du curseur vers le centre pour filtrer par une plage.
Lorsque vous faites glisser le curseur, cela modifie à la fois la liste des traces et ce qui est affiché dans les graphiques trace .

Organisez vos données de portée

La vue par défaut du tracing distribué affiche les traces regroupées par la même étendue d'entrée racine. En d’autres termes, les traces sont regroupées en fonction de la période à laquelle New Relic a commencé à enregistrer la demande. Vous pouvez faire glisser le bouton Group similar traces pour activer et désactiver cette fonction.

Avec les groupes trace vous obtenez une vue d'ensemble des traces afin de comprendre le comportement des demandes pour les groupes de traces similaires. Cela vous aide à comprendre les baisses ou les pics dans le nombre trace, la durée et les erreurs. Lorsque vous cliquez sur l’un des groupes trace, vous obtenez tous les détails standard dans le contexte du groupe trace spécifique que vous avez sélectionné.

Si Group similar traces est activé, vous verrez trois graphiques en haut de la page dans le tracing distribué. Ces graphiques vous montrent le nombre trace, la durée du 95e percentile et le nombre d'erreurs pour chacun des groupes trace répertoriés dans le tableau sous les graphiques. Pour modifier les filtres sur ces graphiques, consultez les filtres du volet de gauche.

Le nuage de points de trace est un moyen rapide de rechercher des traces aberrantes. Ceci est disponible sur la page d'ouverture du tracing distribué si vous désactivez la bascule Group similar traces en haut de la page.

Dans le nuage de points, vous pouvez déplacer le curseur sur le graphique pour afficher les détails de la trace et vous pouvez cliquer sur des points individuels pour obtenir des détails :

Screenshot showing the distributed tracing scatter plot chart.

Contrôler ce qui est affiché dans le nuage de points :

Sélectionnez le type de durée dans la liste déroulante View by :

Backend duration
Root span duration
Trace duration

Dans Facet traces by, sélectionnez l’une de ces options :

Root entry span: Regroupez par la transaction racine, qui est le point de terminaison du service racine. Dans une trace où le service A appelle le service B et le service B appelle le service C, l'étendue de l'entrée racine est le point de terminaison du service A. Par exemple : "Service A - GET /utilisateur/%".
Root entity:Grouper par le nom de la première entité dans la trace. Dans une trace où le service A appelle le service B et le service B appelle le service C, l'entité racine serait le service A.
Errors: Regrouper selon que la trace contient ou non des erreurs.

Pour obtenir des conseils sur la façon de modifier les filtres du nuage de points, consultez les filtres du volet de gauche.

Conseil

Certaines requêtes produisant de nombreux résultats peuvent entraîner des faux positifs dans les graphiques. Cela peut se manifester par des graphiques affichant des résultats de trace qui ne figurent pas dans la liste de trace.

Détails supplémentaires UI

Voici quelques détails, règles et limites supplémentaires relatifs UI distribuée en matière de tracing :

Les erreurs au niveau de l'étendue vous montrent où les erreurs ont été générées dans un processus, comment elles ont surgi et où elles ont été traitées. Chaque étendue qui se termine par une erreur est affichée avec une erreur dans l'UI et contribue au nombre total d'erreurs pour cette trace.

Voici quelques conseils généraux pour comprendre les erreurs d’étendue :

Les étendues contenant des erreurs sont surlignées en rouge dans l'UI de tracing distribué. Vous pouvez voir plus d’informations dans le volet Error Details pour chaque plage.
Toutes les étendues qui sortent avec des erreurs sont comptabilisées dans le nombre d'erreurs d'étendue.

Lorsque plusieurs erreurs se produisent sur la même plage, une seule est écrite dans la plage dans cet ordre de priorité :

UN noticeError
L'erreur d'étendue la plus récente dans le cadre de cette étendue

Ce tableau décrit comment les différentes erreurs d'étendue sont gérées :

Type d'erreur	Description
Travées se terminant par des erreurs	Une erreur qui quitte la limite d'une étendue entraîne une erreur sur cette étendue et sur toutes les étendues ancêtres qui sortent également avec une erreur, jusqu'à ce que l'erreur soit détectée ou quitte la transaction. Vous pouvez voir si une erreur est détectée dans une étendue d'ancêtre.
Remarquez les erreurs	Les erreurs constatées par les appels à l'API de l'agent `noticeError` ou par l' instrumentation automatique de l'agent sont attachées à la plage en cours d'exécution.
Erreurs de code de réponse	Les erreurs de code de réponse sont attachées à l'étendue associée, telles que : client span : transactions externes préfixées par `http` ou `db`. Portée de la saisie : Dans le cas d'une transaction se terminant par une erreur de code de réponse. Le code de réponse pour ces plages est capturé en tant qu’attribut `http.statusCode` et attaché à cette plage.
Erreurs OpenTelemetry	La zone Error Details du volet de droite est remplie par des étendues contenant `otel.status_code = ERROR` et affiche le contenu de `otel.status_description`. Conseil Les événements d'étendue OpenTelemetry gérés par l'application/le service sont affichés indépendamment de l'état d'erreur d'étendue et ne sont pas nécessairement associés à un état d'erreur d'étendue. Vous pouvez afficher les exceptions et non-exceptions des événements SPAN en cliquant sur View span events dans le volet de droite.

Lorsqu'un processus appelle un autre processus et que les deux processus sont instrumentés par New Relic, la trace contient à la fois une représentation côté client de l'appel et une représentation côté serveur. Le client span (processus appelant) peut avoir des différences liées au temps par rapport au serveur span (processus appelé). Ces différences pourraient être dues à :

Décalage d'horloge, dû aux différences d'heure de l'horloge système
Différences de durée, dues à des facteurs tels que la latence du réseau ou le délai de résolution DNS
L'UI montre ces différences liées au temps en affichant un aperçu de l'étendue du client dans le même espace que l'étendue du serveur. Cette plage représente la durée du client.
Il n'est pas possible de déterminer tous les facteurs contribuant à ces écarts liés au temps, mais voici quelques modèles courants de durée de vie et des conseils pour les comprendre :
A. Lorsqu'un client SPAN est plus long que le serveur SPAN, cela peut être dû à une latence dans un certain nombre de domaines, tels que : le temps réseau, le temps de file d'attente, le temps de résolution DNS ou un équilibreur de charge que nous ne pouvons pas voir. B. Lorsqu'un client SPAN démarre et se termine avant le début d'un SPAN de serveur, cela peut être dû à un décalage d'horloge ou au fait que le serveur effectue un travail asynchrone qui continue après l'envoi de la réponse. C. Lorsqu'un client SPAN démarre après un SPAN de serveur, il s'agit probablement d'un décalage d'horloge.

Les traces fragmentées sont des traces avec des étendues manquantes. Lorsqu'un span est manquant ou possède des identifiants parents de span non valides, son span enfant est séparé du reste de la trace, ce que nous appelons « orphelin ». Les étendues orphelines apparaissent au bas de la trace et elles manqueront de lignes de connexion au reste de la trace. Si vous avez des étendues fragmentées, vous verrez le mot Fragmented en haut de la page de détails :

Screenshot showing how to locate a fragmented trace

Types de propriétés span orphelines indiquées dans l'UI:

No root span. Il manque la portée racine, qui est la première opération de la requête. Lorsque cela se produit, la plage avec l’horodatage le plus ancien est affichée comme racine.
Orphaned span. Une seule étendue avec un parent d'étendue manquant. Cela peut être dû au fait que le parent span possède un ID qui ne correspond pas à son enfant span.
Orphaned trace fragment. Un groupe de travées connectées où la première travée du groupe est une travée orpheline.
Cela peut se produire pour plusieurs raisons, notamment :
Collection limits. Certaines applications à haut débit peuvent dépasser les limites de collecte (par exemple, les limites de collecte de l'agent APM ou les limites de l'API). Lorsque cela se produit, il peut en résulter une trace comportant des étendues manquantes. Une façon de remédier à cela est de désactiver certains rapports, afin que la limite ne soit pas atteinte.
Incorrect instrumentation. Si une application est instrumentée de manière incorrecte, elle ne passera pas correctement le contexte de trace et cela entraînera une trace fragmentée. Pour remédier à ce problème, examinez la source de données qui génère des étendues orphelines pour vous assurer que l’instrumentation est effectuée correctement. Pour découvrir la source de données d'une étendue, sélectionnez-la et examinez ses détails.
Spans still arriving. Si certains parents de span n'ont pas encore été collectés, cela peut entraîner des lacunes temporaires jusqu'à ce que la trace entière soit signalée.
UI display limits. Des étendues orphelines peuvent survenir si une trace dépasse la limite d'affichage d'étendue de 10 K.

Les traces préservées sont similaires aux instantanés de la trace originale. Ils archivent une trace complète qui a été précédemment consultée et qui a dépassé la période de conservation. Les traces complètes ne sont disponibles que pendant 7 jours, sauf si vous avez acheté une conservation prolongée (qui se refléterait automatiquement dans l'UI). Cependant, une trace préservée peut exister jusqu'à 1 an et fonctionne généralement comme la trace originale.

Notez que la trace préservée n'affichera pas les données de performances de portée ni les données d'anomalie de portée. La trace conservée peut ne pas être accessible si une entité dans une trace conservée est supprimée, expire ou cesse de signaler des données.

Screenshot showing how to locate a preserved trace

Si vous n'avez pas accès aux comptes New Relic qui monitorent d'autres services, certains détails de durée et de service seront masqués dans l'UI. L'obfuscation peut inclure :

Nom de la portée masqué par des astérisques
Le nom du service a été remplacé par l'ID de compte New Relic et l'ID d'application
Pour plus d'informations sur les facteurs affectant votre accès aux comptes, voir Accès au compte.

Une trace peut parfois avoir (ou sembler avoir) des étendues ou des services manquants. Cela peut se manifester par une différence entre le nombre d'étendues ou de services d'une trace affichés dans la liste des traces et le nombre affiché sur la page des détails de la trace .

Les raisons des écarts de portée manquants et des écarts de comptage incluent :

Un agent a peut-être atteint sa limite de collecte de portée.
Une étendue peut être initialement comptée mais ne pas être affichée dans un affichage de trace, pour des raisons telles que la latence du réseau ou un problème de requête.
L'UI a peut-être atteint sa limite d'affichage de 10 000.
Toutes les étendues collectées, y compris celles non affichées, peuvent être interrogées avec NRQL.

En plus de ces outils UI, vous pouvez également consulter l'exemple de requête NRQL dans Requête traces distribuées data.

Étape suivante :

Comprendre l' des trace détails UI

Cette traduction automatique est fournie pour votre commodité.

Comprendre et utiliser l'UI de tracing distribué

Ouvrir l'UI de tracing distribué

Conseil

Filtrez vos données de portée

Filtrer à l'aide de la barre de requête

Sélectionner les filtres du volet de gauche

Organisez vos données de portée

Trace similaire du groupe

Afficher la trace aberrante dans un nuage de points

Conseil

Détails supplémentaires UI

Comment comprendre les erreurs d'envergure

Conseil

Portées anormales

durée du client : différences de temps entre les durées du client et du serveur

Trace fragmentée

Trace préservée

Détails de la trace obscurcis en fonction de l'accès au compte

Limites de portée et échantillonnage

Noms de portée incomplets dans la vue en cascade

Travées manquantes et écarts entre le nombre de travées et de services

Étape suivante :

Cette traduction automatique est fournie pour votre commodité.

Comprendre et utiliser l'UI de tracing distribué

Ouvrir l'UI de tracing distribué .css-21sua1{background:none;border:none;width:0;padding:0;}

Conseil

Filtrez vos données de portée

Sélectionner les filtres du volet de gauche

Organisez vos données de portée

Trace similaire du groupe

Afficher la trace aberrante dans un nuage de points

Conseil

Détails supplémentaires UI

Comment comprendre les erreurs d'envergure

Portées anormales

durée du client : différences de temps entre les durées du client et du serveur

Trace fragmentée

Trace préservée

Détails de la trace obscurcis en fonction de l'accès au compte

Limites de portée et échantillonnage

Noms de portée incomplets dans la vue en cascade

Travées manquantes et écarts entre le nombre de travées et de services

Étape suivante :

Ouvrir l'UI de tracing distribué