• /
  • EnglishEspañolFrançais日本語한국어Português
  • Se connecterDémarrer

Cette traduction automatique est fournie pour votre commodité.

En cas d'incohérence entre la version anglaise et la version traduite, la version anglaise prévaudra. Veuillez visiter cette page pour plus d'informations.

Créer un problème

Intégration d'Amazon SageMaker

New Relic s'intègre à Amazon Web Services (AWS) pour signaler vos métriques Amazon SageMaker et d'autres données à New Relic.

Ce document explique comment activer l'intégration et décrit les données signalées.

Caractéristiques

Collectez et envoyez des données télémétriques à New Relic depuis vos services Amazon SageMaker en utilisant notre intégration. Monitorez vos services, interrogez les données entrantes et créez un dashboard pour tout observer en un coup d'œil.

Activer l'intégration

Cette intégration est disponible via flux de métriques CloudWatch.

Pour activer cette intégration, découvrez comment connecter les services AWS à New Relic via les flux de métriques CloudWatch.

Rechercher et utiliser des données

Pour trouver les métriques de votre intégration, accédez à one.newrelic.com > Metrics and events et filtrez par aws.sagemaker.

données métriques

Cette intégration de New Relic Infrastructure collecte les données Amazon SageMaker suivantes :

Données métriques SageMaker

métrique (min, max, moyenne, compte, somme)

Unité

Description

Invocations

Compter

Le nombre de requests InvokeEndpoint envoyées à un point de terminaison de modèle.

InvocationsPerInstance

Compter

Le nombre d'appels envoyés à un modèle, normalisé par InstanceCount dans chaque ProductionVariant.

OverheadLatency

Microsecondes

L'intervalle de temps ajouté au temps nécessaire pour répondre à une demande client par les frais généraux de SageMaker.

ModelLatency

Microsecondes

L'intervalle de temps pris par un modèle pour répondre à une demande d'API SageMaker.

Invocation4XXErrors

Compter

Nombre de requests InvokeEndpoint pour lesquelles le modèle a renvoyé un code de réponse HTTP 4xx.

Invocation5XXErrors

Compter

Nombre de requests InvokeEndpoint pour lesquelles le modèle a renvoyé un code de réponse HTTP 5xx.

InvocationModelErrors

Compter

Le nombre de requests d'invocation de modèles qui n'ont pas abouti à une réponse HTTP 2XX.

Toutes les données importées depuis SageMaker ont une dimension : EndpointName

Sagemaker point de terminaison métrique data

métrique (min, max, moyenne, compte, somme)

Unité

Description

MemoryUtilization

Pour cent

Le pourcentage de mémoire utilisé par le conteneur sur une instance. Pour les variantes de point de terminaison, la valeur est la somme de l'utilisation de la mémoire du conteneur principal et supplémentaire sur l' instance.

DiskUtilization

Pour cent

Le pourcentage d'espace disque utilisé par le conteneur sur une instance . Pour les variantes de point de terminaison, la valeur est la somme de l'utilisation de l'espace disque du conteneur principal et supplémentaire sur l' instance.

CPUUtilization

Pour cent

La somme de l'utilisation de chaque cœur de processeur individuel. Pour les variantes de point de terminaison, la valeur est la somme de l'utilisation du processeur du conteneur principal et supplémentaire sur l' instance.

GPUMemoryUtilization

Pour cent

Le pourcentage de mémoire GPU utilisé par le conteneur sur une instance. Pour les variantes de point de terminaison, la valeur est la somme de l'utilisation de la mémoire GPU du conteneur principal et supplémentaire sur l' instance.

GPUUtilization

Pour cent

Le pourcentage d'unités GPU utilisées par le conteneur sur une instance. Pour les variantes de point de terminaison, la valeur est la somme de l'utilisation du GPU du conteneur principal et supplémentaire sur l' instance.

Toutes les données importées depuis le point de terminaison SageMaker ont une dimension : Host

Données métriques SageMaker Training Jobs

métrique (min, max, moyenne, compte, somme)

Unité

Description

MemoryUtilization

Pour cent

Le pourcentage de mémoire utilisé par le conteneur sur une instance. Pour le travail d'apprentissage, la valeur est l'utilisation de la mémoire de l'algorithme conteneur sur l' instance.

DiskUtilization

Pour cent

Le pourcentage d'espace disque utilisé par le conteneur sur une instance . Pour le travail d'apprentissage, la valeur est l'utilisation de l'espace disque du conteneur d'algorithmes sur l' instance.

CPUUtilization

Pour cent

La somme de l'utilisation de chaque cœur de processeur individuel. Pour le travail d'apprentissage, la valeur est l'utilisation du processeur du conteneur d'algorithmes sur l' instance.

TrainErrors

Compter

Mesure le nombre d'erreurs du train de travail d'apprentissage.

Toutes les données importées à partir des tâches de formation SageMaker ont une dimension : Host

Créer des alertes

Vous pouvez configurer pour qu'il vous avertisse en cas de changement. Par exemple, vous pouvez configurer une alerte pour informer les parties concernées des erreurs critiques ou fatales.

En savoir plus sur la création d’alertes ici.

Droits d'auteur © 2025 New Relic Inc.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.