New Relic s'intègre à Amazon Web Services (AWS) pour signaler vos métriques Amazon SageMaker et d'autres données à New Relic.
Ce document explique comment activer l'intégration et décrit les données signalées.
Caractéristiques
Collectez et envoyez des données télémétriques à New Relic depuis vos services Amazon SageMaker en utilisant notre intégration. Monitorez vos services, interrogez les données entrantes et créez un dashboard pour tout observer en un coup d'œil.
Activer l'intégration
Cette intégration est disponible via flux de métriques CloudWatch.
Pour activer cette intégration, découvrez comment connecter les services AWS à New Relic via les flux de métriques CloudWatch.
Rechercher et utiliser des données
Pour trouver les métriques de votre intégration, accédez à one.newrelic.com > Metrics and events et filtrez par aws.sagemaker
.
données métriques
Cette intégration de New Relic Infrastructure collecte les données Amazon SageMaker suivantes :
Données métriques SageMaker
métrique (min, max, moyenne, compte, somme) | Unité | Description |
---|---|---|
| Compter | Le nombre de requests InvokeEndpoint envoyées à un point de terminaison de modèle. |
| Compter | Le nombre d'appels envoyés à un modèle, normalisé par InstanceCount dans chaque ProductionVariant. |
| Microsecondes | L'intervalle de temps ajouté au temps nécessaire pour répondre à une demande client par les frais généraux de SageMaker. |
| Microsecondes | L'intervalle de temps pris par un modèle pour répondre à une demande d'API SageMaker. |
| Compter | Nombre de requests InvokeEndpoint pour lesquelles le modèle a renvoyé un code de réponse HTTP 4xx. |
| Compter | Nombre de requests InvokeEndpoint pour lesquelles le modèle a renvoyé un code de réponse HTTP 5xx. |
| Compter | Le nombre de requests d'invocation de modèles qui n'ont pas abouti à une réponse HTTP 2XX. |
Toutes les données importées depuis SageMaker ont une dimension : EndpointName
Sagemaker point de terminaison métrique data
métrique (min, max, moyenne, compte, somme) | Unité | Description |
---|---|---|
| Pour cent | Le pourcentage de mémoire utilisé par le conteneur sur une instance. Pour les variantes de point de terminaison, la valeur est la somme de l'utilisation de la mémoire du conteneur principal et supplémentaire sur l' instance. |
| Pour cent | Le pourcentage d'espace disque utilisé par le conteneur sur une instance . Pour les variantes de point de terminaison, la valeur est la somme de l'utilisation de l'espace disque du conteneur principal et supplémentaire sur l' instance. |
| Pour cent | La somme de l'utilisation de chaque cœur de processeur individuel. Pour les variantes de point de terminaison, la valeur est la somme de l'utilisation du processeur du conteneur principal et supplémentaire sur l' instance. |
| Pour cent | Le pourcentage de mémoire GPU utilisé par le conteneur sur une instance. Pour les variantes de point de terminaison, la valeur est la somme de l'utilisation de la mémoire GPU du conteneur principal et supplémentaire sur l' instance. |
| Pour cent | Le pourcentage d'unités GPU utilisées par le conteneur sur une instance. Pour les variantes de point de terminaison, la valeur est la somme de l'utilisation du GPU du conteneur principal et supplémentaire sur l' instance. |
Toutes les données importées depuis le point de terminaison SageMaker ont une dimension : Host
Données métriques SageMaker Training Jobs
métrique (min, max, moyenne, compte, somme) | Unité | Description |
---|---|---|
| Pour cent | Le pourcentage de mémoire utilisé par le conteneur sur une instance. Pour le travail d'apprentissage, la valeur est l'utilisation de la mémoire de l'algorithme conteneur sur l' instance. |
| Pour cent | Le pourcentage d'espace disque utilisé par le conteneur sur une instance . Pour le travail d'apprentissage, la valeur est l'utilisation de l'espace disque du conteneur d'algorithmes sur l' instance. |
| Pour cent | La somme de l'utilisation de chaque cœur de processeur individuel. Pour le travail d'apprentissage, la valeur est l'utilisation du processeur du conteneur d'algorithmes sur l' instance. |
| Compter | Mesure le nombre d'erreurs du train de travail d'apprentissage. |
Toutes les données importées à partir des tâches de formation SageMaker ont une dimension : Host
Créer des alertes
Vous pouvez configurer pour qu'il vous avertisse en cas de changement. Par exemple, vous pouvez configurer une alerte pour informer les parties concernées des erreurs critiques ou fatales.
En savoir plus sur la création d’alertes ici.