L'intégration de New Relic inclut une intégration permettant de signaler vos métriques Microsoft Azure Machine Learning et d'autres données à New Relic. Ce document explique comment activer l'intégration et décrit les données rapportées.
Caractéristiques
New Relic collecte des données de métriques à partir d’Azure Monitor pour le service Azure Machine Learning. Azure Machine Learning est un cloud de services permettant d’accélérer et de gérer le cycle de vie des projets de machine learning. Les professionnels de l'apprentissage machine, les scientifiques des données et les ingénieurs peuvent l'utiliser dans leur workflow quotidien pour former et déployer des modèles ou gérer des MLOps
Grâce à New Relic, vous pouvez :
- Affichez les métriques Azure Machine Learning dans un dashboard prédéfini.
- Exécutez une requête personnalisée et visualisez les données.
- Créez une condition d'alerte pour vous avertir des changements de données.
Activer l'intégration
Suivez la procédure d'intégration Azure Monitor standarde pour activer votre Azure service dans le monitoring infrastructure de New Relic.
configuration et sondage
Vous pouvez modifier la fréquence d'interrogation et filtrer les données à l'aide des options de configuration.
New Relic interroge votre service Azure Machine Learning via l’intégration Azure Monitor selon un intervalle d’ interrogation par défaut.
Rechercher et utiliser des données
Pour explorer vos données d’intégration, accédez à one.newrelic.com/infra > Azure > (select an integration).
données métriques
Cette intégration collecte les données métriques suivantes :
Mesures Azure Machine Learning
Espaces de travail
Le tableau suivant répertorie les métriques disponibles pour le type de ressource Microsoft.MachineLearningServices/workspaces
.
métrique | Description |
---|---|
| Nombre de cœurs actifs |
| Nombre de nœuds actifs. Ce sont les nœuds qui exécutent activement une tâche. |
| Nombre d'exécutions où l'annulation a été demandée pour cet espace de travail. |
| Nombre d'exécutions annulées pour cet espace de travail. |
| Nombre d'exécutions terminées avec succès pour cet espace de travail. |
| Capacité maximale d'un nœud CPU en millicœurs. |
| Utilisation maximale de la mémoire d'un nœud CPU en mégaoctets. |
| Utilisation de la mémoire d'un nœud CPU en mégaoctets. |
| Pourcentage d'utilisation de la mémoire d'un nœud CPU. |
| Pourcentage d'utilisation sur un nœud CPU |
| Utilisation d'un nœud CPU en millicores |
| Pourcentage d'utilisation d'un nœud CPU. |
| Espace disque disponible en mégaoctets. |
| Données lues à partir du disque en mégaoctets |
| Espace disque utilisé en mégaoctets |
| Données écrites sur le disque en mégaoctets |
| Nombre d'erreurs d'exécution dans cet espace de travail |
| Nombre d'exécutions ayant échoué pour cet espace de travail |
| Données lues à partir du disque en mégaoctets |
| Capacité maximale d'un périphérique GPU en milli-GPU |
| Intervalle d'énergie en Joules sur un nœud GPU |
| Capacité de mémoire maximale d'un périphérique GPU en mégaoctets. |
| Pourcentage d'utilisation de la mémoire sur un nœud GPU. |
| Utilisation de la mémoire d'un périphérique GPU en mégaoctets |
| Pourcentage d'utilisation de la mémoire d'un périphérique GPU |
| Pourcentage d'utilisation sur un nœud GPU |
| Utilisation d'un périphérique GPU dans les milli-GPU |
| Pourcentage d'utilisation d'un périphérique GPU |
| Données réseau reçues via InfiniBand en mégaoctets |
| Données réseau envoyées via InfiniBand en mégaoctets |
| Nombre de cœurs inactifs |
| Nombre de nœuds inactifs |
| Nombre de noyaux sortants |
| Nombre de nœuds sortants |
| Nombre de déploiements de modèles ayant échoué dans cet espace de travail |
| Nombre de déploiements de modèle démarrés dans cet espace de travail |
| Nombre de déploiements de modèles réussis dans cet espace de travail |
| Nombre d'enregistrements de modèles ayant échoué dans cet espace de travail |
| Nombre d'enregistrements de modèles réussis dans cet espace de travail |
| Données réseau reçues en mégaoctets. Les Métriques sont regroupées par intervalles d'une minute |
| Données réseau envoyées en mégaoctets. Les Métriques sont agrégées par intervalles d'une minute. |
| Nombre d'exécutions ne répondant pas pour cet espace de travail. |
| Nombre d'exécutions dans l'état Non démarré pour cet espace de travail |
| Nombre de cœurs préemptés |
| Nombre de nœuds préemptés |
| Nombre d'exécutions en cours de préparation pour cet espace de travail. |
| Nombre d'exécutions en cours de provisionnement pour cet espace de travail. |
| Nombre d'exécutions en file d'attente pour cet espace de travail |
| Pourcentage du quota utilisé |
| Nombre d'exécutions en cours pour cet espace de travail |
| Nombre d'exécutions démarrées pour cet espace de travail |
| Nombre d'échecs d'appel d'API Azure Blob Storage. |
| Nombre de réussites d'appels d'API Azure Blob Storage. |
| Nombre total de cœurs |
| Nombre total de nœuds |
| Nombre de cœurs inutilisables |
| Nombre de nœuds inutilisables |
| Nombre d'avertissements d'exécution dans cet espace de travail |
Le tableau suivant répertorie les métriques disponibles pour le type de ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
.
métrique | Description |
---|---|
| Pourcentage d'utilisation de la mémoire sur une instance |
| Pourcentage d'utilisation du processeur sur une instance |
| Le nombre d'événements de collecte de données abandonnés par minute |
| Le nombre d'événements de collecte de données traités par minute. |
| Le nombre d'instances dans le déploiement |
| Pourcentage d'utilisation du disque sur une instance |
| Intervalle d'énergie en Joules sur un nœud GPU |
| Pourcentage d'utilisation de la mémoire GPU sur une instance |
| Pourcentage d'utilisation du GPU sur une instance. |
| La latence moyenne des requêtes P50 |
| La latence moyenne des requêtes P90 |
| La latence moyenne des requêtes P95 |
| La latence moyenne des requêtes P99 |
| Le nombre de requests envoyées au déploiement en ligne en une minute |
Le tableau suivant répertorie les métriques disponibles pour le type de ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints
.
métrique | Description |
---|---|
| Le nombre total de connexions TCP simultanées actives à partir des clients |
| Le nombre d'événements de collecte de données abandonnés par minute |
| Le nombre d'événements de collecte de données traités par minute |
| Les octets par seconde servis pour le point de terminaison |
| Le nombre moyen de nouvelles connexions TCP par seconde établies à partir de clients |
| L'intervalle de temps moyen complet nécessaire pour qu'une demande reçoive une réponse en millisecondes |
| La latence moyenne des requêtes P50 agrégée par toutes les valeurs de latence des requêtes collectées sur la période sélectionnée |
| La latence moyenne des requêtes P90 agrégée par toutes les valeurs de latence des requêtes collectées sur la période sélectionnée |
| La latence moyenne des requêtes P95 agrégée par toutes les valeurs de latence des requêtes collectées au cours de la période sélectionnée |
| La latence moyenne des requêtes P99 agrégée par toutes les valeurs de latence des requêtes collectées au cours de la période sélectionnée |
| Le nombre de requests envoyées au point de terminaison en ligne en une minute |