Intégration de NVIDIA Triton

Notre intégration NVIDIA Triton monitore le déploiement et la gestion du modèle d'IA dans l'environnement de production. Triton fournit une solution flexible et évolutive pour déployer des modèles d'apprentissage profond, permettant aux organisations de déployer efficacement des applications d'IA sur une variété de plates-formes matérielles, y compris les GPU et les CPU.

Après avoir configuré notre intégration NVIDIA Triton, nous vous fournissons un dashboard pour vos métriques NVIDIA Triton.

Installer l' agent d'infrastructure

Pour utiliser l’intégration NVIDIA Triton, vous devez également installer l’agent d’infrastructure sur le même hôte. L'agent infrastructure monitore l'hôte lui-même, tandis que l'intégration que vous installerez à l'étape suivante étend votre monitoring avec des données spécifiques à NVIDIA Triton.

Activer l'intégration NVIDIA Triton avec `nri-prometheus`

Les métriques du serveur Triton sont affichées à l'URL http://localhost:8002/metrics.

Conseil

Pour plus de détails sur la collecte des métriques du serveur Triton, veuillez vous référer à la documentation NVIDIA

Pour configurer l’intégration NVIDIA Triton, suivez ces étapes :

Exécutez cette commande pour créer un fichier nommé nri-prometheus-config.yml dans le répertoire d'intégration :
bash
```
$touch /etc/newrelic-infra/integrations.d/nri-prometheus-config.yml
```
Ajoutez le snippet suivant à votre fichier nri-prometheus-config.yml pour permettre à l'agent de capturer les données NVIDIA Triton :
```
integrations:
  - name: nri-prometheus
    config:
      # When standalone is set to false nri-prometheus requires an infrastructure agent to work and send data. Defaults to true
      standalone: false

      # When running with infrastructure agent emitters will have to include infra-sdk
      emitters: infra-sdk

      # The name of your cluster. It's important to match other New Relic products to relate the data.
      cluster_name: "YOUR_DESIRED_CLUSTER_NAME"

      targets:
        - description: NVIDIA Triton metrics list
          urls: ["http://localhost:8002/metrics"]

      #     tls_config:
      #     ca_file_path: "/etc/etcd/etcd-client-ca.crt"
      #     cert_file_path: "/etc/etcd/etcd-client.crt"
      #      key_file_path: "/etc/etcd/etcd-client.key"

      # Whether the integration should run in verbose mode or not. Defaults to false
      verbose: false

      # Whether the integration should run in audit mode or not. Defaults to false.
      # Audit mode logs the uncompressed data sent to New Relic. Use this to log all data sent.
      # It does not include verbose mode. This can lead to a high log volume, use with care
      audit: false

      # The HTTP client timeout when fetching data from endpoints. Defaults to 30s.
      # scrape_timeout: "30s"

      # Length in time to distribute the scraping from the endpoints
      scrape_duration: "5s"

      # Number of worker threads used for scraping targets.
      # For large clusters with many (&gt;400) endpoints, slowly increase until scrape
      # time falls between the desired `scrape_duration`.
      # Increasing this value too much will result in huge memory consumption if too
      # many metrics are being scraped.
      # Default: 4
      # worker_threads: 4

      # Whether the integration should skip TLS verification or not. Defaults to false
      insecure_skip_verify: true
    timeout: 10s
```

Configuration du log NVIDIA Triton

Pour configurer le log Nvidia Triton, suivez les étapes décrites ci-dessous.

Exécutez cette commande Docker pour vérifier l’état d’exécution du conteneur :
bash
```
$sudo docker ps
```
Copiez l'ID du conteneur nvidia-triton et exécutez cette commande :
bash
```
$sudo docker logs -f <container_id> &> /tmp/triton.log &
```
Vérifiez ensuite qu'il existe un fichier de log nommé triton.log situé dans le répertoire /tmp/.

Transfert du log NVIDIA Triton vers New Relic

Vous pouvez utiliser notre transfert de log pour transférer le log NVIDIA Triton vers New Relic. Sur les machines Linux, votre fichier de log nommé logging.yml doit se trouver dans ce chemin :

bash

$cd /etc/newrelic-infra/logging.d/

Une fois que vous avez trouvé le fichier de log dans le chemin ci-dessus, incluez ce script dans le fichier logging.yml :

logs:
  - name: triton.log
    file: /tmp/triton.log
    attributes:
      logtype: triton_logs

Redémarrez l'agent New Relic Infrastructure

Exécutez cette commande pour redémarrer votre agent d’infrastructure:

bash

$sudo systemctl restart newrelic-infra.service

Dans quelques minutes, votre serveur NVIDIA Triton enverra des métriques à one.newrelic.com.

Trouvez vos données

Vous pouvez choisir notre modèle dashboard prédéfini nommé NVIDIA Triton pour monitorer les métriques de votre serveur NVIDIA Triton. Suivez ces étapes pour utiliser notre modèle dashboard prédéfini :

Allez sur one.newrelic.com > Integrations & Agents et tapez NVIDIA Triton.
Sous Dashboards, cliquez sur NVIDIA Triton.
Cliquez sur Edit si vous souhaitez modifier le compte dans la fenêtre contextuelle ouverte.
Cliquez sur Setup NVIDIA Triton ou Skip this step si vous avez déjà configuré cette source de données.
Cliquez sur View dashboard et consultez vos données NVIDIA Triton dans New Relic.
Vous pouvez trouver votre dashboard NVIDIA Triton personnalisé dans l'UI Dashboards. Consultez notre section dashboard pour plus d'informations.
Voici une requête NRQL pour vérifier la mémoire du processeur NVIDIA Triton :
```
SELECT latest(nv_cpu_memory_total_bytes) / 1e+6 AS 'memory (MB)' FROM Metric
```

Quelle est la prochaine étape ?

Pour en savoir plus sur la création de requêtes NRQL et la génération de dashboards, consultez ces documents :

Introduction au générateur de requêtes pour créer des requêtes basiques et avancées.
Introduction au dashboard pour personnaliser votre dashboard et effectuer différentes actions.
Gérez votre dashboard pour ajuster votre mode d'affichage du dashboard ou pour ajouter plus de contenu à votre dashboard.

Cette traduction automatique est fournie pour votre commodité.

Installer l' agent d'infrastructure .css-21sua1{background:none;border:none;width:0;padding:0;}

Activer l'intégration NVIDIA Triton avec nri-prometheus