• /
  • EnglishEspañolFrançais日本語한국어Português
  • Se connecterDémarrer

Cette traduction automatique est fournie pour votre commodité.

En cas d'incohérence entre la version anglaise et la version traduite, la version anglaise prévaudra. Veuillez visiter cette page pour plus d'informations.

Créer un problème

Intégration de NVIDIA Triton

Notre intégration NVIDIA Triton monitore le déploiement et la gestion du modèle d'IA dans l'environnement de production. Triton fournit une solution flexible et évolutive pour déployer des modèles d'apprentissage profond, permettant aux organisations de déployer efficacement des applications d'IA sur une variété de plates-formes matérielles, y compris les GPU et les CPU.

NVIDIA Triton dashboard

Après avoir configuré notre intégration NVIDIA Triton, nous vous fournissons un dashboard pour vos métriques NVIDIA Triton.

Installer l' agent d'infrastructure

Pour utiliser l’intégration NVIDIA Triton, vous devez également installer l’agent d’infrastructure sur le même hôte. L'agent infrastructure monitore l'hôte lui-même, tandis que l'intégration que vous installerez à l'étape suivante étend votre monitoring avec des données spécifiques à NVIDIA Triton.

Activer l'intégration NVIDIA Triton avec nri-prometheus

Les métriques du serveur Triton sont affichées à l'URL http://localhost:8002/metrics.

Pour configurer l’intégration NVIDIA Triton, suivez ces étapes :

  1. Exécutez cette commande pour créer un fichier nommé nri-prometheus-config.yml dans le répertoire d'intégration :

    bash
    $
    touch /etc/newrelic-infra/integrations.d/nri-prometheus-config.yml
  2. Ajoutez le snippet suivant à votre fichier nri-prometheus-config.yml pour permettre à l'agent de capturer les données NVIDIA Triton :

    integrations:
    - name: nri-prometheus
    config:
    # When standalone is set to false nri-prometheus requires an infrastructure agent to work and send data. Defaults to true
    standalone: false
    # When running with infrastructure agent emitters will have to include infra-sdk
    emitters: infra-sdk
    # The name of your cluster. It's important to match other New Relic products to relate the data.
    cluster_name: "YOUR_DESIRED_CLUSTER_NAME"
    targets:
    - description: NVIDIA Triton metrics list
    urls: ["http://localhost:8002/metrics"]
    # tls_config:
    # ca_file_path: "/etc/etcd/etcd-client-ca.crt"
    # cert_file_path: "/etc/etcd/etcd-client.crt"
    # key_file_path: "/etc/etcd/etcd-client.key"
    # Whether the integration should run in verbose mode or not. Defaults to false
    verbose: false
    # Whether the integration should run in audit mode or not. Defaults to false.
    # Audit mode logs the uncompressed data sent to New Relic. Use this to log all data sent.
    # It does not include verbose mode. This can lead to a high log volume, use with care
    audit: false
    # The HTTP client timeout when fetching data from endpoints. Defaults to 30s.
    # scrape_timeout: "30s"
    # Length in time to distribute the scraping from the endpoints
    scrape_duration: "5s"
    # Number of worker threads used for scraping targets.
    # For large clusters with many (>400) endpoints, slowly increase until scrape
    # time falls between the desired `scrape_duration`.
    # Increasing this value too much will result in huge memory consumption if too
    # many metrics are being scraped.
    # Default: 4
    # worker_threads: 4
    # Whether the integration should skip TLS verification or not. Defaults to false
    insecure_skip_verify: true
    timeout: 10s

Configuration du log NVIDIA Triton

Pour configurer le log Nvidia Triton, suivez les étapes décrites ci-dessous.

  1. Exécutez cette commande Docker pour vérifier l’état d’exécution du conteneur :

    bash
    $
    sudo docker ps
  2. Copiez l'ID du conteneur nvidia-triton et exécutez cette commande :

    bash
    $
    sudo docker logs -f <container_id> &> /tmp/triton.log &

    Vérifiez ensuite qu'il existe un fichier de log nommé triton.log situé dans le répertoire /tmp/.

Transfert du log NVIDIA Triton vers New Relic

Vous pouvez utiliser notre transfert de log pour transférer le log NVIDIA Triton vers New Relic. Sur les machines Linux, votre fichier de log nommé logging.yml doit se trouver dans ce chemin :

bash
$
cd /etc/newrelic-infra/logging.d/

Une fois que vous avez trouvé le fichier de log dans le chemin ci-dessus, incluez ce script dans le fichier logging.yml :

logs:
- name: triton.log
file: /tmp/triton.log
attributes:
logtype: triton_logs

Redémarrez l'agent New Relic Infrastructure

Exécutez cette commande pour redémarrer votre agent d’infrastructure:

bash
$
sudo systemctl restart newrelic-infra.service

Dans quelques minutes, votre serveur NVIDIA Triton enverra des métriques à one.newrelic.com.

Trouvez vos données

Vous pouvez choisir notre modèle dashboard prédéfini nommé NVIDIA Triton pour monitorer les métriques de votre serveur NVIDIA Triton. Suivez ces étapes pour utiliser notre modèle dashboard prédéfini :

  1. Allez sur one.newrelic.com > Integrations & Agents et tapez NVIDIA Triton.

  2. Sous Dashboards, cliquez sur NVIDIA Triton.

  3. Cliquez sur Edit si vous souhaitez modifier le compte dans la fenêtre contextuelle ouverte.

  4. Cliquez sur Setup NVIDIA Triton ou Skip this step si vous avez déjà configuré cette source de données.

  5. Cliquez sur View dashboard et consultez vos données NVIDIA Triton dans New Relic.

    Vous pouvez trouver votre dashboard NVIDIA Triton personnalisé dans l'UI Dashboards. Consultez notre section dashboard pour plus d'informations.

    Voici une requête NRQL pour vérifier la mémoire du processeur NVIDIA Triton :

    SELECT latest(nv_cpu_memory_total_bytes) / 1e+6 AS 'memory (MB)' FROM Metric

Quelle est la prochaine étape ?

Pour en savoir plus sur la création de requêtes NRQL et la génération de dashboards, consultez ces documents :

Droits d'auteur © 2025 New Relic Inc.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.