Monitoramento do Microsoft SQL Server com NRDOT

Visualização

Ainda estamos trabalhando nesse recurso, mas adoraríamos que você experimentasse!

Atualmente, esse recurso é fornecido como parte de uma prévia, de acordo com nossas políticas de pré-lançamento.

A New Relic agora permite que sua equipe monitore o desempenho do banco de dados Microsoft SQL Server usando a New Relic Distribution of OpenTelemetry (NRDOT) com os recursos de monitoramento de banco de dados da New Relic. Esta integração fornece insights abrangentes sobre métricas de banco de dados, desempenho de consultas e saúde do sistema usando o coletor NRDOT.

Essa abordagem baseada em NRDOT complementa nossa Integração On-Host (OHI) existente, utilizando padrões OpenTelemetry para monitoramento de banco de dados, facilitando a integração com sua stack de observabilidade existente.

Pré-requisitos

Antes de começar, certifique-se de ter o seguinte:

Chave de licençada New Relic válida
Versões de banco de dados suportadas: SQL Server 2017 ou posterior
Configuração do banco de dados SQL Server:
- Acesso administrativo à sua instância do SQL Server (função sysadmin ou equivalente)
- Microsoft SQL Server que suporta instâncias gerenciadas on-premises
- Conectividade de rede entre o coletor NRDOT e o seu SQL Server
- SQL Server Management Studio (SSMS) ou utilitário sqlcmd
- Nome do host ou endereço IP do servidor
- Número da porta (geralmente 1433) ou porta personalizada
- Autenticação de domínio do Windows ou do SQL Server
- Preferência de SSL
Requisitos do sistema:
- Sistema Windows ou Linux para executar o coletor NRDOT
- Conectividade de rede para o endpoint OTLP da New Relic

Configurar o Coletor NRDOT para o monitoramento do Microsoft SQL Server

Você pode usar o coletor NRDOT para monitorar seus bancos de dados Microsoft SQL Server. O coletor NRDOT é uma distribuição pré-configurada que inclui componentes específicos da New Relic.

Para instalar e configurar o NRDOT Collector, siga estas etapas:

Configurar o Coletor NRDOT

Instale o coletor com base no seu sistema operacional e arquitetura.

Importante

Recomenda-se instalar o NRDOT Collector no mesmo host que sua instância do SQL Server para visualizar métricas de nível de infraestrutura para monitoramento de desempenho de consultas.

Baixe e execute o instalador colando este URL no seu navegador para baixar o instalador para a integração NRDOT Collector da New Relic.
```
https://download.newrelic.com/database-monitoring/nrdot-collector/nrdot-collector-host-windows-amd64-latest.msi
```
Localize o arquivo baixado e clique duas vezes nele para instalar o NRDOT Collector.

Para a arquitetura AMD64:
- Para distribuições baseadas em Debian/Ubuntu:
  bash
```
$curl -L -o nrdot-collector-host-linux-amd64.deb https://download.newrelic.com/database-monitoring/nrdot-collector/nrdot-collector-host-linux-amd64-latest.deb
$sudo dpkg -i nrdot-collector-host-linux-amd64.deb
```
- Para distribuições baseadas em RHEL/CentOS:
  bash
```
$curl -L -o nrdot-collector-host-linux-amd64.rpm https://download.newrelic.com/database-monitoring/nrdot-collector/nrdot-collector-host-linux-amd64-latest.rpm 
$sudo rpm -ivh nrdot-collector-host-linux-amd64.rpm
```

Para a arquitetura ARM64:

Para distribuições baseadas em Debian/Ubuntu:

bash

$curl -L -o nrdot-collector-host-linux-arm64.deb https://download.newrelic.com/database-monitoring/nrdot-collector/nrdot-collector-host-linux-arm64-latest.deb
$sudo dpkg -i nrdot-collector-host-linux-arm64.deb

Para distribuições baseadas em RHEL/CentOS:

bash

$curl -L -o nrdot-collector-host-linux-arm64.rpm https://download.newrelic.com/database-monitoring/nrdot-collector/nrdot-collector-host-linux-arm64-latest.rpm
$sudo rpm -ivh nrdot-collector-host-linux-arm64.rpm

Configurar usuário do banco de dados

Execute o seguinte script como um root user/sysadmin para criar o usuário de monitoramento newrelic e conceder permissões globais de leitura.

Para criar um usuário de monitoramento newrelic, execute o seguinte script usando o SQL Server Management Studio (SSMS):

USE [master];
GO
CREATE LOGIN [newrelic] WITH PASSWORD = '<PASSWORD>';
GO
-- Instance-level permissions
GRANT VIEW SERVER STATE TO [newrelic];
GRANT VIEW ANY DEFINITION TO [newrelic];
GRANT VIEW ANY DATABASE TO [newrelic];
GO
-- Grant read access privileges to all user databases
DECLARE @name SYSNAME;
DECLARE db_cursor CURSOR READ_ONLY FORWARD_ONLY FOR
SELECT [name]
FROM [master].[sys].[databases]
WHERE [name] NOT IN ('master', 'msdb', 'tempdb', 'model', 'rdsadmin', 'distribution')
AND [state] = 0; -- Only online databases
OPEN db_cursor;
FETCH NEXT FROM db_cursor INTO @name;
WHILE @@FETCH_STATUS = 0
BEGIN
  BEGIN TRY
    PRINT 'Processing database: ' + @name;
    EXEC('USE [' + @name + '];
    IF NOT EXISTS (SELECT 1 FROM sys.database_principals WHERE name = ''newrelic'')
    BEGIN
      CREATE USER [newrelic] FOR LOGIN [newrelic];
    END;
    GRANT VIEW DATABASE STATE TO [newrelic];
    GRANT VIEW DEFINITION TO [newrelic];
    ALTER ROLE db_datareader ADD MEMBER [newrelic];');
    PRINT 'Success: ' + @name;
  END TRY
  BEGIN CATCH
    PRINT 'Error on ' + @name + ': ' + ERROR_MESSAGE();
  END CATCH
  FETCH NEXT FROM db_cursor INTO @name;
END
CLOSE db_cursor;
DEALLOCATE db_cursor;
GO

Para criar um usuário de monitoramento newrelic no Linux, crie um arquivo chamado nr-grant-permission.sql na sua instância Linux com o seguinte conteúdo:

USE [master];
GO
CREATE LOGIN [newrelic] WITH PASSWORD = '<PASSWORD>';
GO
-- Instance-level permissions
GRANT VIEW SERVER STATE TO [newrelic];
GRANT VIEW ANY DEFINITION TO [newrelic];
GRANT VIEW ANY DATABASE TO [newrelic];
GO
-- Grant read access privileges to all user databases
DECLARE @name SYSNAME;
DECLARE db_cursor CURSOR READ_ONLY FORWARD_ONLY FOR
SELECT [name]
FROM [master].[sys].[databases]
WHERE [name] NOT IN ('master', 'msdb', 'tempdb', 'model', 'rdsadmin', 'distribution')
AND [state] = 0; -- Only online databases
OPEN db_cursor;
FETCH NEXT FROM db_cursor INTO @name;
WHILE @@FETCH_STATUS = 0
BEGIN
  BEGIN TRY
    PRINT 'Processing database: ' + @name;
    EXEC('USE [' + @name + '];
    IF NOT EXISTS (SELECT 1 FROM sys.database_principals WHERE name = ''newrelic'')
    BEGIN
      CREATE USER [newrelic] FOR LOGIN [newrelic];
    END;
    GRANT VIEW DATABASE STATE TO [newrelic];
    GRANT VIEW DEFINITION TO [newrelic];
    ALTER ROLE db_datareader ADD MEMBER [newrelic];');
    PRINT 'Success: ' + @name;
  END TRY
  BEGIN CATCH
    PRINT 'Error on ' + @name + ': ' + ERROR_MESSAGE();
  END CATCH
  FETCH NEXT FROM db_cursor INTO @name;
END
CLOSE db_cursor;
DEALLOCATE db_cursor;
GO

Para executar o script, execute o seguinte comando. Substitua <Your_SA_Password> pela sua senha de administrador do SQL Server:
bash
```
$sqlcmd -S localhost -U sa -P '<Your_SA_Password>' -C -i nr-grant-permission.sql
```

(Opcional) Para verificar se o usuário foi criado com sucesso e possui as permissões corretas, execute o seguinte comando. Substitua <Your_SA_Password> pela sua senha de administrador do SQL Server:

bash

$sqlcmd -S localhost -U sa -P '<Your_SA_Password>' -C -Q "SELECT sp.name AS [User], p.permission_name AS [Permission_Granted] FROM sys.server_permissions p JOIN sys.server_principals sp ON p.grantee_principal_id = sp.principal_id WHERE sp.name = 'newrelic';"

Saída esperada:

User Permission_Granted
---------------------------------------------------------------------------------------------
<your_username> CONNECT SQL
<your_username> VIEW ANY DEFINITION
<your_username> VIEW ANY DATABASE
<your_username> VIEW SERVER STATE

Esta saída confirma que seu usuário foi criado com sucesso com as permissões necessárias em nível de servidor.

Configurar o NRDOT Collector

Substitua seu config.yaml pelo conteúdo abaixo:

Windows: C:\Program Files (x86)\NRDOT Collector Host\config.yaml

Linux: /etc/nrdot-collector-host/config.yaml

Importante

Se você já é usuário do NRDOT Collector, certifique-se de mesclar a configuração acima com seu arquivo config.yaml existente. Isso inclui adicionar os novos receptores, processadores e exportadores para o monitoramento de banco de dados MSSQL, mantendo suas configurações atuais.

# NRDOT Collector Configuration for New Relic SQL Server Integration
# SQL Server On-Premises/VM Configuration

extensions:
  health_check:

receivers:
  otlp:
    protocols:
      grpc:
      http:

  hostmetrics:
    # Default collection interval is 60s. Lower if you need finer granularity.
    collection_interval: 60s
    scrapers:
      cpu:
        metrics:
          system.cpu.time:
            enabled: false
          system.cpu.utilization:
            enabled: true
      load:
      memory:
        metrics:
          system.memory.utilization:
            enabled: true
      paging:
        metrics:
          system.paging.utilization:
            enabled: false
          system.paging.faults:
            enabled: false
      filesystem:
        metrics:
          system.filesystem.utilization:
            enabled: true
      disk:
        metrics:
          system.disk.merged:
            enabled: false
          system.disk.pending_operations:
            enabled: false
          system.disk.weighted_io_time:
            enabled: false
      network:
        metrics:
          system.network.connections:
            enabled: false
     # Uncomment to enable process metrics, which can be noisy but valuable.
     # processes:
     # process:
     #  metrics:
     #    process.cpu.utilization:
     #      enabled: true
     #    process.cpu.time:
     #      enabled: false

  filelog:
    include:
      - /var/log/alternatives.log
      - /var/log/cloud-init.log
      - /var/log/auth.log
      - /var/log/dpkg.log
      - /var/log/syslog
      - /var/log/messages
      - /var/log/secure
      - /var/log/yum.log

  newrelicsqlserver:
    hostname: "<YOUR_DB_HOST>"
    port: "<YOUR_DB_PORT>"
    username: "<USERNAME>"
    password: "<PASSWORD>"
    monitored_databases: []
    # timeout: 30s
    # collection_interval: 15s  
    # query_monitoring_fetch_interval: 15
    # query_monitoring_response_time_threshold: 100
    # query_monitoring_count_threshold: 30
    # interval_calculator_cache_ttl_minutes: 10

    # Metric Category Toggles - Enable/disable entire categories of metrics
    # enable_instance_metrics: true
    # enable_database_metrics: true
    # enable_user_connection_metrics: true
    # enable_wait_time_metrics: true
    # enable_failover_cluster_metrics: true
    # enable_database_principals_metrics: true
    # enable_database_role_membership_metrics: true
    # enable_security_metrics: true
    # enable_lock_metrics: true
    # enable_thread_pool_metrics: true
    # enable_tempdb_metrics: true

processors:
  # group system.cpu metrics by cpu
  metricstransform:
    transforms:
      - include: system.cpu.utilization
        action: update
        operations:
          - action: aggregate_labels
            label_set: [ state ]
            aggregation_type: mean
      - include: system.paging.operations
        action: update
        operations:
          - action: aggregate_labels
            label_set: [ direction ]
            aggregation_type: sum

  # remove system.cpu metrics for states
  filter/exclude_cpu_utilization:
    metrics:
      datapoint:
        - 'metric.name == "system.cpu.utilization" and attributes["state"] == "interrupt"'
        - 'metric.name == "system.cpu.utilization" and attributes["state"] == "nice"'
        - 'metric.name == "system.cpu.utilization" and attributes["state"] == "softirq"'

  filter/exclude_memory_utilization:
    metrics:
      datapoint:
        - 'metric.name == "system.memory.utilization" and attributes["state"] == "slab_unreclaimable"'
        - 'metric.name == "system.memory.utilization" and attributes["state"] == "inactive"'
        - 'metric.name == "system.memory.utilization" and attributes["state"] == "cached"'
        - 'metric.name == "system.memory.utilization" and attributes["state"] == "buffered"'
        - 'metric.name == "system.memory.utilization" and attributes["state"] == "slab_reclaimable"'

  filter/exclude_memory_usage:
    metrics:
      datapoint:
        - 'metric.name == "system.memory.usage" and attributes["state"] == "slab_unreclaimable"'
        - 'metric.name == "system.memory.usage" and attributes["state"] == "inactive"'

  filter/exclude_filesystem_utilization:
    metrics:
      datapoint:
        - 'metric.name == "system.filesystem.utilization" and attributes["type"] == "squashfs"'

  filter/exclude_filesystem_usage:
    metrics:
      datapoint:
        - 'metric.name == "system.filesystem.usage" and attributes["type"] == "squashfs"'
        - 'metric.name == "system.filesystem.usage" and attributes["state"] == "reserved"'

  filter/exclude_filesystem_inodes_usage:
    metrics:
      datapoint:
        - 'metric.name == "system.filesystem.inodes.usage" and attributes["type"] == "squashfs"'
        - 'metric.name == "system.filesystem.inodes.usage" and attributes["state"] == "reserved"'

  filter/exclude_system_disk:
    metrics:
      datapoint:
        - 'metric.name == "system.disk.operations" and IsMatch(attributes["device"], "^loop.*") == true'
        - 'metric.name == "system.disk.merged" and IsMatch(attributes["device"], "^loop.*") == true'
        - 'metric.name == "system.disk.io" and IsMatch(attributes["device"], "^loop.*") == true'
        - 'metric.name == "system.disk.io_time" and IsMatch(attributes["device"], "^loop.*") == true'
        - 'metric.name == "system.disk.operation_time" and IsMatch(attributes["device"], "^loop.*") == true'

  filter/exclude_system_paging:
    metrics:
      datapoint:
        - 'metric.name == "system.paging.usage" and attributes["state"] == "cached"'
        - 'metric.name == "system.paging.operations" and attributes["type"] == "cached"'

  filter/exclude_network:
    metrics:
      datapoint:
        - 'IsMatch(metric.name, "^system.network.*") == true and attributes["device"] == "lo"'

  attributes/exclude_system_paging:
    include:
      match_type: strict
      metric_names:
        - system.paging.operations
    actions:
      - key: type
        action: delete

  # Transform to clear description and unit fields
  transform/clear_metadata:
    metric_statements:
      - context: metric
        statements:
          - set(metric.description, "")
          - set(metric.unit, "")

  # Filter to only include execution plan and event metrics (for logs conversion)
  filter/exec_plan_include:
    metrics:
      include:
        match_type: strict
        metric_names:
          - sqlserver.slowquery.query_details
          - sqlserver.execution.plan
          - sqlserver.blocking_query.details
          - sqlserver.activequery.query_details

  # Filter to exclude execution plan and event metrics (from main metrics pipeline)
  filter/exec_plan_exclude:
    metrics:
      exclude:
        match_type: strict
        metric_names:
          - sqlserver.slowquery.query_details
          - sqlserver.execution.plan
          - sqlserver.blocking_query.details
          - sqlserver.activequery.query_details

  cumulativetodelta:
    max_staleness: 5m
    include:
      match_type: strict
      metrics:
        # Wait stats (sys.dm_os_wait_stats)
        - sqlserver.wait_stats.latch.wait_time_ms
        - sqlserver.wait_stats.latch.waiting_tasks_count
        - sqlserver.wait_stats.wait_time_ms
        - sqlserver.wait_stats.waiting_tasks_count
        # Instance stats (sys.dm_os_performance_counters)
        - sqlserver.stats.sql_compilations_per_sec
        - sqlserver.stats.sql_recompilations_per_sec
        - sqlserver.stats.lock_waits_per_sec
        - sqlserver.stats.deadlocks_per_sec
        - sqlserver.stats.user_errors_per_sec
        - sqlserver.stats.kill_connection_errors_per_sec
        - sqlserver.access.page_splits_per_sec
        - sqlserver.buffer.checkpoint_pages_per_sec
        - sqlserver.bufferpool.batch_requests_per_sec
        - sqlserver.instance.transactions_per_sec
        - sqlserver.instance.forced_parameterizations_per_sec
        - sqlserver.instance.full_scans_rate
        - sqlserver.instance.lock_timeouts_rate
        # Database log (sys.dm_os_performance_counters)
        - sqlserver.database.log.flushes_per_sec
        - sqlserver.database.log.bytes_flushed_per_sec
        - sqlserver.database.log.flush_waits_per_sec
        # Failover cluster
        - sqlserver.failover_cluster.log_bytes_received_per_sec
        # User connections
        - sqlserver.user_connections.authentication.logins_per_sec

  deltatorate:
    metrics:
      - sqlserver.wait_stats.latch.wait_time_ms
      - sqlserver.wait_stats.latch.waiting_tasks_count
      - sqlserver.wait_stats.wait_time_ms
      - sqlserver.wait_stats.waiting_tasks_count
      - sqlserver.stats.sql_compilations_per_sec
      - sqlserver.stats.sql_recompilations_per_sec
      - sqlserver.stats.lock_waits_per_sec
      - sqlserver.stats.deadlocks_per_sec
      - sqlserver.stats.user_errors_per_sec
      - sqlserver.stats.kill_connection_errors_per_sec
      - sqlserver.access.page_splits_per_sec
      - sqlserver.buffer.checkpoint_pages_per_sec
      - sqlserver.bufferpool.batch_requests_per_sec
      - sqlserver.instance.transactions_per_sec
      - sqlserver.instance.forced_parameterizations_per_sec
      - sqlserver.instance.full_scans_rate
      - sqlserver.instance.lock_timeouts_rate
      - sqlserver.database.log.flushes_per_sec
      - sqlserver.database.log.bytes_flushed_per_sec
      - sqlserver.database.log.flush_waits_per_sec
      - sqlserver.failover_cluster.log_bytes_received_per_sec
      - sqlserver.user_connections.authentication.logins_per_sec

  transform/host:
    metric_statements:
      - context: metric
        statements:
          - set(metric.description, "")
          - set(metric.unit, "")

  transform:
    trace_statements:
      - context: span
        statements:
          - truncate_all(span.attributes, 4095)
          - truncate_all(resource.attributes, 4095)
    log_statements:
      - context: log
        statements:
          - truncate_all(log.attributes, 4095)
          - truncate_all(resource.attributes, 4095)

  # used to prevent out of memory situations on the collector
  memory_limiter:
    check_interval: 1s
    limit_mib: ${env:NEW_RELIC_MEMORY_LIMIT_MIB:-100}

  batch:

  resourcedetection:
    detectors: ["system"]
    system:
      hostname_sources: ["os"]
      resource_attributes:
        host.id:
          enabled: true

  resourcedetection/db_safe:
    detectors: ["system"]
    override: false
    system:
      hostname_sources: ["os"]
      resource_attributes:
        host.id:
          enabled: true

  resourcedetection/cloud:
    detectors: ["gcp", "ec2", "azure"]
    timeout: 2s
    override: true

  resourcedetection/env:
    detectors: ["env"]
    timeout: 2s
    override: true

connectors:
  metricsaslogs:
    include_resource_attributes: true
    include_scope_info: true

exporters:
  otlphttp:
    endpoint: "<YOUR_NEWRELIC_OTLP_ENDPOINT>"
    headers:
      api-key: "<YOUR_NEWRELIC_API_KEY>"
    compression: gzip

service:
  pipelines:
    metrics/host:
      receivers: [hostmetrics]
      processors:
        - memory_limiter
        - metricstransform
        - filter/exclude_cpu_utilization
        - filter/exclude_memory_utilization
        - filter/exclude_memory_usage
        - filter/exclude_filesystem_utilization
        - filter/exclude_filesystem_usage
        - filter/exclude_filesystem_inodes_usage
        - filter/exclude_system_disk
        - filter/exclude_network
        - attributes/exclude_system_paging
        - transform/host
        - resourcedetection
        - resourcedetection/cloud
        - resourcedetection/db_safe
        - resourcedetection/env
        - cumulativetodelta
        - deltatorate
        - batch
      exporters: [otlphttp]
    traces:
      receivers: [otlp]
      processors: [memory_limiter, transform, resourcedetection, resourcedetection/cloud, resourcedetection/env, batch]
      exporters: [otlphttp]
    metrics:
      receivers: [newrelicsqlserver, otlp]
      processors: [memory_limiter, transform, resourcedetection, resourcedetection/cloud, resourcedetection/env, filter/exec_plan_exclude, batch]
      exporters: [otlphttp]
    logs:
      receivers: [metricsaslogs, otlp]
      processors: [memory_limiter, transform, resourcedetection, resourcedetection/cloud, resourcedetection/env, batch]
      exporters: [otlphttp]
    metrics/exec_plan_to_logs:
      receivers: [newrelicsqlserver, otlp]
      processors: [memory_limiter, transform, resourcedetection, resourcedetection/cloud, resourcedetection/env, filter/exec_plan_include, batch]
      exporters: [metricsaslogs]
  extensions: [health_check]

Parâmetro de configuração

A tabela a seguir descreve os principais parâmetros de configuração para o receptor newrelicsqlserver:

Parâmetro	Descrição
`<YOUR_DB_HOST>`	Insira o nome do host ou endereço IP do SQL Server
`<YOUR_DB_PORT>`	Insira o número da porta do SQL Server. O valor padrão está definido como 1433.
`<USERNAME>`	Insira seu nome de usuário do banco de dados para autenticação
`<PASSWORD>`	Insira a senha do seu banco de dados para autenticação
`<YOUR_NEWRELIC_OTLP_ENDPOINT>`	Insira o endpoint OTLP da New Relic. Para mais informações, consulte a documentação dos endpoints OTLP da New Relic.
`<YOUR_NEWRELIC_API_KEY>`	Insira sua chave de API da New Relic.
`query_monitoring_response_time_threshold`	Tempo mínimo de resposta em milissegundos para considerar uma consulta como lenta. O valor padrão é definido como `100` ms.
`query_monitoring_count_threshold`	Contagem mínima de execuções para incluir uma consulta no monitoramento. O valor padrão está definido como `30` .
`query_monitoring_fetch_interval`	Intervalo em segundos para buscar dados de monitoramento de consultas. O valor padrão está definido como `15` segundos.
`collection_interval`	Intervalo em segundos para coletar métricas. O valor padrão está definido como `15s` .

Reiniciar o coletor NRDOT

Após atualizar sua configuração, reinicie o serviço do coletor NRDOT:

Para Windows, para reiniciar o serviço NRDOT Collector, execute:
bash
```
$net stop nrdot-collector-host
$net start nrdot-collector-host
```
Para Linux, para reiniciar o serviço NRDOT Collector, execute:
bash
```
$sudo systemctl restart nrdot-collector-host
```
Dica
Sempre reinicie o serviço do coletor NRDOT após fazer alterações na configuração para garantir que as novas configurações entrem em vigor.

(Opcional) Configurar a correlação entre APM e banco de dados

Para correlacionar o desempenho da sua aplicação com as operações de banco de dados, você pode configurar a identificação de serviço de banco de dados. Este recurso permite visualizar exatamente quais aplicativos estão gerando workloads específicas de banco de dados. Para mais informações, consulte configurar a identificação de serviço de banco de dados para obter a correlação APM-banco de dados no New Relic.

Importante

Para visualizar dados de desempenho do banco de dados no APM, ambas as entidades devem estar na mesma conta New Relic. Se as entidades estiverem em contas diferentes da New Relic, você deve ter acesso a ambas as contas para visualizar os dados.

(Opcional) Configurar o gerenciamento de segredos

O recurso de gerenciamento de segredos permite gerenciar com segurança informações confidenciais, como credenciais de banco de dados. Isso ajuda a aprimorar a segurança do seu ambiente de monitoramento ao evitar a inserção direta de dados sensíveis nos arquivos de configuração. Para mais informações, consulte gerenciamento de segredos.

Encontre e use seus dados

Assim que seus dados estiverem sendo coletados, você poderá acessar o monitoramento abrangente do banco de dados SQL Server por meio da interface do New Relic.

Para encontrar sua entidade de banco de dados SQL Server no New Relic:

Vá para https://one.newrelic.com > All Capabilities > Databases.
Defina os critérios de pesquisa como instrumentation.provider = opentelemetry.
Selecione seu banco de dados SQL Server na lista de entidades.

Comandos suportados pelo coletor NRDOT

Para gerenciar o serviço NRDOT Collector, visualizar logs ou verificar o status do serviço, use os seguintes comandos disponíveis com base no seu sistema operacional.

Para reiniciar o NRDOT Collector:

bash

$net stop nrdot-collector-host
$net start nrdot-collector-host

Para verificar o status do NRDOT Collector:
bash
```
$sc query nrdot-collector-host
```
Para visualizar os logs do NRDOT Collector:
1. Digite Event Viewer na barra de pesquisa e selecione-o.
2. Na barra lateral esquerda, expanda a pasta chamada Windows Logs.
3. Clique em Aplicação para carregar os eventos específicos da aplicação no painel central.
4. Procure eventos com tipo de origem = nrdot-collector-host
Para excluir o serviço NRDOT Collector, desinstale via Add/Remove Programs.

Para validar o status da instalação:
- Para distribuições baseadas em Debian/Ubuntu:
  bash
```
$dpkg -l | grep nrdot-collector-host
```
- Para distribuições baseadas em RHEL/CentOS:
  bash
```
$rpm -q nrdot-collector-host || ls /etc/nrdot-collector-host
```

Para reiniciar o NRDOT Collector:

bash

$sudo systemctl restart nrdot-collector-host

Para verificar o status do NRDOT Collector:
bash
```
$sudo systemctl status nrdot-collector-host
```
Para visualizar os logs do NRDOT Collector:
bash
```
$sudo journalctl -u nrdot-collector-host -f
```
Para excluir o serviço NRDOT Collector:
- Para distribuições baseadas em Debian/Ubuntu:
  bash
```
$sudo apt-get purge -y nrdot-collector-host
```
- Para distribuições baseadas em RHEL/CentOS:
  bash
```
$sudo dnf remove -y nrdot-collector-host&& sudo rm -rf /etc/nrdot-collector-host
```

Resolução de problemas

Se você encontrar problemas de conectividade de rede com o NRDOT Collector, execute os seguintes comandos para testar a conectividade com sua instância do SQL Server na porta 1433:

Para Windows, execute:

bash

$Test-NetConnection -ComputerName <YOUR_IP_ADDRESS> -Port <YOUR_PORT_NUMBER>

Para Linux, execute:

bash

$nc -zv <YOUR_IP_ADDRESS> <YOUR_PORT_NUMBER>

Métricas disponíveis

Monitore o desempenho do seu banco de dados SQL Server com métricas organizadas por flags de configuração. As métricas padrão são coletadas automaticamente para a funcionalidade da interface do New Relic. Você também pode usar as métricas adicionais fornecidas para obter insights avançados e mais profundos ao ativar scrapers específicos.

Métrica padrão

Essas métricas são essenciais para os recursos de monitoramento do SQL Server da New Relic e são coletadas automaticamente, independentemente da sua configuração.

Nome da métrica	Descrição
`sqlserver.stats.connections`	Conexões de usuário atuais
`sqlserver.instance.blocked_processes_count`	Número de processos bloqueados
`sqlserver.instance.buffer_pool_hit_percent`	Porcentagem de acertos do pool de buffer
`sqlserver.instance.buffer_pool_size`	Tamanho do pool de buffer
`sqlserver.instance.compilations_per_batch`	Compilações SQL por solicitação em lote
`sqlserver.instance.connections_active`	Número de conexões ativas
`sqlserver.instance.forced_parameterizations_per_sec`	Parametrizações forçadas por segundo
`sqlserver.instance.full_scans_rate`	Varreduras completas de tabela/índice por segundo
`sqlserver.instance.lock_timeouts_rate`	Número de tempos limite de bloqueio por segundo
`sqlserver.instance.memory_available`	Memória física disponível no sistema
`sqlserver.instance.memory_utilization_percent`	Porcentagem de utilização de memória
`sqlserver.instance.page_splits_per_batch`	Divisões de página por solicitação em lote
`sqlserver.instance.target_memory_kb`	Memória do servidor de destino em KB
`sqlserver.instance.transactions_per_sec`	Transações por segundo
`sqlserver.buffer.cache_hit_ratio`	Porcentagem da taxa de acerto do buffer cache
`sqlserver.buffer.checkpoint_pages_per_sec`	Páginas de ponto de verificação por segundo
`sqlserver.buffer.page_life_expectancy`	Expectativa de vida da página em segundos
`sqlserver.bufferpool.page_life_expectancy_ms`	Expectativa de vida da página em milissegundos
`sqlserver.database.io.stall_ms`	Tempo total de espera de E/S para o banco de dados SQL Server
`sqlserver.database.log.flushes_per_sec`	Número de operações de descarga de log por segundo
`sqlserver.database.log.transaction_growth`	Número de eventos de crescimento de log para o banco de dados SQL Server
`sqlserver.database.page_file_available_bytes`	Espaço de arquivo de paginação disponível para o banco de dados SQL Server
`sqlserver.database.page_file_total_bytes`	Espaço total do arquivo de paginação para o banco de dados SQL Server
`sqlserver.database.size.data_mb`	Tamanho total do arquivo de dados excluindo arquivos de log
`sqlserver.database.size.total_mb`	Tamanho total do banco de dados, incluindo arquivos de dados e de log
`sqlserver.stats.deadlocks_per_sec`	Deadlocks por segundo
`sqlserver.stats.kill_connection_errors_per_sec`	Erros de encerramento de conexão por segundo
`sqlserver.stats.lock_waits_per_sec`	Esperas de bloqueio por segundo
`sqlserver.stats.sql_compilations_per_sec`	Compilações SQL por segundo
`sqlserver.stats.sql_recompilations_per_sec`	Recompilações SQL por segundo
`sqlserver.stats.user_errors_per_sec`	Erros de usuário por segundo
`sqlserver.wait_stats.wait_time_ms`	Tempo total de espera em milissegundos
`sqlserver.access.page_splits_per_sec`	Divisões de página por segundo
`sqlserver.execution.plan`	Operador de plano de execução do SQL Server com estimativas de custo detalhadas
`sqlserver.plan.avg_elapsed_time_ms`	Tempo médio decorrido por execução deste plano (histórico)
`sqlserver.slowquery.avg_elapsed_time_ms`	Tempo médio decorrido por execução em milissegundos
`sqlserver.slowquery.historical_avg_elapsed_time_ms`	Média histórica do tempo decorrido em milissegundos
`sqlserver.slowquery.historical_execution_count`	Contagem histórica de execuções
`sqlserver.slowquery.historical_logical_reads`	Total histórico de leituras lógicas
`sqlserver.slowquery.historical_physical_reads`	Total histórico de leituras físicas
`sqlserver.slowquery.historical_rows`	Total histórico de linhas retornadas
`sqlserver.slowquery.historical_wait_time_ms`	Tempo total de espera histórico em milissegundos
`sqlserver.slowquery.historical_worker_time_ms`	Tempo total histórico de trabalho (CPU) em milissegundos
`sqlserver.slowquery.interval_avg_elapsed_time_ms`	Tempo médio decorrido do intervalo em milissegundos
`sqlserver.slowquery.interval_avg_logical_reads`	Média de leituras lógicas do intervalo por execução
`sqlserver.slowquery.interval_avg_physical_reads`	Média do intervalo de leituras físicas por execução
`sqlserver.slowquery.interval_avg_rows`	Média de linhas retornadas por execução no intervalo
`sqlserver.slowquery.interval_avg_wait_time_ms`	Tempo médio de espera do intervalo por execução em milissegundos
`sqlserver.slowquery.interval_avg_worker_time_ms`	Tempo médio de worker (CPU) do intervalo por execução em milissegundos
`sqlserver.slowquery.interval_elapsed_time_ms`	Tempo total decorrido do intervalo em milissegundos
`sqlserver.slowquery.interval_execution_count`	Contagem de execução do intervalo
`sqlserver.slowquery.interval_logical_reads`	Leituras lógicas do intervalo
`sqlserver.slowquery.interval_physical_reads`	Leituras físicas do intervalo
`sqlserver.slowquery.interval_rows`	Linhas de intervalo retornadas
`sqlserver.slowquery.interval_wait_time_ms`	Tempo de espera do intervalo em milissegundos
`sqlserver.slowquery.interval_worker_time_ms`	Tempo de worker (CPU) do intervalo em milissegundos
`sqlserver.slowquery.query_details`	Detalhes da consulta, incluindo texto e carimbos de data/hora para consultas lentas
`sqlserver.activequery.wait_time_seconds`	Tempo de espera da consulta em execução
`sqlserver.blocking_query.details`	Detalhes da consulta de bloqueio para correlação com consultas ativas

Métricas adicionais

Habilite estas métricas adicionais conforme necessário para obter insights mais aprofundados sobre o desempenho e a saúde do seu banco de dados SQL Server.

Ative o enable_instance_metrics: true para coletar estas métricas:

Nome da métrica	Descrição
`sqlserver.instance.background_processes_count`	Número de processos em segundo plano
`sqlserver.instance.disk_in_bytes`	Espaço total em disco em bytes
`sqlserver.instance.dormant_processes_count`	Número de processos dormentes
`sqlserver.instance.memory_total`	Memória física total no sistema
`sqlserver.instance.preconnect_processes_count`	Número de processos de pré-conexão
`sqlserver.instance.runnable_processes_count`	Número de processos executáveis
`sqlserver.instance.runnable_tasks`	Número de tarefas executáveis
`sqlserver.instance.running_processes_count`	Número de processos em execução
`sqlserver.instance.sleeping_processes_count`	Número de processos adormecidos
`sqlserver.instance.suspended_processes_count`	Número de processos suspensos

Nome da métrica	Descrição
`sqlserver.bufferpool.batch_requests_per_sec`	Requisições em lote por segundo

Nome da métrica	Descrição
`sqlserver.connections.user`	Número de conexões de usuário

Ative o enable_database_metrics: true para coletar estas métricas:

Nome da métrica	Descrição
`sqlserver.database.bufferpool.size_per_database_bytes`	Tamanho do pool de buffers do SQL Server alocado para o banco de dados
`sqlserver.database.log.bytes_flushed_per_sec`	Número de bytes de log descarregados por segundo
`sqlserver.database.log.flush_waits_per_sec`	Número de operações de espera de flush por segundo
`sqlserver.database.log.used_space_mb`	Espaço de logs usado em megabytes
`sqlserver.database.max_disk_size_bytes`	Tamanho máximo de disco permitido para o banco de dados SQL Server
`sqlserver.database.principals.applicationRoles`	Número de funções da aplicação
`sqlserver.database.principals.old`	Número de entidades principais antigas (mais antigas que 365 dias)
`sqlserver.database.principals.orphanedUsers`	Número de usuários órfãos sem login de servidor
`sqlserver.database.principals.recentlyCreated`	Número de principais criados recentemente (últimos 30 dias)
`sqlserver.database.principals.roles`	Número de funções do banco de dados
`sqlserver.database.principals.sqlUsers`	Número de usuários de autenticação SQL
`sqlserver.database.principals.total`	Número total de entidades de segurança do banco de dados
`sqlserver.database.principals.users`	Número de usuários do banco de dados
`sqlserver.database.principals.windowsUsers`	Número de usuários de autenticação do Windows
`sqlserver.database.role.members.applicationRoles`	Número de membros da função de aplicativo
`sqlserver.database.role.members.crossRole`	Número de membros entre funções
`sqlserver.database.role.members.highPrivilege`	Número de membros de funções de alto privilégio
`sqlserver.database.role.members.unique`	Número de membros únicos em funções
`sqlserver.database.role.memberships.active`	Número de associações de função ativas
`sqlserver.database.role.memberships.custom`	Número de associações de funções personalizadas
`sqlserver.database.role.memberships.nested`	Número de associações de função aninhadas
`sqlserver.database.role.memberships.total`	Número total de associações de função
`sqlserver.database.role.memberships.users`	Número de associações de funções de usuário
`sqlserver.database.role.permission.memberCount`	Número de membros na função
`sqlserver.database.role.permission.riskLevel`	Nível de risco da função
`sqlserver.database.role.roles.empty`	Número de funções vazias
`sqlserver.database.role.roles.withMembers`	Número de funções únicas com membros
`sqlserver.database.transactions.active`	Número de transações ativas

Ative o enable_failover_cluster_metrics: true para coletar estas métricas:

Nome da métrica	Descrição
`sqlserver.failover_cluster.ag_cluster_type`	Tipo de cluster para o grupo de disponibilidade
`sqlserver.failover_cluster.ag_failure_condition_level`	Nível de condição de failover automático para o grupo de disponibilidade
`sqlserver.failover_cluster.ag_health_check_timeout`	Tempo limite da verificação de integridade do grupo de disponibilidade em milissegundos
`sqlserver.failover_cluster.ag_replica_role`	Papel atual da réplica no Grupo de Disponibilidade
`sqlserver.failover_cluster.ag_required_sync_secondaries`	Número de réplicas secundárias síncronas necessárias para confirmar transações
`sqlserver.failover_cluster.ag_synchronization_health`	Saúde da sincronização de dados entre réplica primária e secundária
`sqlserver.failover_cluster.flow_control_time_ms`	Tempo gasto no controle de fluxo por registros de log da réplica primária em milissegundos por segundo
`sqlserver.failover_cluster.log_bytes_received_per_sec`	Taxa de registros de log recebidos pela réplica secundária da réplica primária em bytes por segundo
`sqlserver.failover_cluster.log_send_queue_kb`	Quantidade de registros de log na fila de envio de log aguardando para serem enviados para a réplica secundária em kilobytes
`sqlserver.failover_cluster.redo_queue_kb`	Quantidade de registros de log na fila de refazer aguardando para serem refeitos na réplica secundária em kilobytes
`sqlserver.failover_cluster.redo_rate_kb_sec`	Taxa na qual os registros de log estão sendo refeitos na réplica secundária em quilobytes por segundo
`sqlserver.failover_cluster.transaction_delay_ms`	Atraso médio para transações na réplica secundária em milissegundos

Ative o enable_lock_metrics: true para coletar estas métricas:

Nome da métrica	Descrição
`sqlserver.lock.mode.bulk_update`	Número de bloqueios de atualização em massa
`sqlserver.lock.mode.exclusive`	Número de bloqueios exclusivos
`sqlserver.lock.mode.intent`	Número de bloqueios de intenção
`sqlserver.lock.mode.schema`	Número de bloqueios de esquema
`sqlserver.lock.mode.shared`	Número de bloqueios compartilhados
`sqlserver.lock.mode.shared_intent_exclusive`	Número de bloqueios compartilhados com intenção exclusiva
`sqlserver.lock.mode.total`	Total de bloqueios ativos por modo
`sqlserver.lock.mode.update`	Número de bloqueios de atualização
`sqlserver.lock.resource.allocation_unit`	Número de bloqueios de unidade de alocação
`sqlserver.lock.resource.application`	Número de bloqueios de aplicação
`sqlserver.lock.resource.database_level`	Número de bloqueios em nível de banco de dados
`sqlserver.lock.resource.extent`	Número de bloqueios em nível de extensão
`sqlserver.lock.resource.file`	Número de bloqueios em nível de arquivo
`sqlserver.lock.resource.hobt`	Número de bloqueios de heap ou B-tree
`sqlserver.lock.resource.key`	Número de bloqueios em nível de chave
`sqlserver.lock.resource.metadata`	Número de bloqueios de metadados
`sqlserver.lock.resource.page`	Número de bloqueios em nível de página
`sqlserver.lock.resource.row`	Número de bloqueios em nível de linha
`sqlserver.lock.resource.table`	Número de bloqueios em nível de tabela
`sqlserver.lock.resource.total`	Total de bloqueios ativos no banco de dados

Nome da métrica	Descrição
`sqlserver.locked_object`	Objeto de banco de dados bloqueado por uma sessão

Ative o enable_instance_metrics: true para coletar estas métricas:

Nome da métrica	Descrição
`sqlserver.memory.target`	Memória do servidor de destino em KB
`sqlserver.memory.total`	Memória total do servidor em KB

Ative o enable_security_metrics: true para coletar estas métricas:

Nome da métrica	Descrição
`sqlserver.security.server_principals_count`	Número total de entidades de segurança do servidor (logins)
`sqlserver.security.server_role_members_count`	Número total de membros da função de servidor

Ative o enable_tempdb_metrics: true para coletar estas métricas:

Nome da métrica	Descrição
`sqlserver.tempdb.allocation_waits_ms`	Tempo total de espera relacionado à alocação
`sqlserver.tempdb.current_waiters`	Número de tarefas aguardando atualmente em latches de página do TempDB
`sqlserver.tempdb.data_file_count`	Número de arquivos de dados do TempDB
`sqlserver.tempdb.pagelatch_waits_ms`	Tempo total de espera de latch de página desde a inicialização do servidor
`sqlserver.tempdb.total_size_mb`	Tamanho total dos arquivos de dados do TempDB

Ative o enable_thread_pool_metrics: true para coletar estas métricas:

Nome da métrica	Descrição
`sqlserver.threadpool.current_tasks`	Total de tarefas atualmente atribuídas aos agendadores
`sqlserver.threadpool.max_workers`	Máximo de threads de trabalho configuradas
`sqlserver.threadpool.runnable_tasks`	Tarefas prontas para execução, mas aguardando tempo de CPU
`sqlserver.threadpool.running_workers`	Número de threads de trabalho atualmente em execução
`sqlserver.threadpool.utilization_percent`	Porcentagem de threads de trabalho atualmente em uso
`sqlserver.threadpool.waiting_tasks`	Número de tarefas atualmente aguardando threads de trabalho do pool de threads
`sqlserver.threadpool.work_queue_count`	Número total de tarefas nas filas de trabalho do agendador

Ative o enable_user_connection_metrics: true para coletar estas métricas:

Nome da métrica	Descrição
`sqlserver.user_connections.authentication.churn_rate`	Taxa de rotatividade de conexões (razão logout/login como porcentagem)
`sqlserver.user_connections.authentication.logins_per_sec`	Taxa atual de login por segundo
`sqlserver.user_connections.authentication.recent_failed_logins`	Contagem de logins com falha na última hora
`sqlserver.user_connections.authentication.total_failed_logins`	Contagem total de tentativas de login com falha no log de erros atual
`sqlserver.user_connections.authentication.unique_failed_sources`	Contagem de IPs de origem distintos com falhas de login
`sqlserver.user_connections.authentication.unique_failed_users`	Contagem de nomes de usuário distintos com falhas de login
`sqlserver.user_connections.client.count`	Número de conexões agrupadas por host do cliente e programa
`sqlserver.user_connections.client.unique_hosts`	Contagem de hosts clientes únicos com conexões ativas
`sqlserver.user_connections.client.unique_programs`	Contagem de programas únicos com conexões ativas
`sqlserver.user_connections.runnable`	Número de conexões de usuário executáveis
`sqlserver.user_connections.running`	Número de conexões de usuário em execução
`sqlserver.user_connections.sleeping`	Número de conexões de usuário adormecidas
`sqlserver.user_connections.suspended`	Número de conexões de usuário suspensas
`sqlserver.user_connections.total`	Número total de conexões de usuário em todos os status
`sqlserver.user_connections.utilization.active_ratio`	Proporção de conexões ativas em relação ao total de conexões
`sqlserver.user_connections.utilization.idle_ratio`	Proporção de conexões ociosas para o total de conexões

Ative o enable_wait_time_metrics: true para coletar estas métricas:

Nome da métrica	Descrição
`sqlserver.wait_stats.latch.wait_time_ms`	Tempo de espera de latch em milissegundos
`sqlserver.wait_stats.latch.waiting_tasks_count`	Número de tarefas aguardando latches
`sqlserver.wait_stats.waiting_tasks_count`	Número de tarefas atualmente aguardando

Qual é o próximo

Após configurar o monitoramento de banco de dados SQL Server com o NRDOT:

Crie dashboards personalizados para visualizar suas métricas de banco de dados
Configure alertas para limites críticos de desempenho do banco de dados
Explore seus dados usando os recursos de consulta do New Relic

Esta tradução de máquina é fornecida para sua comodidade.

Monitoramento do Microsoft SQL Server com NRDOT

Visualização

Pré-requisitos .css-21sua1{background:none;border:none;width:0;padding:0;}

Configurar o Coletor NRDOT para o monitoramento do Microsoft SQL Server

Configurar o Coletor NRDOT

Importante

Para Linux

Configurar usuário do banco de dados

Para Windows (SSMS)

Para Linux (sqlcmd)

Configurar o NRDOT Collector

Importante

Parâmetro de configuração

Reiniciar o coletor NRDOT

Dica

(Opcional) Configurar a correlação entre APM e banco de dados

Importante

(Opcional) Configurar o gerenciamento de segredos

Encontre e use seus dados

Comandos suportados pelo coletor NRDOT

Gerenciamento de serviços do Windows

Gerenciamento de serviços Linux

Resolução de problemas

Métricas disponíveis

Métrica padrão

Métricas padrão coletadas pelo NRDOT Collector

Métricas adicionais

Instância métrica

Métricas do pool de buffer

Métricas de conexões

Métrica de banco de dados

Métricas de cluster de failover

Métricas de bloqueio

Métricas de objetos bloqueados

Métrica de memória

Métricas de segurança

Métricas do TempDB

Métricas de pool de threads

Métricas de conexões de usuário

Métricas de estatísticas de espera

Qual é o próximo

Pré-requisitos