OpenTelemetry Collector Contribをサイドカーコンテナとしてデプロイすることで、AWS Fargateで実行されているAmazon ECSタスクをモニターします。この包括的なガイドでは、サーバーレスECSワークロード向けのタスク定義の作成、コレクターの設定、および監視の設定について説明します。
インストレーション手順
ECS Fargateタスクの監視を設定するには、以下の手順に従ってください。
あなたが始める前に
環境が次の要件を満たしていることを確認してください。
New Relicライセンスキーを保存する
OpenTelemetry Collectorの認証情報を安全に保存するために、ライセンスキーをSystems Manager(SSM)パラメーターとして保存します:
$aws ssm put-parameter \> --name "/newrelic-infra/ecs/license-key" \> --type SecureString \> --description 'New Relic license key for ECS monitoring' \> --value "YOUR_NEW_RELIC_LICENSE_KEY"IAMポリシーと実行ロールの作成
ECSコンテナがNew Relicライセンスキーを安全に取得できるように、IAMポリシーを作成します:
$aws iam create-policy \> --policy-name "NewRelicSSMLicenseKeyReadAccess" \> --policy-document '{"Version":"2012-10-17","Statement":[{"Effect":"Allow","Action":["ssm:GetParameters"],"Resource":["arn:aws:ssm:*:*:parameter/newrelic-infra/ecs/license-key"]}]}' \> --description "Provides read access to the New Relic SSM license key parameter"タスク実行ロールとして使用するIAMロールを作成します。
$aws iam create-role \> --role-name "NewRelicECSTaskExecutionRole" \> --assume-role-policy-document '{"Version":"2012-10-17","Statement":[{"Effect":"Allow","Principal":{"Service":"ecs-tasks.amazonaws.com"},"Action":"sts:AssumeRole"}]}' \> --description "ECS task execution role for New Relic infrastructure"必要なマネージドポリシーをロールにアタッチします:
$# Attach the standard ECS task execution policy$aws iam attach-role-policy \> --role-name "NewRelicECSTaskExecutionRole" \> --policy-arn "arn:aws:iam::aws:policy/service-role/AmazonECSTaskExecutionRolePolicy"$
$# Attach the New Relic SSM license key read access policy$aws iam attach-role-policy \> --role-name "NewRelicECSTaskExecutionRole" \> --policy-arn "arn:aws:iam::$(aws sts get-caller-identity --query Account --output text):policy/NewRelicSSMLicenseKeyReadAccess"コレクターの設定を保存する
コンテナイメージを再ビルドせずに設定を管理および更新できるように、OpenTelemetry Collector の設定を AWS Systems Manager Parameter Store に保存します:
$aws ssm put-parameter \> --name "/ecs/otel-collector/fargate-config" \> --type "String" \> --value "$(cat <<EOF$receivers:$ awsecscontainermetrics:$ collection_interval: <COLLECTION_INTERVAL>$
$processors:$ metricstransform/containers:$ transforms:$ - include: container.cpu.utilized$ action: insert$ new_name: container.cpu.utilization$ - include: container.memory.usage$ action: insert$ new_name: container.memory.usage.total$ - include: container.storage.read_bytes$ action: insert$ new_name: container.blockio.io_service_bytes_recursive$ operations:$ - action: add_label$ new_label: operation$ new_value: read$ - include: container.storage.write_bytes$ action: insert$ new_name: container.blockio.io_service_bytes_recursive$ operations:$ - action: add_label$ new_label: operation$ new_value: write$
$ batch:$ send_batch_size: <SEND_BATCH_SIZE>$ timeout: <BATCH_TIMEOUT>$
$ resource:$ attributes:$ - key: ClusterName$ from_attribute: aws.ecs.cluster.name$ action: insert$ - key: ServiceName$ from_attribute: aws.ecs.service.name$ action: insert$ - key: TaskId$ from_attribute: aws.ecs.task.id$ action: insert$ - key: TaskDefinitionFamily$ from_attribute: aws.ecs.task.family$ action: insert$ - key: LaunchType$ from_attribute: aws.ecs.launch_type$ action: insert$ - key: cloud.platform$ value: \"aws_ecs\"$ action: upsert$ - key: docker.host$ from_attribute: aws.ecs.task.id$ action: insert$ - key: docker.imageName$ from_attribute: container.image.name$ action: insert$ - key: docker.containerId$ from_attribute: container.id$ action: insert$ - key: docker.state$ from_attribute: aws.ecs.container.know_status$ action: insert$
$
$exporters:$ otlphttp:$ endpoint: https://otlp.nr-data.net:443$ headers:$ api-key: \${NEW_RELIC_LICENSE_KEY}$
$ debug:$ verbosity: basic$
$service:$ pipelines:$ metrics/containers:$ receivers: [awsecscontainermetrics]$ processors: [metricstransform/containers, resource, batch]$ exporters: [otlphttp, debug]$EOF$)"設定パラメーター
OpenTelemetry Collectorの設定では、以下のパラメーターをカスタマイズできます:
パラメータ | 説明 |
|---|---|
| ECSコンテナメトリクスエンドポイントからメトリクスを収集する間隔(秒単位)。 |
| MiB単位のOpenTelemetry Collectorのメモリ制限 |
| New Relicに送信する前にバッチ処理するメトリクスの数 |
| バッチを送信するまでの最大待ち時間 |
| リソース検出プロセッサのタイムアウト |
タスク定義を作成
OpenTelemetry Collectorサイドカーコンテナを含むFargate用の新しいECSタスク定義を作成します。コンテナプラットフォームに適切なタスク定義を選択します。
タスク定義パラメーター
ECS Fargateタスク定義では、以下のパラメーターをカスタマイズできます:
パラメータ | 説明 |
|---|---|
| Fargateタスクの合計CPUユニット |
| MiB単位のFargateタスクの合計メモリ |
| アプリケーションコンテナに割り当てられたCPUユニット |
| アプリケーションコンテナに割り当てられたメモリ(MiB単位) |
| OpenTelemetry Collectorに割り当てられたCPUユニット |
| MiB単位でのOpenTelemetry Collectorのメモリ予約 |
| アプリケーションコンテナのCloudWatchロググループ名 |
| OpenTelemetry Collector 用の CloudWatch ロググループ名 |
| CloudWatchログ用のAWSリージョン |
| アプリケーションコンテナのログストリームプレフィックス |
| OpenTelemetry Collector 用のログストリームプレフィックス |
ヒント
LinuxおよびWindows Fargateコンテナの主な違い:
- ランタイムプラットフォーム:Windowsでは明示的な指定が必要です
operatingSystemFamily: "WINDOWS_SERVER_2022_FULL" - イメージ:Windowsは特定のWindowsコンテナイメージを使用します
- エントリーポイント:Windowsコレクターは
C:\\otelcol-contrib.exeをエントリーポイントとして指定します - メモリ割り当て:柔軟なメモリ管理に
memoryReservationを使用します
重要
YOUR_ACCOUNTとリージョンの値を、実際のAWSアカウントIDとAWSリージョンに置き換えてください。
タスクをデプロイして実行する
タスク定義をECSクラスタにデプロイします:
タスク定義を登録します。
bash$aws ecs register-task-definition --cli-input-json file://task-definition.jsonサービスの作成:
bash$aws ecs create-service \>--cluster your-cluster-name \>--service-name otel-monitoring-service \>--task-definition otel-ecs-fargate-metrics:1 \>--desired-count 1 \>--launch-type FARGATE \>--network-configuration "awsvpcConfiguration={subnets=[subnet-12345,subnet-67890],securityGroups=[sg-abcdef],assignPublicIp=ENABLED}"
データ収集を確認する
データがNew Relicに取り込まれていることを確認します:
OpenTelemetry Collectorのステータスを確認する:コンテナのログを確認して、コレクターがエラーなしで実行され、New Relicに正常に接続されていることを確認します:
bash$aws logs get-log-events \>--log-group-name "/ecs/otel-collector-fargate" \>--log-stream-name "otel/otel-collector/TASK_ID"New Relic UIでデータを確認する:one.newrelic.com > All Capabilities > Infrastructureに移動して、ECSコンテナがメトリクスとともに表示されることを確認します。データの探索に関する詳細なガイダンスについては、ECS監視データを検索してクエリを実行するを参照してください。
EC2との設定の違い
Fargateで実行する場合の主な違い:
- ホストレベルのアクセスなし: EC2のように基盤となるホストのメトリクスにアクセスできません
- ネットワークモード:
awsvpcネットワークモードを使用する必要があります - リソース制約: FargateのCPU/メモリの組み合わせによる制限
- ストレージ: エフェメラルストレージのみ、永続ボリュームなし
- コンテナインサイト: コンテナの統計情報にはタスクメタデータエンドポイント v4 に依存します
次のステップ
監視を設定した後、次のことができます:
- Fargateメトリクスに対してカスタムダッシュボードを作成します
- コンテナおよびタスクレベルの問題に対するアラートの設定
- ECSメトリクスをアプリケーショントレースおよびログと関連付ける