업계 표준 프로토콜로 Elasticsearch 클러스터를 모니터링하려면 뉴렐릭 Elasticsearch OpenTelemetry 통합을 설치하세요. 이 가이드는 OpenTelemetry Collector 구성하여 Elasticsearch 인프라에서 범위 및 로그를 수집하고 이를 뉴렐릭으로 전송하는 방법을 안내합니다.
통합 기능을 설치하려면 다음 단계를 완료하십시오.
- 시작하기 전에 - 요구 사항 및 사전 조건을 확인하세요
- OpenTelemetry Collector 구성 - 데이터 수집 설정
- 환경 변수 설정 - 인증 구성
- 데이터를 찾고 활용하세요 - 뉴럴릭에서 Elasticsearch 데이터를 확인하세요
- 알림 설정 - 사전 예방적 모니터링 구성
1단계: 시작하기 전에
다음 사항을 확인하십시오:
필수 접근 권한 - Elasticsearch 클러스터 관리자 권한 및 접근 권한이 있는 뉴렐릭 계정
Elasticsearch 버전 7.16 이상 - 이 통합 기능을 사용하려면 최신 Elasticsearch 클러스터가 필요합니다.
모니터 또는 클러스터 관리 권한 - 보안이 활성화된 경우 모니터 또는 클러스터 관리 권한이 필요합니다. 자세한 내용은 Elasticsearch 보안 권한 문서를 참조하세요.
네트워크 연결 - 뉴렐릭의 OTLP 수집 엔드포인트에 대한 아웃바운드 HTTPS 연결(포트 443)
OpenTelemetry Collector - OpenTelemetry Collector Contrib이 호스트에 설치되어 실행 중입니다. systemd 서비스 유닛이 올바르게 생성되도록 공식 패키지(.deb 또는 .rpm)를 통해 설치하십시오.
설정 값 준비 - 설정을 위해서는 두 가지 핵심 가치가 필요합니다.
- Elasticsearch 엔드포인트 - 실제 Elasticsearch URL (
https://localhost:9200을 대체하세요) - Cluster 이름 - 클러스터를 뉴렐릭에서 식별하는 고유한 이름입니다.
- Elasticsearch 엔드포인트 - 실제 Elasticsearch URL (
2단계: OpenTelemetry Collector 구성
OpenTelemetry Collector를 구성하여 Elasticsearch 클러스터에서 메트릭과 로그를 수집하도록 설정하십시오. /etc/otelcol-contrib/config.yaml 에서 설정 파일을 생성하거나 업데이트하세요.
구성 방법은 Elasticsearch 설정 및 모니터링 요구 사항에 따라 달라집니다. 아래에서 적절한 설정을 선택하세요.
팁
APM과 Elasticsearch 연동: APM 애플리케이션과 Elasticsearch 클러스터를 연결하려면 APM 메트릭에 리소스 속성 es.cluster.name="your-cluster-name" 포함하세요. 이를 통해 서비스 간 가시성과 문제 해결 속도가 빨라지고 뉴렐릭 내에서 문제가 해결됩니다.
3단계: 환경 변수 설정
수집기 서비스에 뉴렐릭 및 OTLP 포인트 포인트를 추가하여 인증을 구성하세요.
systemd 오버라이드 디렉터리를 생성합니다.
bash$sudo mkdir -p /etc/systemd/system/otelcol-contrib.service.dOTLP 엔드포인트를
environment.conf에 입력하세요.YOUR_LICENSE_KEY뉴렐릭 볼륨 키로 바꾸고YOUR_OTLP_ENDPOINT해당 지역에 적합한 엔드포인트로 바꾸세요. 올바른 엔드포인트를 선택하려면 OTLP 엔드포인트 설정 문서를 참조하세요.bash$cat <<EOF | sudo tee /etc/systemd/system/otelcol-contrib.service.d/environment.conf$[Service]$Environment="NEWRELIC_OTLP_ENDPOINT=YOUR_OTLP_ENDPOINT"$Environment="NEWRELIC_LICENSE_KEY=YOUR_LICENSE_KEY"$EOFsystemd 다시 로드하고 수집기를 재시작하세요.
bash$sudo systemctl daemon-reload$sudo systemctl restart otelcol-contrib.service
4단계: Elasticsearch 데이터 보기
수집기가 실행되어 데이터 전송이 시작되면 뉴럴릭에서 Elasticsearch 범위를 확인할 수 있습니다.
- one.newrelic.com > Integrations & Agents로 이동하세요.
- Elasticsearch(OpenTelemetry)를 검색하세요.
- Dashboards 아래에서 Elasticsearch OpenTelemetry Dashboard [Elasticsearch OpenTelemetry 대시보드]를클릭하세요.
- 계정을 선택하고 View dashboard [대시보드 보기]를클릭하세요.
클러스터 상태, 성능 지표 및 리소스 사용량이 표시되는 대시보드를 볼 수 있습니다.
팁
데이터가 보이지 않나요? 데이터가 표시되는 데 몇 분 정도 소요될 수 있습니다. 10분이 지나도 지표가 표시되지 않으면 문제 해결, 문제 해결 가이드를 확인하세요.
데이터를 활용한 다음 단계:
- 메트릭 탐색: 모든 Elasticsearch 메트릭은
Metric이벤트 유형으로 저장됩니다. - 사용자 지정 쿼리 생성: NRQL을 사용하여 사용자 지정 차트 및 대시보드를 구축하세요.
- 알림 설정: 사전 예방적 모니터링을 구성하려면 5단계로 진행하십시오.
5단계: 알림 설정
사전 예방적 모니터링과 알림 기능을 통해 문제가 사용자에게 영향을 미치기 전에 문제를 파악할 수 있습니다. 뉴렐릭에서 공지 조건을 생성하려면:
- one.newrelic.com > Alerts > Alert Conditions 으로 이동하세요.
- 조건 만들기 를 클릭합니다.
- Guided mode [안내 모드] 또는 NRQL 쿼리 빌더를 사용하여 공지를 구성합니다.
강력한 Elasticsearch 모니터링을 위해서는 아래 공지 설정을 권장합니다.
중요 알림 (우선순위 높음)
이러한 알림은 데이터 손실이나 서비스 중단을 초래할 수 있는 중요한 클러스터 상태 문제를 모니터링합니다.
공지 이름 | 주니어 값, 릴레이 이론적 근거 (예시 조건) |
|---|---|
할당되지 않은 샤드 공지 | 최소 5분 동안
(여기서
)이 0보다 큽니다. |
건강한 데이터 노드 공지 | 메트릭
이 최소 5분 동안 필요한 최소 노드 수 미만입니다. |
힙 사용량이 너무 높음 공지 | 힙 사용률(사용량/최대치)이 5분 이상 90%를 초과했습니다. |
대기 중인 작업 공지 | 온도
이 최소 5분 동안 5보다 높습니다. |
추가 모니터링 알림
이러한 알림은 성능 및 운영 문제를 모니터링하는 데 도움이 됩니다.
공지 이름 | 주니어 값, 릴레이 이론적 근거 (예시 조건) |
|---|---|
쿼리 시간이 느림 공지 |
의 95번째 백분위수는 최소 2분 동안 5ms를 초과합니다. |
샤드 초기화에 너무 오래 걸립니다 | 최소 5분 동안
(여기서
)이 0보다 큽니다. |
파편을 너무 오래 옮기는 것 | 최소 5분 동안
(여기서
)이 0보다 큽니다. |
문제점 해결
설치 중에 문제가 발생하거나 뉴렐릭에 데이터가 표시되지 않는 경우 일반적인 문제에 대한 단계별 해결 방법에 대한 포괄적인 문제 해결, 해결 가이드를 참조하세요.