모니터링
모니터링은 데이터를 수집, 분석 및 사용하는 행위로, IT 리소스 및 시스템에 대한 여러가지 질문의 답 산출 및 의사 결정을 목적으로 한다. 여기서 질문은 매일 몇 명이 사이트를 방문하고 있는가?, 웹사이트 성능 또는 가용성 문제가 있는가?, 웹사이트가 정상 동작하고 있는가? 등이 있다. 모니터링을 통해 리소스 과다 사용, 애플리케이션 결함, 리소스 구성 오류 또는 보안 관련 이벤트로 인한 운영 문제를 감시할 수 있다.
메트릭(Metric)
메트릭은 리소스가 생성하는 다양한 형태의 데이터 중 모니터링을 통해 수집된 데이터를 말한다. 메트릭의 예로는 시간 경과에 따라 EC2 인스턴스에서 수집 및 분석되는 메트릭이 있다. 이 메트릭은 평균 CPU 사용률, 네트워크 사용률, 디스크 성능, 메모리 사용률, 각종 로그 등이 있을 수 있다.
메트릭의 다양성
AWS의 리소스, 목표 및 상황에 따라 다양한 유형의 메트릭이 생성된다.
- Amazon Simple Storage Service(Amazon S3) 버킷
- CPU 사용률은 없음
- 버킷에 저장된 객체와 관련된 메트릭 (버킷 전체 크기 또는 버킷 내 객체 수 등)
- 버킷에 대한 요청과 관련된 메트릭 (객체 읽기 또는 쓰기 등) - Amazon Relational Database Service(Amazon RDS)
- 데이터베이스 연결, 인스턴스의 CPU 사용률, 디스크 공간 소비 등
모니터링의 이점 및 중요성
- 최종 사용자가 운영 문제를 인식하기 전에 사전 대응 가능
- 메트릭을 활용하여 문제 발생 징후를 확인하거나 문제 발생 시 빠른 인식 가능
- 이를 통해 자동 혹은 수동으로 필요한 작업을 수행하여 문제 해결 가능 - 리소스의 성능 및 안정성을 개선
- 모니터링은 제대로 수행할 경우 병목 현상과 비효율적인 아키텍처를 확인 가능 - 보안 위협 및 이벤트를 인식
- 시간 경과에 따라 리소스, 이벤트 및 시스템을 모니터링하면 기준선(Base-line) 생성 가능
- 이를 이용하여 비정상적인 트래픽 스파이크 또는 리소스에 액세스하는 비정상적인 IP 주소와 같은 이상 현상을 발견 가능 - 비즈니스를 위해 데이터 중심의 의사 결정을 수립
- IT 운영 상태를 주시하고 비즈니스 의사 결정 지원 - 보다 비용 효율적인 솔루션을 구축
- 사용량이 부족한 리소스를 확인하고 리소스를 사용량에 맞게 조정하여 비용을 최적화 가능
Troubleshooting Process
일반적인 문제 발생 시 Troubleshooting Process를 절차를 거친다.
여기서 MTTI는 문제를 인식하여 원인을 파악하기 까지의 시간을 말한다.
모니터링 솔루션
- 리소스의 운영 상태 및 사용량에 대한 데이터를 수집하고 분석하는 방법 필요
- 중앙 집중 식 모니터링 필요
- 분산된 리소스는 메트릭, 로그, 네트워크 트래픽, 이벤트 등을 통해 다양한 데이터를 각각 생성
- 이렇게 분산된 데이터를 중앙집중식으로 모니터링 하지 않을 경우 관리가 어려울 수 있음 - 데이터 가시성 확보 필요
- 단순 데이터의 축적만으로는 데이터를 활용하기에 어려움이 있을 수 있음 - 모니터링 솔루션 예: AWS CloudWatch, Prometheus, Grafana
CloudWatch
AWS의 CloudWatch는 리소스 및 애플리케이션을 관측하고 모니터링하는 도구이다.
수행 가능 작업
- 환경에서 이상 동작을 감지
- 문제가 있을 때 알리도록 경보를 설정
- AWS 관리 콘솔을 사용하여 로그 및 메트릭을 시각화
- 크기 조정과 같은 자동화된 작업을 수행
- 애플리케이션을 정상으로 유지하기 위한 인사이트를 발견
CloudWatch 구조
- CloudWatch Dashboard
: 메트릭 정보를 통합된 화면에서 그래프로 표현하여 시각화 - Cloud Watch Metric
리소스 성능 관련 메트릭 확인 가능 - CloudWatch Insight
수집된 데이터를 기반으로 가시성을 확보 - CloudWatch Log
사용하는 AWS 서비스들을 모니터링 하기 위해 발생하는 로그들을 수집, 저장, 탐색, 분석 - CloudWatch Alarm
특정 기준이 되면 특정 이벤트를 발생시켜 사용자에게 알림 - CloudWatch Event
AWS 리소스의 변경사항에 관한 시스템 이벤트 기록 - CloudWatch Service Lens
- CloudWatch Synthetics
'IT 인프라' 카테고리의 다른 글
[클라우드] 쿠버네티스 개요 및 주요 아키텍쳐 (1) | 2024.05.29 |
---|---|
[클라우드] AWS 주요 리소스 & 비용 모니터링 (0) | 2024.05.29 |
[클라우드] AWS 고가용성 구현 - Region, AZ, ELB, ASG (0) | 2024.05.28 |
[클라우드] AWS(Amazon Web Service) - EC2, VPC, EBS, S3 (0) | 2024.05.27 |
[클라우드] 가상화 및 클라우드 (0) | 2024.05.27 |