Monitoring

Print

Overview

System Administrator권한을 가진 사용자는 Monitoring에서 모든 권한을 가지고 있습니다.

Monitoring에 접속하는 방법

  • 콘솔에서 Monitoring Menu 선택

  • Grafana URL에 직접 접근

웹페이지의 주소창에 Grafana Domain URL를 입력한 후 Cloud Z CP의 계정으로 login

URL 예시 : https://{Realm name}-monitoring.{Realm name}.cloudzcp.net/

Org 변경하는 방법

Grafana 좌측 하단의 아이콘을 클릭하면 접속한 계정에 대한 정보 및 관련 메뉴들이 표시됩니다.

이 중 “Current Org” 메뉴를 선택하면 Org를 변경할 수 있습니다.

Switch Organization 팝업창에서 현재의 Org는 “Current” 버튼으로 표시됩니다.

변경하고자 하는 Org의 “Switch to” 버튼을 클릭하면 해당 Org가 현재의 Org로 변경 됩니다.

Dashboard 로 이동

1. 상단의 Home 메뉴를 선택하세요.

2. 최근에 선택했던 Dashboard(Recent)와 기본제공 Folder(4개) 가 보입니다.

3. 기본제공 Folder 중에 하나를 선택하면 Folder 에 속해 있는 Dashboard 들이 펼쳐집니다.

4. Dashboard 선택하면 각종 Panel 로 구성되어 있는 화면을 만날 수 있습니다.

5. 우측 상단에서 검색 기간과 재검색 주기를 설정할 수 있습니다.

시계 아이콘과 함께 있는 시간 부분(default : Last 1 hour)에 마우스를 가져가시면 현재의 검색 기간이 표시됩니다.

시간 부분에 마우스를 클릭하면 아래와 같은 검색기간을 설정할 수 있는 팝업창이 표시됩니다.

절대적인 범위(Absolute time range)로 설정하실 수도 있고, 상대적인 범위(Relative time ranges)로 설정하실 수도 있습니다.

시간 부분 우측에는 재검색 주기를 선택할 수 있는 부분이 있습니다.

무한루프 도는 듯한 아이콘과 함께 있는 시간 부분(default : 10s)에 마우스를 클릭하시면 검색기간의 Metric 정보를 자동으로 재검색하는 주기를 지정할 수 있습니다.

제일 상단에는 재검색을 중지할 수 있는 Off이고, 5초부터 하루까지 선택할 수 있습니다.

원하는 주기를 선택하면 재검색 주기가 지정됩니다.

Grafana 기본 제공 Dashboard

Cloud Z CP 에서 기본으로 제공하는 Dashboard 에 대하여 설명합니다.

참고 Document : https://grafana.com/docs/grafana/v7.5/dashboards/

Cluster Dashboards

  • Kubernetes : API Server

API Server에 대한 정보들(RPC Rate, CPU / Memory / Work Queue 등)을 표시하는 Dashboard입니다.

Panel

Description

Up

up인 API Server 개수

RPC Rate

API Server들의 RPC Rate

Request duration 99th quantile

API Server의 request 기간 동안의 99번째 분위수(quantile)

CPU usage

API Server의 CPU 사용량

Memory

API Server의 Memory 사용량

Goroutines

API Server의 Goroutine 사용량

Work Queue Add Rate

Work Queue에 추가되는 Rate

Work Queue Depth

Work Queue의 Depth

Work Queue Latency

Work Queue의 지연률

  • Kubernetes : Component Overview

Kubernetes Component에 대한 요약 정보들(API Server, Pod, Container 등)을 표시하는 Dashboard입니다.

Panel

Description

API Server Requests (Req/Sec)

API Server의 request 총합

API Server Latency

API Server들의 지연률 총합

Kublet Pod Start Latency

Kublet Pod들이 시작될 때의 지연률

Running Pods Trands

running 상태의 pod들의 개수 (min, max, avg, current 따로 표시)

Creating Rate of Pods

2분 사이에 생성된 running 상태의 Pod들의 개수

Running Containers Trands

running 상태의 Container들의 개수 (min, max, avg, current 따로 표시)

Creating Rate of Containers

2분 사이에 생성된 running 상태의 Container들의 개수

  • Kubernetes : Kubelet

Kubelet에 대한 정보들(Pod, Node, Storage, Cgroup, PLEG, RPC 등)을 표시하는 Dashboard입니다.

Panel

Description

Up

up인 instance 개수

Running Pods

Node들에 있는 running 상태의 Pod들의 개수

Running Container

Node들에 있는 running 상태의 Container들의 개수

Actual Volume Count

actual_state_of_world 상태인 volume들의 개수

Desired Volume Count

desired_state_of_world 상태인 volume들의 개수

Config Error Count

5분 사이에 config error가 난 Node들의 개수

CPU usage

Node들의 CPU 사용량

Memory

Node들의 Memory 사용량

Goroutines

Node들의 Goroutines 사용량

Operation Rate

Operation들의 runtime Rate

Operation Error Rate

Operation들의 Error Rate

Operation duration 99th quantile

Operation들의 runtime 기간 동안의 99번째 분위수(quantile)

  • Kubernetes : Namespace

Namespace에 대한 정보들(Status, Age, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

STATUS

Namespace의 상태

AGE

현재로부터 가장 오래 전에 생성된 Namespace의 지금까지의 기간

Total CPU

Namespace에 있는 Container들에서 사용된 CPU 합계(Core)

CPU Usage

Namespace에 있는 Container들의 CPU 사용량

Total Memory

Namespace에 있는 Container들에서 사용된 Memory 합계(MiB)

Memory Usage

Namespace에 있는 Container들의 Memory 사용량

Total Network

Namespace에 있는 Container들에서 사용된 Network의 합계(MBps)

Total Filesystem Read/Write 

Namespace에 있는 Container들의 Filesystem Read/Write 사용량 총합

Filesystem Read/Write 

Namespace에 있는 Container들의 Filesystem Read/Write 사용량 

Total Network TX/RX

Namespace에 있는 Container들의 Network TX/RX 사용량 총합

Network TX/RX

Namespace에 있는 Container들의 Network TX/RX 사용량

Pod Info

Namespace에 있는 pod들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동

Resource Quotas

Namespace의 Resource Quotas

Resource Limits

Namespace의 Resource Limits

Events

Namespace의 event 정보

Pod Events

Namespace에 있는 pod들의 event 정보

  • Kubernetes : Namespace Overview

Namespace들에 대한 요약 정보들(Namespace 개수, 각 Namespace들의 CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

Number of Namespaces

Namespace 개수

CPU

Namespace에 있는 Container들의 CPU 사용량 총합

Memory

Namespace에 있는 Container들의 Memory 사용량 총합

Volume

Namespace에 있는 Volume의 용량 / 사용량 총합

Filesystem Reads/Writes

Namespace에 있는 Filesystem의 Reads / Writes 총합

Network RX/TX

Namespace에 있는 Filesystem의 Receive / Transmit 총합

AGE

현재로부터 가장 오래 전에 생성된 Namespace의 지금까지의 기간

CPU Usage

Namespace에 있는 Container들의 CPU 사용량

정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Namespace”로 이동

Memory Usage

Namespace에 있는 Container들의 Memory 사용량

All CPU Usage

Namespace에 있는 모든 Container들의 CPU 사용량을 Line 형태로 표시

All Memory WorkingSet

Namespace에 있는 모든 Container들의 Memory 사용량을 Line 형태로 표시

Volume Usage

Namespace에 있는 Volume의 Limit / 사용량

Filesystem Read/Write 

Namespace에 있는 Container들의 Filesystem Read/Write 사용량 

Volume Usage

Namespace에 있는 Volume의 사용량을 Line 형태로 표시

Network TX/RX

Namespace에 있는 Container들의 Network TX/RX 사용량

Pod Count

Namespace에 있는 pod들의 개수

Container Count

Namespace에 있는 Container들의 개수

  • Kubernetes : Node

Node에 대한 정보들(Status, Age, Version, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

STATUS

Node의 상태

ROLES

Node의 Role

AGE

Node가 생성된 후 지금까지의 기간

VERSION

Node의 Kubernetes version

KERNEL-VERSION

Node의 Kernel version

CONTAINER-RUNTIME-VERSION

Node의 Container runtime version

Total CPU

Node에 있는 Container들에서 사용된 CPU 합계(Core)

CPU Usage

Node에 있는 Container들의 CPU 사용량

Total Memory

Node에 있는 Container들에서 사용된 Memory 합계(MiB)

Memory Usage

Node에 있는 Container들의 Memory 사용량

Total Network

Node에 있는 Container들에서 사용된 Network의 합계(MBps)

Total Filesystem Read/Write 

Node에 있는 Container들의 Filesystem Read/Write 사용량 총합

Filesystem Read/Write 

Node에 있는 Container들의 Filesystem Read/Write 사용량 

Total Network

Node에 있는 Container들의 Network TX/RX 사용량 총합

Network TX/RX

Node에 있는 Container들의 Network TX/RX 사용량

Pod Info

Node에 있는 pod들의 정보

Capacity

Node의 사용할 수 있는 resource

Allocatable

Node의 할당할 수 있는 resource

Events

Node의 event 정보

Pod Events

Node에 있는 pod들의 event 정보

  • Kubernetes : Node Overview

Node에 대한 요약 정보들(각 Node들의 CPU/Memory/Network/Filesystem/Pod 등)을 표시하는 Dashboard입니다.

Panel

Description

CPU

Node들에 할당된 CPU의 상태에 따른 양 (Allocatable / Capacity / Usage)

CPU Usage

Node들에 할당된 CPU 사용량(%)

Memory

Node들에 할당된 Memory의 상태에 따른 양 (Allocatable / Capacity / WorkingSet)

Memory Usage

Node들에 할당된 Memory 사용량(%)

Filesystem

Node들에 할당된 Filesystem의 상태에 따른 양 (Limit / Usage)

Filesystem Usage

Node들에 할당된 Filesystem의 사용량(%)

CPU Requests and Limits

Node들에 할당된 CPU의 정보 (Allocatable / Request / Limit)

Memory Requests and Limits

Node들에 할당된 Memory의 정보 (Allocatable / Request / Limit)

CPU Usage

Node들에 할당된 CPU의 정보 (Allocatable / Usage)

Memory Usage

Node들에 할당된 Memory의 정보 (Allocatable / Usage)

CPU Usage

Node들에 할당된 CPU의 사용량 (max, current)

Memory Usage

Node들에 할당된 Memory의 사용량 (max, current)

Container Dashboards

  • Kubernetes : CronJob

CronJob에 대한 정보들(Schedule, active, age 등)을 표시하는 Dashboard입니다.

Panel

Description

SCHEDULE

스케줄 요구된 CronJob의 개수

SUSPEND

일시 중지된 CronJob의 개수

ACTIVE

활성화되어 있는 CronJob의 개수

LAST SCHEDULE

마지막으로 CronJob 스케쥴이 실행 된 시간

NEXT SCHEDULE

다음 실행예정인 CronJob 스케쥴 시간

AGE

현재로부터 가장 오래 전에 생성된 CronJob의 지금까지의 기간

Jobs

cronjob들의 정보

  • Kubernetes : DaemonSet

DaemonSet에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

DESIRED

스케줄이 요구된 DaemonSet의 개수

CURRENT

현재 스케줄 된 DaemonSet의 개수

READY

현재 동작하고 준비된 DaemonSet의 개수

UPDATED

업데이트 된 DaemonSet의 개수

AVAILABLE

현재 동작하고 사용중인 DaemonSet의 개수

AGE

현재로부터 가장 오래 전에 생성된 DaemonSet의 지금까지의 기간

Total CPU

Daemonset으로 생성된 Container들에서 사용된 CPU 합계(Core)

CPU Usage

Daemonset으로 생성된 Container들의 CPU 사용량

Total Memory

Daemonset으로 생성된 Container들에서 사용된 Memory 합계(MiB)

Memory Usage

Daemonset으로 생성된 Container들의 Memory 사용량

Replicas Status

Daemonset의 Replica들의 상태 (Ready / Available / Unavailable / Misscheduled / Scheduled)

Total Network

Daemonset으로 생성된 Container들에서 사용된 Network의 합계(MBps)

Total Filesystem Read/Write 

Daemonset으로 생성된 Container들의 Filesystem Read/Write 사용량 총합

Filesystem Read/Write 

Daemonset으로 생성된 Container들의 Filesystem Read/Write 사용량 

Total Network TX/RX

Daemonset으로 생성된 Container들의 Network TX/RX 사용량 총합

Network TX/RX

Daemonset으로 생성된 Container들의 Network TX/RX 사용량

Pod Info

Daemonset pod들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동

  • Kubernetes : Deployment

Deployment에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

DESIRED

스케줄 요구된 Deployment Replica의 개수

UPDATED

업데이트 된 Deployment Replica의 개수

AVAILABLE

현재 동작하고 사용중인 Deployment Replica의 개수

AGE

현재로부터 가장 오래 전에 생성된 Deployment의 지금까지의 기간

Metadata Generation

Metadata로 생성된 Deployment의 개수

Observed Generation

Observed로 생성된 Deployment의 개수

Total CPU

Deployment로 생성된 Container들에서 사용된 CPU 합계(Core)

CPU Usage

Deployment으로 생성된 Container들의 CPU 사용량

Total Memory

Deployment으로 생성된 Container들에서 사용된 Memory 합계(MiB)

Memory Usage

Deployment으로 생성된 Container들의 Memory 사용량

Spec

Deployment의 Replica 개수와 Paused된 개수

Replicas Status

Deployment의 Replica들의 상태 (Ready / Available / Unavailable / Misscheduled / Scheduled)

Total Network

Deployment으로 생성된 Container들에서 사용된 Network의 합계(MBps)

Total Filesystem Read/Write 

Deployment으로 생성된 Container들의 Filesystem Read/Write 사용량 총합

Filesystem Read/Write 

Deployment으로 생성된 Container들의 Filesystem Read/Write 사용량 

Total Network TX/RX

Deployment으로 생성된 Container들의 Network TX/RX 사용량 총합

Network TX/RX

Deployment으로 생성된 Container들의 Network TX/RX 사용량

Pod Info

Deployment으로 생성된 pod들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동

Status Condition

Deployment으로 생성된 pod들의 상태

Events

Deployment들의 event 정보

Pod Events

Deployment pod들의 event 정보

  • Kubernetes : Job

Job에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

PARALLELISM

“Parallelism” 상태인 Job의 개수

COMPLETIONS

“Completion” 상태인 Job의 개수

FAILED

Failed된 Job의 개수

COMPLETE

Complete된 Job의 개수

DURATION

Job이 시작되고 나서 completion 상태가 될 때까지의 기간

AGE

현재로부터 가장 오래 전에 생성된 Job의 지금까지의 기간

Total CPU

Job으로 생성된 Container들에서 사용된 CPU 합계(Core)

CPU Usage

Job으로 생성된 Container들의 CPU 사용량

Total Memory

Job으로 생성된 Container들에서 사용된 Memory 합계(MiB)

Memory Usage

Job으로 생성된 Container들의 Memory 사용량

Status

Job의 상태 (Active / Failed / Succeeded)

Total Network

Job으로 생성된 Container들에서 사용된 Network 합계(MBps)

Total Filesystem Read/Write 

Job으로 생성된 Container들의 Filesystem Read/Write 사용량 총합

Filesystem Read/Write 

Job으로 생성된 Container들의 Filesystem Read/Write 사용량 

Total Network TX/RX

Job으로 생성된 Container들의 Network TX/RX 사용량 총합

Network TX/RX

Job으로 생성된 Container들의 Network TX/RX 사용량

Pod Info

Job으로 생성된 pod들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동

  • Kubernetes : Pod

Pod에 대한 요약 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

READY

Pod의 Container상태가 Ready/정상인 개수

STATUS

Pod의 상태

RESTARTS

재시작된 Pod의 총합

AGE

현재로부터 가장 오래 전에 생성된 Pod의 지금까지의 기간

Start time

현재로부터 가장 오래 전에 생성된 Pod의 생성 일자 및 시간

Kind

Pod의 종류

Total CPU

Pod으로 생성된 Container들에서 사용된 CPU 합계(Core)

CPU Usage

Pod으로 생성된 Container들의 CPU 사용량

Total Memory

Pod으로 생성된 Container들에서 사용된 Memory 합계(MiB)

Memory Usage

Pod으로 생성된 Container들의 Memory 사용량

Status

Pod의 상태 (Failed / Pending / Running / Succeeded)

Ready

Ready상태인 Pod의 Container

Restarts

Restarts상태인 Pod의 Container

Last Terminated Reason

Pod이 마지막으로 종료된 이유

Waiting Reason

Pod이 Waiting상태인 이유

Terminated Reason

Pod이 종료된 이유

Total Volume

Pod과 연결된 PVC(Persistent Volume Claim) 용량의 합계

Volume

Pod과 연결된 PVC(Persistent Volume Claim) 용량

Total Network TX/RX

Pod으로 생성된 Container들의 Network TX/RX 사용량 총합

Network TX/RX

Pod으로 생성된 Container들의 Network TX/RX 사용량 

Total Filesystem Read/Write 

Pod으로 생성된 Container들의 Filesystem Read/Write 사용량 총합

Filesystem Read/Write 

Pod으로 생성된 Container들의 Filesystem Read/Write 사용량 

Pod Info

Pod들의 정보

Container Info

Container들의 정보

  • Kubernetes : Pod Overview

Pod에 대한 요약 정보들(Pod의 status, restart count, pod에서 사용된 CPU/Memory/Network/Volume/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

Not running pod

동작하지 않는 pod의 개수 총합

Abnormally waiting container during last selected range

비정상적으로 “waiting” 상태였던 Container의 정보 및 waiting 횟수와 이유

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동

Abnormally terminated container during last selected range

비정상적으로 “terminated” 상태였던 Container의 정보 및 waiting 횟수와 이유

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동

Last abnormally terminated container

마지막이 “terminated” 상태였던 Container의 정보 및 이유

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동

CPU Usage

Pod으로 생성된 Container에서 사용된 CPU 사용량

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동

Memory Usage

Pod으로 생성된 Container에서 사용된 Memory 사용량

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동

Volume Usage

Pod으로 생성된 Container에서 사용된 PVC(Persistent Volume Claim) 사용량

  • Kubernetes : ReplicaSet

ReplicaSet에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

DESIRED

스케줄 요구된 ReplicaSet의 개수

UPDATED

업데이트 된 ReplicaSet의 개수

AVAILABLE

현재 동작하고 사용중인 ReplicaSet의 개수

AGE

현재로부터 가장 오래 전에 생성된 ReplicaSet의 지금까지의 기간

Metadata Generation

Metadata로 생성된 ReplicaSet의 개수

Observed Generation

Observed로 생성된 ReplicaSet의 개수

Total CPU

ReplicaSet으로 생성된 Container들에서 사용된 CPU 합계(Core)

CPU Usage

ReplicaSet으로 생성된 Container들의 CPU 사용량

Total Memory

ReplicaSet으로 생성된 Container들에서 사용된 Memory 합계(MiB)

Memory Usage

ReplicaSet으로 생성된 Container들의 Memory 사용량

Replicas Status

ReplicaSet의 Replica들의 상태 (Ready / Fully_labedled / Unavailable )

Total Network

ReplicaSet으로 생성된 Container들에서 사용된 Network 합계(MBps)

Total Filesystem Read/Write 

ReplicaSet으로 생성된 Container들의 Filesystem Read/Write 사용량 총합

Filesystem Read/Write 

ReplicaSet으로 생성된 Container들의 Filesystem Read/Write 사용량 

Total Network TX/RX

ReplicaSet으로 생성된 Container들의 Network TX/RX 사용량 총합

Network TX/RX

ReplicaSet으로 생성된 Container들의 Network TX/RX 사용량

Pod Info

ReplicaSet으로 생성된 pod들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동

Events

ReplicaSet들의 event 정보

Pod Events

ReplicaSet으로 생성된 pod들의 event 정보

  • Kubernetes : StatefulSet

StatefulSets에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

DESIRED

스케줄 요구된 Statefulset Replica의 개수

REPLICAS

Statefulset Replica의 개수

CURRENT

현재 Statefulset Replica의 개수

READY

준비된 Statefulset Replica의 개수

UPDATED

업데이트 된 Statefulset Replica의 개수

AGE

현재로부터 가장 오래 전에 생성된 statefulset Replica의 지금까지의 기간

Total CPU

Statefulset Replica로 생성된 Container들에서 사용된 CPU 합계(Core)

CPU Usage

Statefulset Replica로 생성된 Container들의 CPU 사용량

Total Memory

Statefulset Replica로 생성된 Container들에서 사용된 Memory 합계(MiB)

Memory Usage

Statefulset Replica로 생성된 Container들의 Memory 사용량

Replicas Status

Statefulset Replica의 Replica들의 상태 (Total / Current / Ready / Updated )

Total Network

Statefulset Replica로 생성된 Container들에서 사용된 Network의 합계(MBps)

Total Filesystem Read/Write 

Statefulset Replica로 생성된 Container들의 Filesystem Read/Write 사용량 총합

Filesystem Read/Write 

Statefulset Replica로 생성된 Container들의 Filesystem Read/Write 사용량 

Total Network TX/RX

Statefulset Replica로 생성된 Container들의 Network TX/RX 사용량 총합

Network TX/RX

Statefulset Replica로 생성된 Container들의 Network TX/RX 사용량

Pod Info

Statefulset Replica로 생성된 pod들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동

  • Kubernetes : Workloads

Workloads에 대한 정보들(Deployments, ReplicaSets, StatefulSets, DaemonSets, Jobs, CronJobs)을 표시하는 Dashboard입니다.

Panel

Description

Deployment

Available / Unavailabe 상태의 Deployment들의 개수

ReplicaSets

Ready / NotReady 상태의 ReplicaSet들의 개수

StatefulSets

Ready / NotReady 상태의 Statefulset들의 개수

DaemonSets

Available / Unavailabe 상태의 DaemonSet들의 개수

Jobs

Succeded / Active / Failed 상태의 Job들의 개수

CronJobs

Suspend가 True / False 상태인 CronJob들의 개수

Deployments

Deployment들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Deployment”으로 이동

ReplicaSets

ReplicaSet들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: ReplicaSet”으로 이동

StatefulSets

Statefulset들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: StatefulSet”으로 이동

DaemonSets

DaemonSet들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: DaemonSet”으로 이동

CronJobs

CronJob들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: CronJob”으로 이동

Jobs

Job들의 정보

정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Job”으로 이동

System Dashboards

  • System : Node

Node에 대한 정보들(System Uptime, Disk I/O, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

System Uptime

선택한 Node의 선택한 Interval 시간 동안 system에서 uptime된 시간

Virtual CPU

선택한 Node의 현재 Virtual CPU 할당량

RAM

선택한 Node의 현재 Memory 할당량

Memory Available

선택한 Node의 현재 Memory 사용비율(%)

Load Average

선택한 Node의 선택한 Interval 시간의 평균 Load (min, max, avg 따로 표시)

Memory

선택한 Node의 선택한 Interval 시간의 종류별(Total / Used / Available) Memory 사용량(GiB) (min, max, avg 따로 표시)

CPU Usage

선택한 Node의 선택한 Interval 시간의 idle / user / system / steal / iowait / softirq / nice CPU 사용비율(%) (min, max, avg 따로 표시)

Memory Distribution

선택한 Node의 선택한 Interval 시간의 종류별(Cached / Used / Free / Buffers) Memory Distribution 사용량(GiB) (min, max, avg 따로 표시)

Network Traffic(KBps)

선택한 Node의 선택한 Interval 시간의 종류별(각 항목별 Inbound / Outbound) Network Traffic 사용량(kBps) (min, max, avg 따로 표시)

Network Utilization Hourly

선택한 Node의 선택한 Interval 시간의 종류별(Sent / Received) Network Utilization 사용량(MiB) (min, max, avg 따로 표시)

Filesystem Usage

선택한 Node의 Filesystem 사용량(GiB) (min, max, avg 따로 표시)

Disk I/O

선택한 Node의 read / io time(ms) (min, max, avg 따로 표시)

Mountpoint

선택한 Node의 다양한 mount point에서 사용 가능한 Filesystem의 disk 사용량(GiB) (min, max, avg 따로 표시)

  • System : Overview

각각의 Node에 대한 요약 정보들(Load Average, Swap, CPU/Memory/Network Usage 등)을 표시하는 Dashboard입니다.

Panel

Description

All CPU

선택한 Node들의 CPU 총합 / 사용량

All CPU Usage

선택한 Node들의 CPU 총 사용량 (%)

All Memory

선택한 Node들의 Memory 총합 / 사용량 / 사용되지 않은 양

All Memory Usage

선택한 Node들의 Memory 총 사용량 (%)

All Filesystem

선택한 Node들의 Filesystem 총합 / 사용량 / 사용되지 않은 양

All Filesystem Usage

선택한 Node들의 Filesystem 총 사용량 (%)

All CPU Usage

선택한 Node 각각의 CPU 사용량 (Bar gauge 형태)

All CPU Usage

선택한 Node 각각의 CPU 사용량 (Line 형태)

All Memory Used

선택한 Node 각각의 Memory 사용량 (Bar gauge 형태)

All Memory Used

선택한 Node 각각의 Memory 사용량 (Line 형태)

All Filesystem Usage

선택한 Node 각각의 Filesystem 사용량 (Bar gauge 형태)

All Filesystem Usage

선택한 Node 각각의 Filesystem 사용량 (Line 형태)

Disk Usage(Local)

선택한 Node 각각의 Local Disk 사용량

Network Usage(TX/RX)

선택한 Node 각각의 Network TX/RX 사용량

General

  • Kubernetes : Overview

Control/Data Plane Cluster들의 전체 Kubernetes에 대한 요약 정보들(Provider, Node, Namespace들의 개수, Alert, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.

Panel

Description

Provider

Node 정보에서 가져 온 provide 개수 (AWS, Azure, IBM)

Number of

Node와 Namespace 개수

Running

“Running” 상태인 pod / container 개수

Alerts Firing(P1)

Priority가 P1인 Alert의 개수

Alerts Firing(P2~P5)

Priority가 P2 / P3 / P4 / P5인 Alert의 개수 (Pie 형태)

Warning Events

Event type이 “Warning”인 Event의 개수

Node Ready

Node의 상태가 “Ready”인 Node의 개수 (Polygon 형태)

정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동

Node MemoryPressure

Node의 상태가 “MemoryPressure”인 Node의 개수 (Polygon 형태)

정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동

Running pod count per node

Node의 “Running” 상태인 pod의 개수 총합의 상위 5개

Alerts Firing

Alert 개수 (Bar 형태)

Warning Events

“Warning” 상태의 Event 정보

Node DiskPressure

Node의 상태가 “DiskPressure”인 Node의 개수 (Polygon 형태)

정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동

Node PIDPressure

Node의 상태가 “PIDPressure”인 Node의 개수 (Polygon 형태)

정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동

Node Unschedulable

“Unschedulable”인 Node의 개수 (Polygon 형태)

정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동

pod status phase

Node 안에 있는 Pod의 상태가 “Running / Succeeded“인 개수 총합의 상위 5개

Alerts Firing

Alert 개수 (Table 형태)

Node CPU usage

Node의 CPU 사용량 (Polygon 형태)

정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동

Node CPU usage

Node의 CPU 사용량 (Line 형태)

Node memory usage

Node의 Memory 사용량 (Polygon 형태)

정보에 있는 항목 클릭 시 “Cluster Dashboards / Kubernetes: Node”로 이동

Node Memory usage

Node의 Memory 사용량 (Line 형태)

Most CPU usage namespace

CPU를 많이 사용하는 Namespace 상위 10개

Most CPU-intensive pods

CPU를 많이 사용하는 Pod 상위 10개

Most Memory usage namespace

Memory를 많이 사용하는 Namespace 상위 10개

Most Memory-intensive pods

Memory를 많이 사용하는 Pod 상위 10개

Container CPU usage (Top 10)

CPU를 많이 사용하는 Container 상위 10개

Container memory usage (Top 10)

Memory를 많이 사용하는 Container 상위 10개

Node local disk usage

Node의 Local Disk를 많이 사용하는 Node 상위 10개

Top filesystem reads

Filesystem read가 가장 많은 Node 상위 10개

Top network receive

Network receive가 가장 많은 Node 상위 10개

Top network transmit

Network transmit가 가장 많은 Node 상위 10개

Persistent volume usage

Persistent volume 사용량이 가장 많은 Node 상위 10개

Top filesystem writes

Filesystem write가 가장 많은 Node 상위 10개

network receive errors

각 Node의 Network receive error 총합

network transmit errors

각 Node의 Network transmit error 총합

이 답변이 유용합니까? 아니오

Send feedback
도움이 되어드리지 못해 죄송합니다. 아티클 개선을 위해 의견을 제공해 주시기 바랍니다.