telegraf 의 경우 환경 설정 파일 내에 plugin 의 선언을 통해 metric 수집이 이뤄지는 방식입니다.
(참고. telegraf input plugins)
그 중 http(s) 를 통한 URL healthcheck 를 하는 방법은 다음과 같이 설정하면 됩니다.
input plugin 중 http_response 를 선언하면 됩니다.
e.g. http://www.daum.net 을 5초 내 응답받았을 경우 http_code 를 저장하도록 선언하는 방법
[[inputs.http_response]] address = "http://www.daum.net" response_timeout = "5s" method = "GET" follow_redirects = false [inputs.http_response.headers] Host = "daum.net"
만약 대상 URL 이 여러 개 일 경우 target URL 및 설정 값을 수정하여 중복하여 선언해 주면 됩니다.
이상입니다.
정상적으로 telegraf 설정후 재시작을 하면
ZMC에서 확인 할 수 있습니다.
Alert Config > Monitoring List 메뉴 선택 후 조회조건을
Service Group : Server / Service Type : [ PRIVATE ] HTTP 로 선택후 조회하시면 확인 할 수 있습니다.
Alert rule을 설정할 때에도
Service Group : Server / Service Type : [ PRIVATE ] HTTP 로 선택 후 Monitoring List의 add를 클릭하여
대상을 추가 하여 알람을 설정하시면 됩니다.
result code 는 아래와 같은 의미를 갖고 있습니다. Alert 발생시 Default Message에 표시되는 숫자는 result code그 표시됩니다.