본문 바로가기

개발하자

테라폼에서 트리거 임계값과 메트릭_트리거 임계값의 차이

반응형

테라폼에서 트리거 임계값과 메트릭_트리거 임계값의 차이

AKS에서 호스팅하는 웹 api를 모니터링하기 위해 메트릭 알림을 추가하고 있었는데 두 임계값의 차이를 알 수 없었다. 나는 각각의 목적과 지원하는 곳에 대해 혼란스러워 하고 있다?

trigger {
    operator  = "GreaterThan"
    threshold = 3
    metric_trigger {
      operator            = "GreaterThan"
      threshold           = 1
      metric_trigger_type = "Total"
      metric_column       = "operation_Name"
    }
  }



시행착오를 통해 테스트한 결과 metric_trigger의 임계값이 "minFailingPeriods"로 매핑됨을 확인했습니다경보에게"라고 말했다. 일명 "경보가 울리려면 몇 번을 넘어야 하는지"입니다.

우리는 다음과 같은 트리거로 경보를 적용했다:

trigger {
    operator  = "GreaterThan"
    threshold = 3
    metric_trigger {
        metric_trigger_type = "Total"
        operator = "GreaterThanOrEqual"
        threshold = 100
        metric_column = "fileCount"
    }
}

그리고 애저에서 이 자원을 만들어냈다

"criteria": {
    "allOf": [
        {
            "query": "customEvents | where parsedStatus != \"RUNNING\" and parsedStatus != \"SUCCESS\" ",
            "timeAggregation": "Average",
            "metricMeasureColumn": "AggregatedValue",
            "dimensions": [
                {
                    "name": "itemCount",
                    "operator": "Include",
                    "values": [
                        "*"
                    ]
                }
            ],
            "operator": "GreaterThan",
            "threshold": 3,
            "failingPeriods": {
                "numberOfEvaluationPeriods": null,
                "minFailingPeriodsToAlert": 100
            }
        }
    ]
},

결국 metric_trigger의 임계값을 0으로 설정하고 경보를 구성하는 데 "정규" 임계값을 사용합니다. 애플리케이션에 트래픽이 폭주할 경우 이 설정을 사용할 수 있습니다. 이 설정을 사용하면 서버가 즉시 경고를 실행하지 않고 파일의 백로그를 처리할 수 있습니다.


반응형