Skip to content

시스템 설정

알람 규칙 관리, 위젯 설정, 위젯 모듈 관리, 위젯 에러 로그 등 시스템 설정 기능을 안내합니다.

알람 규칙 관리

알람 규칙 관리

알람 규칙 관리 페이지에서는 소속 기업 서버에 적용할 알람 규칙을 설정합니다. CPU 사용률 90% 초과 시 Critical 알람, 디스크 사용률 80% 초과 시 Warning 알람 등 다양한 조건을 설정할 수 있습니다. 플랫폼 관리자가 설정한 글로벌 규칙은 회색으로 표시되며 수정할 수 없습니다.

주요 기능

  • 알람 규칙 목록: 규칙명, 대상 지표, 조건, 임계값, 심각도, 상태(활성/비활성)
  • 규칙 추가 버튼: 새 알람 규칙 생성 (모달 호출)
  • 편집/삭제: 기존 규칙 수정/삭제
  • 활성/비활성 토글: 개별 규칙 활성 상태 전환
  • 글로벌 규칙 표시: 플랫폼 관리자가 설정한 글로벌 규칙은 읽기 전용으로 표시

알람 규칙 추가 모달

알람 규칙 추가 모달

알람 규칙 추가 모달에서 새로운 알람 규칙을 생성합니다. 예를 들어 "CPU 사용률이 90%를 5분간 초과하면 Critical 알람 발생"과 같은 규칙을 설정할 수 있습니다. 지속 시간을 설정하면 순간적인 스파이크는 무시하고 지속적인 이상 상태만 알람으로 발생시킵니다.

  • 규칙명: 알람 규칙 이름 (필수)
  • 대상 지표: CPU / MEM / DISK / GPU / Temperature 등 (드롭다운)
  • 조건: > / >= / < / <= / == (연산자 선택)
  • 임계값: 숫자 입력 (%, 도, GB 등)
  • 심각도: Critical / Warning / Info (라디오 버튼)
  • 지속 시간: 조건 유지 시간 (초/분)
  • 알림 대상: 전체 / 특정 담당자 선택
  • 추가/취소 버튼

알람 규칙 설정 팁

지속 시간을 적절히 설정하면 일시적인 부하 스파이크로 인한 불필요한 알람을 방지할 수 있습니다. 일반적으로 CPU/메모리는 3~5분, 디스크는 10분 이상을 권장합니다.

위젯 설정

위젯 설정

위젯 설정 페이지에서는 대시보드에 표시할 위젯을 선택하고 순서를 조절합니다. "필수" 표시가 있는 위젯은 비활성화할 수 없으며, 그 외 위젯은 필요에 따라 켜거나 끌 수 있습니다. 설정 변경 후 "저장"을 클릭해야 대시보드에 반영됩니다.

주요 기능

  • 위젯 목록: 사용 가능한 전체 위젯 목록, 활성/비활성 토글
  • 순서 변경: 드래그 앤 드롭 또는 위/아래 화살표
  • 필수 위젯 표시: "필수" 배지가 있는 위젯은 비활성화 불가
  • 미리보기: 현재 설정으로 대시보드 미리보기
  • 저장 버튼: 위젯 설정 저장
  • 초기화 버튼: 기본 설정으로 복원

위젯 모듈 관리

위젯 모듈 관리

위젯 모듈 관리 페이지에서는 소속 기업에서 사용 가능한 위젯 모듈의 전체 목록을 확인합니다. 각 위젯의 KEY(식별자), LABEL(표시명), CATEGORY(분류), COLSPAN(크기) 등 설정 정보를 조회할 수 있습니다.

주요 기능

  • 위젯 모듈 테이블: KEY, LABEL, CATEGORY, COLSPAN, PRIORITY, 필수 여부, 상태
  • 필터: 카테고리별 필터링
  • 상태 배지: 활성(녹색) / 비활성(회색)

위젯 에러 로그

위젯 에러 로그

위젯 에러 로그 페이지에서는 위젯에서 발생한 오류를 확인합니다. 특정 위젯에서 반복적으로 에러가 발생하면 해당 위젯의 데이터 소스나 서버 상태를 점검해야 합니다.

주요 기능

  • 24시간 에러 요약: 에러 건수, 영향 위젯 수, 에러 유형별 분포
  • 에러 목록: 발생시각, 위젯 KEY, 에러 메시지, 서버명
  • 필터: 위젯별, 기간별 필터
  • 새로고침: 수동 갱신

에러 대응 가이드

위젯 에러가 반복적으로 발생하면 해당 위젯이 참조하는 Exporter나 데이터 소스의 연결 상태를 확인하세요. 네트워크 이슈나 Exporter 프로세스 중단이 원인일 수 있습니다.

Watcher 규칙 관리

Watcher는 PRISM의 별도 서비스 감시 시스템으로, Prometheus에서 수집된 메트릭을 기반으로 자동 감시 규칙을 설정하고 알림을 발송합니다. 알람 규칙 관리와 별도로 운영되며, 보다 세밀한 PromQL 기반 조건식을 활용할 수 있습니다.

주요 기능

  • PromQL 기반 조건식: Prometheus 쿼리 언어(PromQL)를 직접 사용하여 복잡한 감시 조건 정의
    • 예: avg(node_cpu_seconds_total{mode="idle"}) < 0.1 (전체 CPU idle이 10% 미만일 때)
  • 알림 채널 연동: 규칙별로 알림을 전달할 채널 설정
    • 이메일, Slack, 웹훅 등 다양한 알림 채널 지원
  • 규칙 활성/비활성 관리: 개별 규칙의 활성화 상태를 토글로 관리
  • 규칙 목록 테이블: 규칙명, PromQL 조건식, 심각도, 알림 채널, 상태(활성/비활성)
  • 규칙 추가/편집/삭제: Watcher 규칙의 CRUD 관리

Watcher vs 알람 규칙

알람 규칙 관리에서는 단순 임계값 기반 규칙을 설정하고, Watcher 규칙 관리에서는 PromQL을 활용한 고급 조건을 설정합니다. 일반적인 모니터링에는 알람 규칙으로 충분하며, 복합 조건이 필요한 경우 Watcher 규칙을 활용하세요.

PRISM Server Monitoring Platform