다크 모드
시스템 설정
공지사항 관리

공지사항 관리 페이지에서는 플랫폼 전체 또는 특정 기업을 대상으로 공지를 등록할 수 있습니다. "공지" 유형은 중요 안내사항으로 강조 표시되며, "일반" 유형은 일반적인 알림에 사용됩니다. 대상을 "전체"로 설정하면 모든 기업 사용자에게 노출됩니다.
주요 기능
- 공지사항 목록 테이블: 다음 컬럼으로 구성됩니다.
- 대상: 전체 / 특정 기업명 (배지 형태)
- 내용: 공지사항 제목 및 미리보기
- 유형: 공지(빨간색 배지) / 일반(회색 배지)
- 등록일: 공지 등록 날짜
- 공지 등록 버튼: 새 공지사항을 작성합니다.
- 편집/삭제: 기존 공지를 수정하거나 삭제합니다.
- 대상 선택 필터: 전체/기업별 대상으로 필터링합니다.
팁
시스템 점검이나 긴급 안내 시에는 "공지" 유형으로 등록하면 사용자 대시보드 상단에 강조 표시됩니다. 일반적인 업데이트 소식은 "일반" 유형으로 등록하십시오.
알람 규칙 관리

알람 규칙 관리 페이지에서는 플랫폼 전체에 적용되는 글로벌 알람 규칙을 설정합니다. CPU, 메모리, 디스크 등 모니터링 지표에 대한 임계값과 심각도를 지정하며, 적용 범위를 전체 기업 또는 특정 기업으로 한정할 수 있습니다. 이 규칙은 기업 관리자가 설정하는 개별 규칙보다 상위에서 동작합니다.
주요 기능
- 알람 규칙 목록 테이블: 규칙명, 대상 지표, 임계값, 심각도, 적용 범위(전체/기업별), 상태(활성/비활성)가 표시됩니다.
- 규칙 추가 버튼: 새 알람 규칙을 생성합니다.
- 편집/삭제: 기존 규칙을 수정하거나 삭제합니다.
- 활성/비활성 토글: 개별 규칙의 활성 상태를 전환합니다.
- 적용 범위: 전체 기업 또는 특정 기업만 선택할 수 있습니다.
알람 규칙 추가 모달

알람 규칙 추가 모달에서 새로운 모니터링 알람 규칙을 생성합니다. 대상 지표(CPU, 메모리 등), 임계값, 심각도(Critical/Warning/Info)를 설정하고, 적용 범위를 전체 기업 또는 특정 기업으로 지정합니다. 지속 시간을 설정하면 일시적 스파이크가 아닌 지속적인 이상 상태만 알람으로 발생시킬 수 있습니다.
- 규칙명: 알람 규칙 이름 (필수)
- 대상 지표: 드롭다운 선택 (CPU, MEM, DISK, GPU, Temperature 등)
- 조건: 연산자 선택 (>, >=, <, <=, ==)
- 임계값: 숫자 입력 (퍼센트 또는 절대값)
- 심각도: Critical / Warning / Info 라디오 선택
- 적용 범위: 전체 기업 / 특정 기업 선택 (드롭다운)
- 지속 시간: 조건 유지 시간 (초/분 단위)
참고
글로벌 알람 규칙은 기업 관리자가 설정한 개별 규칙보다 우선적으로 동작합니다. 동일한 지표에 대해 글로벌 규칙과 기업별 규칙이 모두 존재하면, 두 규칙 모두 평가되어 각각 알람이 발생할 수 있습니다.
위젯 모듈 관리

위젯 모듈 관리 페이지에서는 대시보드에 표시되는 위젯의 전체 카탈로그를 관리합니다. 각 위젯의 KEY(고유 식별자), LABEL(표시명), COLSPAN(그리드 크기), PRIORITY(표시 순서) 등을 설정할 수 있습니다. "필수"로 지정된 위젯은 사용자가 해제할 수 없으며 모든 대시보드에 항상 표시됩니다.
주요 기능
- 위젯 모듈 목록 테이블: 다음 컬럼으로 구성됩니다.
- KEY: 위젯 고유 식별 키 (예: system_overview, gpu_status)
- LABEL: 위젯 표시 이름 (예: 시스템 개요, GPU 상태)
- CATEGORY: 위젯 분류 카테고리
- MODULE_PATH: 위젯 모듈 파일 경로
- COLSPAN: 대시보드 그리드에서 차지하는 열 수
- PRIORITY: 위젯 표시 우선순위 (숫자)
- 필수: 필수 위젯 여부 (체크박스)
- 상태: 활성/비활성 배지
- 위젯 등록 버튼: 새 위젯 모듈을 추가합니다.
- 편집/삭제: 기존 위젯을 수정하거나 삭제합니다.
팁
PRIORITY 값이 낮은 위젯이 대시보드 상단에 먼저 배치됩니다. 중요한 시스템 모니터링 위젯의 PRIORITY를 낮게 설정하여 사용자가 즉시 확인할 수 있도록 구성하십시오.
위젯 에러 로그

위젯 에러 로그 페이지에서는 위젯 모듈에서 발생한 오류를 모니터링합니다. 상단의 24시간 요약에서 최근 에러 발생 추이를 확인하고, 하단의 상세 목록에서 어떤 위젯이 어떤 기업/서버에서 오류를 발생시켰는지 파악할 수 있습니다.
주요 기능
- 24시간 에러 요약: 최근 24시간 동안 발생한 에러 건수, 영향받은 위젯 수, 에러 유형별 분포가 표시됩니다.
- 에러 이력 목록 테이블: 발생시각, 위젯 KEY, 에러 유형, 에러 메시지, 발생 기업, 발생 서버가 표시됩니다.
- 필터: 위젯별, 에러 유형별, 기간별로 필터링할 수 있습니다.
- 새로고침 버튼: 에러 목록을 수동으로 갱신합니다.
참고
특정 위젯에서 반복적으로 에러가 발생하는 경우, 해당 위젯의 MODULE_PATH와 설정을 점검하십시오. 위젯 모듈 관리 페이지에서 해당 위젯을 일시적으로 비활성화하여 영향을 차단할 수 있습니다.
Watcher 규칙 관리
Watcher 규칙 관리 페이지에서는 Watcher 서비스의 감시 규칙을 상세하게 설정합니다. PromQL 기반의 조건식을 사용하여 정밀한 모니터링 규칙을 정의하고, 알림 채널 연동 및 심각도 등급을 설정할 수 있습니다.
주요 기능
- PromQL 기반 조건식: Prometheus Query Language(PromQL)를 사용하여 모니터링 조건을 정의합니다. 단순 임계값 비교뿐 아니라, 집계 함수, 비율 계산, 다중 메트릭 조합 등 복잡한 조건식을 작성할 수 있습니다.
- 알림 채널 연동: 규칙에 알림 채널을 연결하여 조건 충족 시 자동으로 알림을 발송합니다.
- 이메일: 지정된 이메일 주소로 알림 발송
- Slack: 설정된 Slack 채널로 메시지 전송
- 웹훅(Webhook): 외부 시스템 연동용 HTTP 웹훅 호출
- 심각도 등급 설정: 각 규칙에 Critical, Warning, Info 세 단계의 심각도 등급을 지정합니다. 심각도에 따라 알림 우선순위와 대시보드 표시 방식이 달라집니다.
- 규칙 활성/비활성: 개별 규칙의 활성 상태를 토글하여 일시적으로 비활성화하거나 재활성화할 수 있습니다.
- 평가 주기 설정: 규칙의 평가 간격을 설정합니다. 빈번한 평가는 빠른 감지를, 긴 간격은 시스템 부하를 줄여줍니다.
참고
PromQL 조건식은 Prometheus 서버에서 직접 평가됩니다. 조건식 작성 시 대상 메트릭명과 레이블이 정확한지 Prometheus 관리 페이지에서 먼저 확인하십시오. 잘못된 조건식은 알람 누락이나 과다 발생의 원인이 됩니다.
Prometheus 관리
Prometheus 관리 페이지에서는 Prometheus 서버의 연결 설정과 상태를 관리합니다. 타겟 서비스 디스커버리, 스크래핑 간격, 데이터 보존 기간 등을 설정하여 모니터링 데이터 수집 인프라를 관리합니다.
주요 기능
- Prometheus 서버 연결 설정: Prometheus 서버의 URL, 인증 정보를 등록하고 연결 상태를 확인합니다. 연결 성공/실패 여부가 실시간으로 표시됩니다.
- 타겟 서비스 디스커버리 설정: Prometheus가 모니터링할 타겟(Exporter) 목록을 관리합니다. 자동 디스커버리 또는 수동 타겟 추가를 지원합니다.
- 스크래핑 간격 설정: 메트릭 데이터를 수집하는 주기(스크래핑 간격)를 설정합니다. 기본값은 15초이며, 환경에 따라 조정할 수 있습니다.
- 데이터 보존 기간 설정: 수집된 메트릭 데이터의 보존 기간을 설정합니다. 보존 기간이 길수록 디스크 사용량이 증가합니다.
- 상태 모니터링: Prometheus 서버의 현재 상태(Up/Down), 활성 타겟 수, 스크래핑 성공률, 스토리지 사용량을 표시합니다.
팁
스크래핑 간격을 너무 짧게 설정하면 Prometheus 서버와 대상 서버 양쪽의 부하가 증가합니다. 일반적인 서버 모니터링에는 15~30초, GPU 집약 작업 모니터링에는 5~10초 간격을 권장합니다.
Redis 관리
Redis 관리 페이지에서는 Redis TimeSeries 서버의 상태를 확인하고 키 관리 및 메모리 사용량을 모니터링합니다. PRISM은 Redis TimeSeries를 사용하여 실시간 모니터링 데이터를 저장하고 제공합니다.
주요 기능
- 서버 상태 확인: Redis 서버의 연결 상태(Connected/Disconnected), 버전, 가동 시간(Uptime)을 표시합니다.
- 메모리 사용량 모니터링: Redis 서버의 현재 메모리 사용량, 최대 메모리 설정값, 사용률을 표시합니다. 메모리 사용 추이를 차트로 시각화합니다.
- 키 관리: 저장된 TimeSeries 키 목록을 조회합니다. 키 패턴별 검색, 만료 시간 확인, 불필요한 키 정리 기능을 제공합니다.
- 데이터베이스 정보: DB별 키 수, 메모리 분포, TTL 설정 현황을 표시합니다.
참고
Redis 메모리 사용량이 설정된 최대값에 근접하면 데이터 유실이 발생할 수 있습니다. 메모리 사용률이 80%를 초과하면 데이터 보존 기간을 줄이거나 Redis 서버의 메모리를 증설하는 것을 검토하십시오.
로그 뷰어
로그 뷰어는 PRISM 시스템의 로그를 실시간으로 조회하는 관리 도구입니다. 각 서비스에서 발생하는 로그를 통합하여 한 화면에서 확인할 수 있으며, 다양한 필터를 사용하여 필요한 로그만 빠르게 검색할 수 있습니다.
주요 기능
- 실시간 로그 스트리밍: 시스템에서 발생하는 로그를 실시간으로 스트리밍하여 표시합니다. 자동 스크롤 기능을 지원합니다.
- 로그 레벨별 필터링: DEBUG, INFO, WARN, ERROR, FATAL 등 로그 레벨별로 필터링하여 원하는 수준의 로그만 표시합니다. 여러 레벨을 동시에 선택할 수 있습니다.
- 서비스별 필터링: PRISM Service, Bridge, Watcher, Data Service 등 서비스별로 로그를 분류하여 표시합니다. 특정 서비스의 로그만 집중적으로 모니터링할 수 있습니다.
- 키워드 검색: 로그 메시지 내 키워드를 검색하여 관련 로그를 빠르게 찾을 수 있습니다.
- 기간 필터: 시작일~종료일을 지정하여 특정 기간의 로그를 조회합니다.
팁
장애 발생 시 로그 레벨을 ERROR로 필터링하고, 해당 서비스를 선택하면 원인 분석에 필요한 로그를 빠르게 확인할 수 있습니다. 실시간 스트리밍 모드에서 자동 스크롤을 일시 정지하면 특정 로그를 자세히 분석할 수 있습니다.
