다크 모드
인프라 관리
3D 모델링 관리

3D 모델링 관리 페이지에서는 각 기업의 3D 서버실 모델을 등록하고 관리합니다. 3D 모델은 토폴로지 뷰에서 서버실의 실제 배치를 시각적으로 표현하는 데 사용됩니다. 모델의 생성, 편집, 삭제가 가능합니다.
주요 기능
- 3D 모델 목록 테이블: 기업명, 모델명, 생성일, 수정일, 서버 수가 표시됩니다.
- 생성 버튼: 새 3D 모델을 추가합니다 (+ 아이콘).
- 편집 버튼: 기존 모델을 수정합니다 (연필 아이콘).
- 삭제 버튼: 모델을 삭제합니다 (휴지통 아이콘).
- 미리보기: 모델 썸네일 또는 미리보기 링크를 제공합니다.
팁
3D 모델은 실제 서버실 배치를 반영하여 생성하면 운영 효율을 높일 수 있습니다. 서버 추가/제거 시 모델도 함께 업데이트하여 정확한 시각화를 유지하십시오.
BMC 정보 관리

BMC 정보 관리 페이지에서는 모든 기업의 서버에 대한 BMC(Baseboard Management Controller) 접속 정보를 관리합니다. BMC IP와 인증 정보를 등록하면 PRISM에서 IPMI를 통한 하드웨어 수준의 모니터링 데이터를 수집할 수 있습니다.
주요 기능
- BMC 목록 테이블: 다음 컬럼으로 구성됩니다.
- 서버 IP: 해당 서버의 메인 IP
- BMC IP: BMC 전용 IP 주소
- BMC ID: BMC 로그인 아이디
- 관리: 수정 버튼(연필 아이콘), 삭제 버튼(휴지통 아이콘)
- 기업 필터: 특정 기업의 BMC만 조회할 수 있습니다.
- BMC 등록 버튼: 새 BMC 정보를 추가합니다.
- 검색: 서버 IP 또는 BMC IP로 검색할 수 있습니다.
참고
BMC 정보는 IPMI 프로토콜을 통해 서버의 하드웨어 상태(온도, 팬 속도, 전원 상태 등)를 모니터링하는 데 사용됩니다. BMC IP와 인증 정보가 정확하게 등록되어야 하드웨어 레벨 데이터가 수집됩니다.
GPU 슬롯 매핑

GPU 슬롯 매핑 페이지에서는 각 기업 서버에 장착된 GPU 보드의 모델 정보와 슬롯별 장착 현황을 관리합니다. GPU 보드를 등록하면 모니터링 시 GPU 슬롯 위치와 실제 하드웨어를 정확하게 매핑할 수 있습니다.
주요 기능
- GPU 보드 목록 테이블: 다음 컬럼으로 구성됩니다.
- 보드명: GPU 보드 식별 이름
- GPU 모델: 장착된 GPU 모델명 (예: NVIDIA A100, H100)
- 슬롯 상태: 각 슬롯별 장착/미장착 표시 (색상 구분)
- 기업 필터: 특정 기업의 GPU 보드만 조회할 수 있습니다.
- 보드 추가 버튼: 새 GPU 보드를 등록합니다.
- 편집/삭제 버튼: 기존 보드 정보를 수정하거나 삭제합니다.
GPU 보드 추가 모달

GPU 보드 추가 모달에서 서버에 장착된 GPU 보드 정보를 등록합니다. 기업과 서버를 선택한 후, 보드명과 GPU 모델을 입력하고 슬롯 수를 지정합니다. 등록된 GPU 보드 정보는 GPU 슬롯 매핑 페이지에서 관리됩니다.
- 보드명: GPU 보드 식별 이름 (필수)
- GPU 모델: GPU 모델명 선택 또는 직접 입력
- 슬롯 수: GPU 슬롯 수 (숫자 입력)
- 기업 선택: 대상 기업 드롭다운
- 서버 선택: 대상 서버 드롭다운 (기업 선택 후 활성화)
팁
GPU 보드를 등록할 때 기업을 먼저 선택하면, 해당 기업에 등록된 서버 목록이 서버 선택 드롭다운에 자동으로 로드됩니다.
환경 키트

환경 키트는 위젯 구성과 알람 규칙을 하나의 템플릿으로 묶어 관리하는 기능입니다. 키트를 만들어 두면 새로운 기업이 등록되었을 때 "적용" 버튼 한 번으로 표준화된 모니터링 환경을 일괄 설정할 수 있습니다. 기업별로 다른 키트를 적용할 수도 있습니다.
주요 기능
- 키트 카드 목록: 각 키트의 이름, 포함된 위젯 수, 알람 규칙 수, 적용된 기업 수가 카드 형태로 표시됩니다.
- 적용 버튼: 선택한 기업에 키트를 적용합니다 (카드 내 "적용" 버튼).
- 삭제 버튼: 키트를 삭제합니다 (카드 내 "삭제" 버튼).
- 키트 생성 버튼: 새 환경 키트를 만듭니다 (+ 아이콘).
- 키트 편집: 키트 카드를 클릭하면 위젯/알람 구성 편집 화면으로 이동합니다.
참고
환경 키트를 기업에 적용하면 해당 기업의 기존 위젯/알람 설정이 키트의 설정으로 대체됩니다. 기존 설정을 유지하면서 추가하려면 키트 편집에서 기존 설정과 병합 옵션을 확인하십시오.
피어 그룹 관리
피어 그룹 관리 페이지에서는 서버 그룹을 논리적 피어 그룹으로 묶어 관리할 수 있습니다. 동일한 역할이나 환경의 서버 그룹을 피어 그룹으로 구성하면, 그룹 단위의 모니터링 임계값 설정과 알람 규칙 적용이 가능하여 대규모 인프라를 효율적으로 관리할 수 있습니다.
주요 기능
- 피어 그룹 목록: 등록된 피어 그룹의 이름, 포함된 서버 그룹 수, 적용된 임계값/알람 규칙 요약이 표시됩니다.
- 그룹 생성/편집: 새 피어 그룹을 생성하거나 기존 그룹의 구성원을 수정합니다. 서버 그룹을 드래그 앤 드롭 또는 체크박스로 선택하여 추가합니다.
- 그룹 단위 모니터링 임계값 설정: 피어 그룹에 속한 모든 서버에 공통 임계값(CPU, 메모리, 디스크 등)을 일괄 적용합니다. 개별 서버 설정보다 그룹 설정이 우선합니다.
- 그룹별 알람 규칙 적용: 피어 그룹에 특화된 알람 규칙을 설정합니다. 그룹 내 서버에서 발생하는 알람을 그룹 단위로 집계하여 관리할 수 있습니다.
- 삭제: 피어 그룹을 해제합니다. 그룹 해제 시 개별 서버의 기존 설정은 유지됩니다.
팁
동일한 하드웨어 스펙을 가진 서버들을 피어 그룹으로 묶으면, 동일 기준의 임계값을 일괄 적용하여 관리 효율을 높일 수 있습니다. 예를 들어, GPU 서버 그룹과 일반 연산 서버 그룹을 분리하여 각각 적절한 모니터링 기준을 설정하십시오.
하드웨어 자동 감지
하드웨어 자동 감지 기능은 PRISM Exporter가 수집한 하드웨어 스펙 정보를 자동으로 서버 정보에 반영합니다. 관리자가 서버 하드웨어 정보를 수동으로 입력할 필요 없이, Exporter를 통해 자동으로 수집된 정보가 서버 프로필에 반영됩니다.
주요 기능
- 자동 수집 항목: Exporter가 설치된 서버에서 다음 하드웨어 정보를 자동으로 감지하여 수집합니다.
- CPU 모델 및 코어 수
- 메모리(RAM) 총 용량
- 디스크 구성 및 용량 정보
- GPU 모델 및 수량 (GPU 장착 서버의 경우)
- 네트워크 인터페이스 정보
- 자동 반영: 수집된 하드웨어 스펙이 해당 서버의 정보 페이지에 자동으로 업데이트됩니다.
- 수동 입력 지원: 자동 감지가 불가능한 항목이나 보정이 필요한 경우, 관리자가 직접 서버 정보를 수동으로 입력하거나 수정할 수 있습니다.
- 변경 감지 알림: 하드웨어 구성이 변경된 경우(예: 메모리 증설, 디스크 교체) 변경 사항을 감지하여 관리자에게 알립니다.
참고
하드웨어 자동 감지는 PRISM Exporter가 설치되어 정상적으로 데이터를 수집하고 있는 서버에서만 동작합니다. Exporter가 설치되지 않은 서버는 수동 입력으로 하드웨어 정보를 관리해야 합니다.
GPU 팬 제어
GPU 팬 제어 기능은 BMC(Baseboard Management Controller)를 통해 서버의 GPU 팬 속도를 원격으로 제어합니다. 온도 기반 자동 팬 속도 조절 정책을 설정하여 GPU 과열을 방지하고, 냉각 효율을 최적화할 수 있습니다.
주요 기능
- 팬 속도 제어: BMC를 통해 GPU 팬 속도를 원격으로 조절합니다. 수동 고정 속도 설정과 자동 조절 모드를 지원합니다.
- 온도 기반 자동 조절: GPU 온도에 따라 팬 속도를 자동으로 조절하는 정책을 설정합니다. 온도 구간별 팬 속도 비율(%)을 지정할 수 있습니다.
- 임계값 설정: 팬 제어 동작의 온도 임계값을 설정합니다. 경고 온도, 위험 온도, 최대 허용 온도 등 다단계 임계값을 지정할 수 있습니다.
- 서버별 적용: 개별 서버 단위로 팬 제어 정책을 적용하거나, 피어 그룹 단위로 일괄 적용할 수 있습니다.
팁
GPU 팬 제어를 사용하려면 BMC 정보 관리에서 해당 서버의 BMC 접속 정보가 정확하게 등록되어 있어야 합니다. 팬 속도를 과도하게 낮게 설정하면 GPU 과열로 인한 성능 저하나 하드웨어 손상이 발생할 수 있으므로, 충분한 테스트 후 적용하십시오.
