다크 모드
서버 · 자산 관리
조직의 서버, 자산, 담당자, BMC, Exporter, GPU, 환경 키트 등 인프라 관련 관리 기능을 안내합니다.
3D 모델 관리

3D 모델 관리에서는 서버실의 3D 가상 모델을 관리합니다. On-Premise 설치 시 기본 서버룸이 자동으로 생성되며, "3D 에디터 열기" 버튼으로 서버 랙과 장비의 3D 배치를 편집할 수 있습니다.
3D 모델은 토폴로지의 3D 뷰와 연동되어, 실제 서버실의 물리적 구조를 가상으로 재현하고 관리할 수 있습니다.
주요 기능
- 서버룸 카드: 서버룸 이름, ID, 설명 표시
- 3D 에디터 열기 버튼: 3D 모델 편집 화면으로 이동
- 아이템 목록 링크: 배치된 장비 목록 확인
기본 서버룸
On-Premise 설치 시 "기본조직 서버룸"이 자동으로 생성됩니다. 추가 서버룸을 생성하지 않아도 기본 서버룸에서 장비 배치를 시작할 수 있습니다.
서버 관리

서버 관리 화면에서는 조직에 등록된 서버 목록을 확인하고 관리합니다. "서버 목록" 탭에서 등록된 서버의 IP, 소속 그룹, 소유자/담당자, 수집 상태를 확인할 수 있습니다.
"서버 등록" 버튼으로 새 서버를 추가하고, "서버 그룹" 탭에서 서버를 논리적 그룹(GPU 클러스터, CPU 클러스터 등)으로 분류할 수 있습니다. "실시간 상태" 탭에서는 서버의 현재 리소스 사용량을 실시간으로 모니터링합니다.
주요 기능
- 탭 메뉴: 서버 목록, 서버 그룹, 실시간 상태
- 서버 테이블: 서버명, IP 주소, 그룹, 소유자, 상태, 수집 상태, 작업(상세)
- 서버 등록 버튼: 새 서버 추가 (모달 호출)
- 필터: 전체 그룹 드롭다운
서버 상세 드로어

서버 목록에서 서버를 클릭하면 우측에 상세 정보 드로어가 열립니다. 서버의 상태, IP, 소속 그룹, 소유자 정보와 함께 실시간 리소스 사용률과 최근 알림을 확인할 수 있습니다.
드로어 하단의 "수정" 버튼으로 서버 정보를 편집하고, "삭제" 버튼으로 서버를 제거할 수 있습니다.
- 서버 기본 정보: 서버명, 상태(온라인/오프라인), IP 주소, 그룹, 소유자
- 실시간 사용률: CPU/MEM/DISK 실시간 데이터
- 최근 알림: 최근 발생한 알림 요약
- 수정 버튼: 서버 정보 편집
- 삭제 버튼: 서버 등록 해제
서버 등록 모달

"서버 등록" 버튼을 클릭하면 나타나는 모달입니다. 서버명, IP 주소를 입력하고, 소유자와 소속 그룹을 선택한 후 "저장" 버튼으로 등록합니다.
서버 등록 후에는 해당 서버에 Exporter가 설치되어 있어야 실제 메트릭 수집이 시작됩니다. 소유자와 그룹은 나중에 변경할 수 있습니다.
- 서버명: 서버 호스트명 입력 (필수)
- IP 주소: 서버 IP 입력 (필수)
- 소유자 (선택): 담당자 드롭다운
- 그룹 (선택): 소속 그룹 드롭다운
- 저장/취소 버튼
하드웨어 자동 감지
Exporter가 서버에서 수집한 하드웨어 스펙 정보(CPU 모델, 코어 수, RAM 용량, 디스크 용량 등)를 서버 정보에 자동으로 반영하는 기능입니다. 관리자가 수동으로 하드웨어 정보를 입력하지 않아도, Exporter가 감지한 데이터를 기반으로 서버의 자산 정보가 자동 갱신됩니다.
주요 기능
- 자동 스펙 수집: node_exporter가 감지한 CPU 모델, 코어 수, 총 메모리 용량, 디스크 용량 자동 반영
- GPU 정보 감지: dcgm_exporter가 설치된 경우 GPU 모델 및 수량 자동 감지
- 자산 정보 동기화: 수집된 하드웨어 정보가 자산 관리 페이지에 자동 반영
- 수동 편집 가능: 자동 감지된 정보를 관리자가 필요에 따라 수정 가능
하드웨어 자동 감지 활용
새 서버 등록 시 Exporter만 설치하면 하드웨어 사양이 자동으로 채워지므로, 대량의 서버를 등록할 때 수동 입력 작업을 크게 줄일 수 있습니다.
GPU 팬 제어
BMC(Baseboard Management Controller)와 연동하여 GPU 팬 속도를 원격으로 제어하는 기능입니다. 수동 속도 조절과 온도 기반 자동 조절을 모두 지원합니다.
주요 기능
- 팬 속도 수동 제어: BMC를 통해 GPU 팬 속도를 원하는 비율(%)로 직접 설정
- 온도 기반 자동 조절: GPU 온도 임계값에 따라 팬 속도를 자동으로 조절
- 실시간 모니터링: 현재 팬 속도(RPM) 및 GPU 온도 실시간 확인
- BMC 연동 필수: GPU 팬 제어를 사용하려면 BMC 정보가 등록되어 있어야 합니다
BMC 연결 필요
GPU 팬 제어 기능은 BMC 정보 관리 페이지에서 해당 서버의 BMC IP와 인증 정보가 사전 등록되어 있어야 사용할 수 있습니다.
피어 그룹 관리
피어 그룹은 서버를 논리적 그룹으로 묶어 관리하는 기능입니다. 동일한 역할, 위치, 프로젝트 등으로 서버를 그룹화하면 대시보드에서 그룹 단위로 상태를 파악하고, 알림 규칙이나 환경 키트를 그룹 단위로 적용할 수 있습니다.
주요 기능
- 그룹 생성: 그룹명과 설명을 입력하여 새 피어 그룹 생성
- 서버 할당: 등록된 서버를 원하는 피어 그룹에 할당/해제
- 그룹별 상태 집계: 그룹에 소속된 서버의 온라인/오프라인 상태 요약
- 그룹 필터링: 서버 관리, 모니터링 현황 등 다른 페이지에서 그룹별 필터 적용 가능
- 일괄 관리: 그룹 단위로 담당자 변경, 알림 규칙 적용 등 일괄 작업
피어 그룹 활용 예시
- 역할별: GPU 클러스터, CPU 클러스터, 스토리지, 네트워크 장비
- 위치별: A동 서버실, B동 서버실, 원격지
- 프로젝트별: AI 연구, HPC 시뮬레이션, 데이터 분석
자산 관리

자산 관리 화면에서는 서버의 카테고리(프로덕션/스테이징/개발 등), 중요도 등급, 소유자/담당자 정보를 관리합니다. 프리셋 버튼으로 여러 서버를 한 번에 분류할 수 있으며, 체크박스로 선택한 서버에 일괄 적용이 가능합니다.
핵심 자산으로 지정된 서버는 대시보드의 "핵심 자산 스포트라이트" 위젯에 별도 표시됩니다.
주요 기능
- 프리셋 버튼: 프로덕션 핵심(빨간색), 스테이징(주황색), 개발/테스트(녹색), 유휴/예비(회색)
- 검색/필터: 서버명/IP 검색, 전체 카테고리 드롭다운, 핵심 자산만 표시 체크박스
- 자산 테이블: 서버명, IP, 우선순위, 핵심 여부, 카테고리, 중요도 등급, 사유/담당, 작업(저장/초기화)
- 일괄 적용: 체크박스 선택 후 프리셋 적용
프리셋 활용
프리셋 버튼을 활용하면 서버 분류 작업을 빠르게 처리할 수 있습니다. 체크박스로 여러 서버를 선택한 후 원하는 프리셋 버튼을 클릭하세요.
담당자 관리

담당자 관리 화면에서는 서버의 그룹별 담당자와 개별 서버 담당자를 확인하고 변경합니다. 상단에서 그룹(AI 연구실, HPC 연구실, 데이터센터 등) 단위로 담당자를 확인하고, 하단에서 서버별로 소유자와 작업 담당자를 관리합니다.
체크박스로 여러 서버를 선택하여 담당자를 일괄 변경할 수 있습니다.
주요 기능
- 그룹별 담당자 테이블: 그룹명, 담당자, 서버 수, 작업
- 서버별 담당자 테이블: 서버명, IP, 소유자, 그룹, 작업
- 일괄 변경: 체크박스로 여러 서버 선택 후 담당자 일괄 변경
BMC 정보 관리

BMC 정보 관리에서는 서버의 BMC(Baseboard Management Controller) 접속 정보를 등록하고 관리합니다. BMC IP와 ID를 등록하면 IPMI를 통해 서버 하드웨어의 온도, 전압, 팬 속도 등을 원격으로 모니터링할 수 있습니다.
"새 BMC 정보 추가" 버튼으로 새 BMC를 등록하고, "수정"/"삭제" 링크로 기존 정보를 관리합니다. 사용자 선택 드롭다운으로 다른 사용자의 BMC 정보도 확인할 수 있습니다.
주요 기능
- 사용자 선택 드롭다운: 관리 대상 사용자 선택
- 새 BMC 정보 추가 버튼: 새 BMC 정보 등록
- BMC 정보 테이블: 실서버 IP, BMC IP, BMC ID, 관리(수정/삭제)
Exporter 현황

Exporter 현황에서는 각 서버에 설치된 메트릭 수집기(Exporter)의 실시간 상태를 확인합니다. node_exporter(9100번 포트)는 CPU/메모리/디스크 등 시스템 메트릭을, dcgm_exporter(9400번 포트)는 NVIDIA GPU 메트릭을 수집합니다.
상태가 "DOWN"(빨간색)인 Exporter는 데이터 수집이 중단된 상태이므로, 해당 서버의 Exporter 프로세스를 확인해야 합니다. 15초 간격으로 자동 갱신되며, "새로고침" 버튼으로 즉시 갱신할 수 있습니다.
주요 기능
- Exporter 테이블: 서버명, IP, EXPORTER 유형, 포트, 상태(UP/DOWN), 마지막 수집
- 상태 배지: UP(녹색), DOWN(빨간색)
- 자동 갱신: 15초 간격
- 새로고침 버튼: 수동 갱신
Exporter 상태 확인
DOWN 상태의 Exporter가 발견되면 해당 서버에 SSH 접속하여 Exporter 프로세스가 실행 중인지 확인하세요. systemctl status node_exporter 명령으로 상태를 점검할 수 있습니다.
GPU 슬롯 매핑

GPU 슬롯 매핑에서는 GPU 서버의 보드별 GPU 슬롯 배치를 시각적으로 관리합니다. 각 보드 카드에 GPU 모델(NVIDIA A100/H100), 서버 소속, 슬롯 사용 현황이 표시됩니다.
보라색 슬롯은 사용 중, 회색 슬롯은 비어 있는 상태입니다. "하드웨어 동기화" 버튼으로 실제 GPU 상태와 동기화하고, "새 보드/슬롯 추가"로 보드를 수동 등록할 수 있습니다.
주요 기능
- 검색: 보드 이름으로 필터링
- 하드웨어 동기화 버튼: 실제 GPU 상태와 동기화
- 새 보드/슬롯 추가 버튼: 수동 보드 등록
- GPU 보드 카드: 보드명, GPU 모델, 서버 소속, 슬롯 사용 현황 (보라색: 사용 중, 회색: 비어 있음)
환경 키트

환경 키트는 대시보드 위젯 구성, 알림 규칙, 설정을 하나의 세트로 묶어 관리하는 기능입니다. 고객의 인프라 환경(HPC, GPU 연구, 스토리지 등)에 맞는 키트를 미리 만들어 두고, "적용" 버튼 한 번으로 전체 설정을 일괄 적용할 수 있습니다.
"Org에서 가져오기"로 다른 조직의 키트를 복사할 수 있으며, 적용 이력 테이블에서 언제 누가 어떤 키트를 적용했는지 추적됩니다.
주요 기능
- 키트 카드: 키트 이름, 태그, 설명, 위젯/알림 수, 적용/삭제/수정 버튼
- 새 키트 버튼: 새 환경 키트 생성
- Org에서 가져오기 버튼: 다른 조직의 키트 복사
- 적용 이력 테이블: 키트명, 조직, 적용자, 일시, 작업
제공 키트 예시
- 연구 환경 기본: 대학 연구 환경, Node Exporter 기반, 팀 리소스 관리 중심 (위젯 11개, 알림 3개)
- HPC 기본: HPC 클러스터, IPMI/Slurm/GPU 포함 (위젯 9개, 알림 4개)
- Lustre 스토리지: 파일시스템 성능 중심 모니터링 (위젯 8개, 알림 2개)
