리소스 모니터링¶
플랫폼 관리자는 시스템 내 모든 컴퓨팅 리소스 사용 현황을 모니터링할 수 있습니다.
모니터링 메뉴는 클러스터 탭과 워크스페이스 탭으로 구성되어 있으며, 플랫폼 전체 리소스 상태와 워크스페이스별 리소스 사용량을 각각 확인할 수 있습니다. 각 단위별 배정된 리소스 한도와 사용량이 표시되며, 이를 토대로 계산된 사용률을 확인할 수 있습니다. 시각화된 트렌드 그래프와 정량 수치 정보를 바탕으로 리소스 활용 최적화 및 확장 전략 수립에 활용할 수 있습니다.
모니터링 화면에 표시되는 용어에 대한 설명은 리소스 모니터링 용어와 해석 기준을 참고하세요.
Runway 관리센터 > 모니터링 메뉴
이 페이지에서 확인할 수 있는 항목은 다음과 같습니다.
-
클러스터 모니터링
클러스터 전체 리소스의 상태와 추이를 확인합니다.
-
워크스페이스 모니터링
워크스페이스별 리소스 배분과 사용 현황을 확인합니다.
-
용어와 해석 기준
지표 용어를 정리하고 해석 기준을 확인합니다.
클러스터 모니터링¶
클러스터 리소스 모니터링은 Runway 플랫폼에서 사용하는 클러스터 전체 자원의 상태를 확인하고, 현재 사용 중인 리소스와 추가로 활용 가능한 리소스 범위를 파악하기 위한 관리 화면입니다.
Runway 관리센터 > 모니터링 메뉴 > 클러스터 탭
전체 리소스(노드) 상세 정보¶
클러스터 리소스 영역의 GPU 카드 안의 상세보기를 클릭하면 클러스터에 연결된 노드별 리소스 상세 정보를 확인할 수 있습니다.
상세 화면에서는 노드 단위로 CPU, 메모리 등 가용 자원 정보를 표시하며, GPU가 장착된 노드의 경우 GPU 모델, CUDA 버전, GPU 수와 같은 GPU 관련 정보가 함께 제공됩니다. 또한 필터와 정렬 기능을 사용해 특정 조건의 노드를 빠르게 찾고, 워크로드 배치 또는 리소스 확장 판단에 필요한 근거를 확인할 수 있습니다.
현재 리소스 사용량¶
클러스터 리소스 영역은 조회 시점 기준으로 클러스터 노드가 제공하는 전체 리소스 중에서, 이미 시스템에 의해 예약된 자원과 워크스페이스에 할당 가능한 범위와 을 구분하여 보여줍니다. CPU, 메모리, 스토리지, GPU 리소스를 각각의 카드 형태로 제공합니다.
각 리소스 카드에는 다음 정보가 표시됩니다.
-
Node Capacity
클러스터에 포함된 모든 노드가 제공하는 전체 물리적 리소스 용량입니다. -
System Allocated 플랫폼 운영 및 기존 환경 구성을 위해 이미 예약된 리소스 용량입니다. 필수 시스템 구성 요소와 사전에 확보된 리소스가 포함되며, 이 영역의 리소스는 워크스페이스에 추가로 배정할 수 없습니다.
-
Platform Capacity Node Capacity에서 System Allocated를 제외한 값으로, 워크스페이스에 할당할 수 있도록 플랫폼에서 제공하는 리소스 풀을 의미합니다. 새로운 워크스페이스를 생성하거나 워크스페이스의 리소스 할당량을 조정할 때 이 값을 기준으로 제한이 적용됩니다.
리소스 사용 추이¶
리소스 사용 추이는 시간에 따라 클러스터 자원이 어떻게 할당되고 실제로 사용되고 있는지를 시계열 그래프로 확인할 수 있는 기능입니다. 플랫폼 단위에서 CPU, 메모리, 스토리지, GPU 리소스의 상태를 시간 축 기준으로 비교하여 분석할 수 있으며, 자원 사용 패턴 파악, 과부하 여부 확인, 확장 필요성 판단에 활용됩니다.
조회 기간은 1시간, 3시간, 6시간, 12시간, 1일, 3일, 7일, Custom(사용자 지정 기간) 단위로 선택할 수 있으며, 선택한 기간에 따라 그래프의 범위가 조정되어 표시됩니다.
각 리소스가 개별 그래프로 표시되며, 특정 시간의 사용량 지표를 함께 확인할 수 있습니다.
-
용량(Capacity)
클러스터 노드가 제공하는 전체 물리적 리소스 용량입니다. -
할당됨(Allocated) 모든 워크스페이스 위해 설정한 리소스 할당량의 합계로, 사용을 허용한 상한선을 의미합니다.
-
사용됨(Used) 실행 중인 애플리케이션, 인스턴스, 모델 서빙 등 워크로드가 실제로 소비하고 있는 리소스 사용량입니다.
리소스 사용 추이의 활용
사용 그래프를 통해 아래와 같이 활용할 수 있습니다.
- 비교 관점: 전체 용량 대비 자원 할당 수준과 실제 사용량의 차이를 직관적으로 비교할 수 있습니다.
- 과부하 징후 확인: 리소스가 과도하게 할당되었는지, 또는 실제 사용량이 용량에 근접했는지를 한눈에 파악할 수 있습니다.
- 구간 확대: 그래프 하단의 시계열 바를 드래그해 특정 구간을 확대하고 상세 추이를 확인할 수 있습니다.
- 툴팁 확인: 각 시점에 마우스를 올리면 용량, 할당됨, 사용됨 수치가 표시되어, 시간대별 변화를 정밀하게 분석할 수 있습니다.
워크스페이스 모니터링¶
워크스페이스 리소스 모니터링은 플랫폼에 생성된 각 워크스페이스가 얼마나 많은 자원을 할당받았고, 실제로 얼마나 사용 중인지를 확인하기 위한 관리 화면입니다. 클러스터 전체 관점이 아닌, 워크스페이스 단위의 자원 배분 상태와 사용 현황을 비교·분석하는 데 초점을 둡니다.
Runway 관리센터 > 모니터링 메뉴 > 워크스페이스 탭
워크스페이스 리소스 할당 변경
워크스페이스에 할당된 리소스는 워크스페이스 메뉴에서 관리자가 직접 조정할 수 있습니다. 모니터링 과정에서 리소스 재분배가 필요하다면 워크스페이스 관리를 참고하세요.
워크스페이스 탭은 크게 자원 할당(Resource allocation), 쿼터 할당(Quota assignment), 워크스페이스 목록 영역으로 구성됩니다.
할당과 사용의 구분
워크스페이스 리소스는 정책적 한도(쿼터), 예약된 자원(할당), 실제 소비량(사용)의 세 단계로 관리됩니다.
- 쿼터 할당(Quota assignment): 얼마까지 써도 되는지 정하는 정책적 한도
- 자원 할당(Resource allocation): 실제 사용을 위해 예약된 리소스
- 사용량: 현재 시점에 실제로 소비 중인 리소스
이 구분을 통해 관리자는 리소스 과다 배정 또는 부족 여부를 보다 명확하게 판단하고, 필요에 따라 워크스페이스별 리소스 정책 설정하고 변경할 수 있습니다.
리소스 할당 보기¶
리소스 할당 영역은 플랫폼이 보유한 자원이 워크스페이스에 어떻게 할당되고 있는지를 보여줍니다. 각 리소스 카드(CPU, 메모리, 스토리지, GPU)는 플랫폼 기준의 가용량과 현재 워크스페이스에 할당된 상태를 요약합니다.
각 카드에는 다음 정보가 표시됩니다.
-
할당률(Allocation ratio)
용량(Capacity) 대비 할당됨(Allocated) 리소스의 비율을 의미하며, 워크스페이스 할당 풀의 사용 수준을 나타냅니다. -
용량(Capacity) 워크스페이스에 리소스를 할당하기 위해 플랫폼에서 사용 가능하도록 설정된 최대 자원 한도입니다. 클러스터 전체 물리 리소스(Node Capacity)에서 시스템 예약 리소스를 제외한 값으로, 워크스페이스별 리소스 할당(Allocation)은 이 범위 내에서만 이루어집니다.
-
할당됨(Allocated) 워크스페이스에 실제로 할당(예약)된 리소스량의 합계입니다. 각 워크스페이스에 설정된 쿼터 및 실행 중인 워크로드에 따라 증가합니다.
-
할당 가능(Allocatable) 현재 시점에서 워크스페이스에 추가로 할당할 수 있는 잔여 자원량입니다.
할당 가능(Allocatable) = 용량(Capacity) - 할당됨(Allocated)관계를 가집니다.
쿼터 할당 보기¶
쿼터 할당 영역은 워크스페이스에 설정된 자원 쿼터가 얼마나 배정되었는지를 게이지 형태로 보여줍니다. 이는 워크스페이스가 사용할 수 있도록 사전에 지정한 자원 한도의 상태를 나타냅니다.
각 리소스별로 다음 정보가 제공됩니다.
-
배정비율(Assignment ratio)
Capacity 대비 워크스페이스에 배정된 쿼터의 비율입니다. -
지정됨(Assigned)
모든 워크스페이스에 쿼터로 지정된 리소스량의 합계입니다. -
용량(Capacity) 워크스페이스에 리소스를 할당하기 위해 플랫폼에서 사용 가능하도록 설정된 최대 자원 한도입니다. 클러스터 전체 물리 리소스(Node Capacity)에서 시스템 예약 리소스를 제외한 값입니다.
-
지정 가능(Assignable) 현재 시점에서 추가로 쿼터를 배정할 수 있는 리소스량입니다.
쿼터 배정 비율이 100%를 초과하는 경우
쿼터는 논리적인 사용 한도(정책적 제한)이므로, 운영 정책에 따라 전체 용량(Capacity)를 초과하여 배정될 수 있습니다. 이 경우 배정비율이 100%를 초과해 표시될 수 있으며, 이는 오버커밋(overcommit)을 허용하는 설계에 따른 정상적인 상태입니다.
다만 실제 리소스 사용량이 물리적 용량에 근접할 경우, 워크로드 실행 지연이나 자원 경쟁이 발생할 수 있으므로 주의가 필요합니다.
워크스페이스별 리소스 현황¶
워크스페이스 영역에서는 모든 워크스페이스의 리소스 상태를 테이블 형태로 비교할 수 있습니다. 각 워크스페이스에 대해 리소스별로 할당 수준과 실제 사용 상태가 정량적으로 표시됩니다.
테이블에는 다음 항목이 리소스(CPU, 메모리, 스토리지, GPU)별로 제공됩니다.
-
Allocation ratio
워크스페이스에 할당된 리소스 대비 실제 사용량의 비율입니다. -
Assigned 워크스페이스에 쿼터로 지정된 리소스량입니다.
-
Allocated 실행 중인 애플리케이션, 인스턴스, 모델 서빙 등 워크로드에 의해 실제로 예약된 리소스량입니다.
이 표를 통해 플랫폼 관리자는 워크스페이스 간 자원 사용 불균형, 과다 할당 또는 저활용 상태, 자원 회수 및 재배분 필요성을 종합적으로 판단할 수 있습니다.
개별 워크스페이스 상세 모니터링
워크스페이스 목록에서 워크스페이스 이름을 클릭하면, 관리센터 화면이 아닌 Runway 서비스에서 해당 워크스페이스의 모니터링 화면으로 이동하며, 해당 워크스페이스와 하위 프로젝트의 리소스 현황을 확인할 수 있습니다.
워크스페이스 내부 모니터링 화면의 구성과 지표에 대한 자세한 설명은
워크스페이스 모니터링 가이드는 Runway 사용자 가이드를 참고하세요.
리소스 모니터링 용어와 해석 기준¶
리소스 모니터링 화면에는 클러스터와 워크스페이스 단위로 다양한 리소스 지표와 용어가 함께 표시됩니다. 이 섹션에서는 모니터링 화면에 등장하는 주요 개념을 하나의 흐름으로 정리하여, 각 수치가 무엇을 의미하고 어떻게 해석해야 하는지를 설명합니다.
리소스 관리의 단계적 구조¶
Runway에서 리소스는 다음과 같은 단계로 관리됩니다.
클러스터 물리 리소스
└─ 워크스페이스에 배정 가능한 리소스 풀
└─ 워크스페이스별 쿼터(정책적 한도)
└─ 실행 중인 워크로드에 대한 리소스 할당
└─ 실제 런타임 리소스 사용량
이 구조를 이해하면 클러스터 탭과 워크스페이스 탭에서 표시되는 모든 지표를 일관되게 해석할 수 있습니다.
쿼터 할당(Quota assignment)¶
쿼터 할당은 워크스페이스가 사용할 수 있도록 사전에 지정한 자원 사용 한도를 의미합니다. 이는 실제 사용 여부와 관계없이, 워크스페이스별로 허용된 최대 리소스 범위를 정의하는 정책적 설정입니다.
- Assigned(지정됨): 워크스페이스에 쿼터로 지정된 리소스량
- Assignment ratio(배정비율): 플랫폼 기준 용량 대비 쿼터 배정 비율
- Assignable(지정가능): 추가로 쿼터를 배정할 수 있는 잔여 리소스
쿼터는 논리적인 한도이므로, 운영 정책에 따라 전체 용량을 초과하여 설정될 수 있으며 이 경우 배정 비율이 100%를 초과해 표시될 수 있습니다.
리소스 할당(Resource allocation)¶
리소스 할당은 실행 중인 애플리케이션, 인스턴스, 모델 서빙 등을 위해 실제로 예약된 자원량을 의미합니다. 워크로드가 배치될 때 스케줄러가 사용하는 기준이며, 물리 노드 리소스와 직접적으로 연결됩니다.
- Allocated(할당됨): 실행 중인 워크로드를 위해 예약된 리소스
- Allocation ratio(할당률): 할당할 수 있는 리소스 풀 대비 예약된 리소스의 비율
- Allocatable(할당가능): 추가로 예약할 수 있는 여유 리소스
리소스 할당은 쿼터 범위 내에서만 증가할 수 있으며, 쿼터가 충분하더라도 클러스터에 실제 가용 리소스가 없으면 할당되지 않을 수 있습니다.
실제 사용량(Used)¶
실제 사용량은 실행 중인 워크로드가 런타임에서 실시간으로 소비하고 있는 자원량을 의미합니다. CPU, 메모리 등의 사용량은 실수 단위로 표시되며, 모니터링 그래프를 통해 시간 흐름에 따른 변화를 확인할 수 있습니다.
일반적으로 다음 관계를 가집니다.
**쿼터 할당(Assigned) ≥ 자원 할당(Allocated) ≥ 실제 사용량(Used)**
해석 가이드 요약
아래 기준은 리소스 표를 해석할 때 참고할 핵심 요약입니다.
- 쿼터 할당은 “얼마까지 써도 되는지”를 정하는 정책 기준입니다.
- 자원 할당은 "실제로 쓰기 위해 예약된 리소스"를 의미합니다.
- 실제 사용량은 "현재 시점에 소비 중인 리소스"입니다.
이 기준을 바탕으로 관리자는 리소스 과다 배정 여부, 실제 사용 대비 여유 리소스 규모, 워크스페이스 간 리소스 불균형을 종합적으로 판단할 수 있습니다.








