Skip to content

Version 2.0.0

2026-02-27

Runway 2.0은 AI·ML 워크로드를 일관된 방식으로 구성·배포·운영하기 위해 플랫폼 구조와 실행 환경을 전면 재설계한 메이저 릴리즈입니다.
Helm 기반 애플리케이션 시스템, REST API 모델 서빙 인프라, 통합 인증·인가(RBAC) 기반 접근 제어, 실시간 리소스 모니터링을 하나의 운영 체계로 통합하여 제공합니다.


New features

AI 운영체제 기반 플랫폼 출시

Runway를 AI 운영체제(AI OS)로 재정의하였습니다. Kubernetes 기반으로 애플리케이션 실행 환경, 자원 관리, 인증·인가, 배포 및 관측을 하나의 운영 체계로 통합합니다.

  • 즉시 사용 가능한 실행 환경: 사전 구성된 애플리케이션과 운영 설정으로 인프라 준비 없이 작업을 시작할 수 있습니다.
  • 확장 가능한 운영 구조: 프로젝트 규모에 따라 애플리케이션·자원·배포 방식을 단계적으로 확장할 수 있습니다.
  • 플랫폼 중심 책임 분리: 인프라·보안·운영 복잡도는 플랫폼이 담당하고, 사용자는 AI 워크로드에 집중할 수 있습니다.

워크스페이스·프로젝트 계층 구조

조직(팀) 단위로 자원을 관리하는 워크스페이스와, 실제 AI·ML 워크플로우를 실행하는 단위인 프로젝트의 계층 구조를 도입하였습니다.

  • 워크스페이스: 사용자 초대, 프로젝트 생성, 리소스 쿼터 관리, 역할 기반 접근 제어를 담당합니다.
  • 프로젝트: 애플리케이션 배포, 스토리지 관리, 모델 서빙, 모니터링 등 실무 워크플로우를 수행하는 공간입니다.
  • 역할 기반 접근 제어: 플랫폼·워크스페이스·프로젝트 단위로 독립적인 역할을 부여하며, 사용자 정의 역할로 세분화된 권한을 설정할 수 있습니다.

통합 인증·인가 및 역할 기반 접근 제어(RBAC)

OIDC/OAuth 기반 통합 인증과 계층적 RBAC을 도입하여 플랫폼 전반의 접근 제어를 일관되게 관리합니다.

  • OIDC/OAuth · SSO 통합 인증: Keycloak 기반 Single Sign-On을 지원하며, 하나의 계정으로 플랫폼 내 모든 서비스에 접근할 수 있습니다.
  • 계층적 RBAC: 플랫폼·워크스페이스·프로젝트 단위로 역할이 독립적으로 부여됩니다. 상위 단위의 역할이 하위 단위 권한을 자동으로 포함하지 않아, 최소 권한 원칙에 따른 세밀한 접근 제어가 가능합니다.
  • 사용자 정의 역할: 기본 역할(관리자/멤버/뷰어) 외에 개별 권한을 조합한 사용자 정의 역할을 생성하여 조직 구조에 맞는 권한 체계를 구성할 수 있습니다.
  • 보안 정책 통합 관리: 로그인 정책, 세션 관리, 네트워크 격리 등 플랫폼 수준의 보안 설정을 Runway 관리센터에서 일괄 관리합니다.
  • 활동 로그(감사 추적): 사용자 및 시스템 활동 내역을 기록하여 보안 이벤트 추적 및 규정 준수에 활용할 수 있습니다.

Helm 기반 애플리케이션 시스템

모든 실행 단위를 애플리케이션(Application)으로 통합하여 배포·관리합니다. 세 가지 유형의 애플리케이션 생성 방식을 지원합니다.

  • 플랫폼 앱: MLflow, Gitea, Airflow 등 플랫폼에서 자동으로 제공하는 앱으로, 별도 설정 없이 바로 사용할 수 있습니다.
  • 앱 카탈로그: JupyterLab, Code Server, 벡터 DB 등을 최소 설정으로 간편하게 배포합니다.
  • 커스텀 앱: Helm 차트를 직접 작성하여 Kubernetes와 호환되는 모든 애플리케이션을 자유롭게 배포할 수 있습니다.

스토리지 볼륨 관리

프로젝트 내 데이터·모델 파일 저장을 위한 볼륨 관리 기능을 제공합니다.

  • 볼륨 유형: PVC(단일 앱 전용), Shared PVC(다수 앱 공유), Empty Dir(임시 저장)을 지원합니다.
  • 스토리지 클래스: ceph-block(블록 스토리지), ceph-filesystem(파일 시스템) 중에서 선택할 수 있습니다.
  • 접근 모드: ReadWriteOnce, ReadWriteMany 등 워크로드 요구 사항에 맞는 접근 정책을 설정할 수 있습니다.
  • 용량 확장: 삭제 없이 기존 볼륨 용량을 확장할 수 있습니다.

REST API 기반 모델 서빙

학습된 모델을 프로덕션 환경에 배포하고 외부에서 추론 요청을 받을 수 있는 엔드포인트 기반 모델 서빙 인프라를 제공합니다.

  • 서빙 런타임 선택:
    • Triton Inference Server: TensorRT, PyTorch, TensorFlow, ONNX, OpenVINO, Python backends를 지원하며, GPU 최적화 및 동적 배칭(Dynamic Batching)을 제공합니다.
    • MLServer: scikit-learn, XGBoost, LightGBM, MLflow, Custom Python을 지원하는 Kubernetes 네이티브 경량 추론 서버입니다.
  • 트래픽 분배: 하나의 엔드포인트에 여러 모델을 배포하고 가중치 기반으로 트래픽을 분산하여 A/B 테스트, 카나리 배포, 점진적 롤아웃을 수행할 수 있습니다.
  • 유효 가중치(Effective Weight): 정상 배포된 모델만을 기준으로 실제 트래픽 비율을 자동 산출하여 표시합니다.
  • 공유 메모리(Shared Memory) 설정: 멀티프로세스 추론 파이프라인 또는 PyTorch DataLoader를 사용하는 경우 공유 메모리 크기를 설정할 수 있습니다.

리소스 모니터링

워크스페이스·프로젝트 단위의 계층적 리소스 모니터링을 제공합니다.

  • 워크스페이스 모니터링: 전체 리소스 할당 현황(CPU, Memory, Disk, GPU)과 시간대별 사용 추이를 확인합니다.
  • 프로젝트 모니터링: 프로젝트별 쿼터 할당 현황과 할당률·사용률을 비교합니다.
  • 시계열 그래프: 1시간~7일 단위의 Capacity / Allocated / Used 추이를 시각화하여 리소스 최적화에 활용할 수 있습니다.

계정 및 키 관리

개인 계정 및 외부 서비스 연동에 필요한 키를 통합 관리합니다.

  • Runway API 키: Runway REST API 호출에 사용하는 키를 생성·관리합니다.
  • LLM API 키: 외부 LLM 서비스 연동을 위한 API 키를 관리합니다.
  • S3 키: S3 호환 스토리지 연동에 사용하는 접근 키를 관리합니다.
  • Kubeconfig: 클러스터 직접 접근을 위한 Kubeconfig 파일을 다운로드하여 kubectl 및 외부 도구에서 활용할 수 있습니다.

플랫폼 관리센터 (관리자 전용)

플랫폼 관리자를 위한 Runway 관리센터를 별도로 제공합니다.

  • 워크스페이스 생성·삭제: 플랫폼 내 워크스페이스를 생성하고 삭제합니다.
  • 사용자 계정 관리: 전체 사용자 계정 생성, 비밀번호 초기화, 상태를 관리합니다.
  • 클러스터 리소스 모니터링: 전체 클러스터 단위의 CPU·Memory·GPU 사용 현황을 확인합니다.
  • 보안 설정: 로그인 정책, 세션 관리, 접근 제어를 설정합니다.
  • 활동 로그: 사용자 및 시스템 활동 내역을 기록하여 감사에 활용합니다.
  • 라이선스 관리: 라이선스 정보를 확인하고 갱신합니다.

Known issues

인증 및 세션

  • 특정 상황에서 로그인/로그아웃 또는 계정 전환 시, 예상과 다른 계정으로 접속되거나 오류 화면이 일시적으로 표시되는 문제
  • 워크스페이스 초대 메일 링크로 접속 시, 실제로는 참여가 완료되었음에도 초대 정보가 없다는 메시지가 표시되는 문제
  • 로그아웃 직후 표시되는 로그인 페이지에서 사용자가 선택한 언어 설정이 즉시 반영되지 않는 문제

역할 및 권한 표시

  • 일부 화면에서 사용자 역할(권한) 정보가 실제 권한과 다르게 표시되거나, 권한이 있음에도 관련 버튼이 노출되지 않는 문제
  • 사용자·워크스페이스·프로젝트 검색 및 정렬 기능이 제한적이어서, 특정 사용자나 프로젝트를 찾기 어려운 문제

스토리지 관리

  • 다른 리소스와 연결된 스토리지를 삭제하거나 용량을 변경할 때, 실제 적용 상태와 화면에 표시되는 용량 정보가 일시적으로 일치하지 않는 문제
  • 특정 스토리지 조합 사용 또는 할당 가능한 용량을 초과하는 경우, 에러 메시지가 충분히 구체적이지 않아 원인 파악이 어려운 문제

모델 서빙 및 앱 관리

  • 추론 엔드포인트 및 모델 배포 시 GPU·메모리 관련 기본값과 화면 동작이 직관적이지 않아 설정 과정에서 혼동이 발생할 수 있는 문제
  • 엔드포인트·모델·애플리케이션 상세 화면에서 일부 정보(설명, 링크, 설정 값 등)가 제한적으로 노출되어, 여러 배포를 동시에 관리하기 어려운 문제

모니터링

  • GPU 리소스 모니터링 화면에서 일부 용어, 그래프 스타일 및 필터 UI가 실제 동작 방식과 다르게 표현되어, 지표를 해석할 때 혼동이 발생할 수 있는 문제