Web UI 기반의 MLOps 도구
AI Pub Dev를 소개합니다

AI Pub Dev는 컨테이너 플랫폼 COASTER를 바탕으로, AI 개발, 학습을 위한 GPU인프라 리소스 관리를 지원하는 툴입니다.
다양한 사람들이 모여 이야기를 나누는 Pub처럼 개발자, 비개발자 모두 사용할 수 있는 접근성 높은 서비스를 지원합니다.

ML-AI Pub Dev-AI Pub Ops

Coaster와 AI Pub Dev, AI Pub Ops는
여러분의 MLOps 라이프 사이클이 가치를 생산할 수 있도록 돕습니다.
효율적인 AI 개발과 운영 프로세스 경험을 전달합니다.

AIPUB Dev

AI Pub Dev는 AI의 개발, 학습을 위한 리소스 관리 도구입니다.

한정된 AI 인프라를 여러 AI 개발자들에게 나눠줄 수 있습니다. 다수의 개발자들이 작업에 맞게 할당 받은 GPU 인프라 리소스를 사용할 수 있어 효율적이죠.
관리자는 AI Pub Dev를 활용해 다양한 인프라 패턴에 맞춰 GPU 인프라 리소스를 관리할 수 있습니다.

ML-AI Pub Dev-AI Pub Ops ML-AI Pub Dev-AI Pub Ops

AI Pub Dev를 경험해 보세요

AI Pub Dev는 COASTER를 코어로 하여 모델 학습, 리소스 및 워크로드 등에 관한 완전 관리형 서비스를 제공합니다.

주요 서비스
서비스 상세
워크로드 생성

사용자의 개발 환경을 이미지의 형태로 관리

개발 이미지 기반 워크스페이스 생성

주피터노트북 및 텐서보드 연동

모델 학습

AI 학습 별로 필요한 자원을 자동으로 할당하여 작업 수행

GPU 리소스와 CPU 리소스 신청 가능

리소스 관리

사용자 계정 별 리소스 사용 제한 설정

유휴 리소스 회수

노드 별 워크스페이스 관리 및 MIG 설정

전체 인프라 모니터링

리소스 그룹 관리

관리자 리소스 그룹 생성 및 사용자 권한 설정 기능

리소스 그룹 편집 기능

워크로드 관리

스케줄러 멈춤/재개 기능

대기열 관리 및 우선순위 조절 기능

사용내역 관리

사용자 계정별 리소스 사용 내역 관리

사용 내역 다운로드 기능

리소스 할당 대기 항목의
순서를 직접 정할 수 있습니다

GPU 인프라 리소스를 할당하면서,
무엇을 가장 우선순위에 둬야 할 지 난감했던 경험이 있으신가요?
AI Pub Dev에서는 리소스 할당 대기 항목들의 순서를 정하거나 우선순위를 편집할 수 있습니다.
또한 스케줄러 온/오프 기능을 함께 제공하고 있어 변화에 유연하게 대응할 수 있습니다.

트리구조1

MIG 분할을 최소 단위로
자원 운영 관리도 꼼꼼하게

AI Pub Dev를 활용하면 MIG 분할(1 GPU의 1~7 분할)을
최소 단위로 하여 리소스를 관리할 수 있습니다.
사용자 계정 별로 리소스 신청 제한 정책을 설정할 수도 있습니다.

트리구조1

AI Pub Dev로 GPU 리소스 상태와 가동률을 모니터링할 수 있습니다

GPU 리소스를 효율적으로 사용하고 있는지 확인해 보세요.
필요에 따라 클러스터 단위, 노드 단위, 프로젝트 단위로 리소스 상태와 가동률을 실시간 모니터링할 수 있습니다.
계정 별 리소스 사용량 측정 및 활용 추이도 확인할 수 있습니다.

group5

AI Pub Dev의 기능을 영상으로 확인해 보세요

TEN의 유튜브 채널에서 AI Pub Dev의 기능을 DEMO 영상으로 만나 보실 수 있습니다.

AI Pub에 대해 더 자세히 알고 싶으신가요?

AI Pub에 대한 문의사항을 TEN에게 보내주세요.
여러분의 AI 개발, 운영을 주식회사 텐이 돕겠습니다.

문의하기 ->