1. Introduction
MLOps 시스템 구축해보기
MLOps를 공부하는 데 있어서 가장 큰 장벽은 MLOps 시스템을 구성해보고 사용해보기가 어렵다는 점입니다. AWS, GCP 등의 퍼블릭 클라우드 혹은 Weight & Bias, neptune.ai 등의 상용 툴을 사용해보기에는 과금에 대한 부담이 존재하고, 처음부터 모든 환경을 혼자서 구성하기에는 어디서부터 시작해야 할지 막막하게 느껴질 수밖에 없습니다.
이런 이유들로 MLOps를 선뜻 시작해보지 못하시는 분들을 위해, 모두의 MLOps에서는 우분투가 설치되는 데스크톱 하나만 준비되어 있다면 MLOps 시스템을 밑바닥부터 구축하고 사용해 볼 수 있는 방법을 다룰 예정입니다.
우분투 데스크탑 환경을 준비할 수 없는 경우, 가상머신을 활용하여 환경을 구성하기
Windows 혹은 Intel Mac을 사용해
모두의 MLops
실습을 진행 중인 분들은Virtual Box
,VMware
등의 가상머신 소프트웨어를 이용하여 우분투 데스크탑 환경을 준비할 수 있습니다. 이 때, 권장 사양을 맞춰 가상 머신을 생성해주시기 바랍니다. 또한, M1 Mac을 사용하시는 분들은 작성일(2022년 2월) 기준으로는 Virtual Box, VMware 는 이용할 수 없습니다. (M1 Apple Silicone Mac에 최적화된 macOS 앱 지원 확인하기) 따라서, 클라우드 환경을 이용해 실습하는 것이 아니라면, UTM , Virtual machines for Mac을 설치하여 가상 머신을 이용해주세요. (앱스토어에서 구매하여 다운로드 받는 소프트웨어는 일종의 Donation 개념의 비용 지불입니다. 무료 버전과 자동 업데이트 정도의 차이가 있어, 무료버전을 사용해도 무방합니다.) 해당 가상머신 소프트웨어는Ubuntu 20.04.3 LTS
실습 운영체제를 지원하고 있어, M1 Mac에서 실습을 수행하는 것을 가능하게 합니다.
하지만 MLOps의 구성요소에서 설명하는 요소들을 모두 사용해볼 수는 없기에, 모두의 MLOps에서는 대표적인 오픈소스만을 설치한 뒤, 서로 연동하여 사용하는 부분을 주로 다룰 예정입니다.
모두의 MLOps에서 설치하는 오픈소스가 표준을 의미하는 것은 아니며, 여러분의 상황에 맞게 적절한 툴을 취사선택하는 것을 권장합니다.
구성 요소
이 글에서 만들어 볼 MLOps 시스템의 구성 요소들과 각 버전은 아래와 같은 환경에서 검증되었습니다.
원활한 환경에서 테스트하기 위해 싱글 노드 클러스터 (혹은 클러스터) 와 클라이언트를 분리하여 설명해 드릴 예정입니다.
클러스터 는 우분투가 설치되어 있는 데스크톱 하나를 의미합니다.
클라이언트 는 노트북 혹은 클러스터가 설치되어 있는 데스크톱 외의 클라이언트로 사용할 수 있는 다른 데스크톱을 사용하는 것을 권장합니다.
하지만 두 대의 머신을 준비할 수 없다면 데스크톱 하나를 동시에 클러스터와 클라이언트 용도로 사용하셔도 괜찮습니다.
클러스터
1. Software
아래는 클러스터에 설치해야 할 소프트웨어 목록입니다.
Software | Version |
---|---|
Ubuntu | 20.04.3 LTS |
Docker (Server) | 20.10.11 |
NVIDIA-Driver | 470.86 |
Kubernetes | v1.21.7 |
Kubeflow | v1.4.0 |
MLFlow | v1.21.0 |
2. Helm Chart
아래는 Helm을 이용해 설치되어야 할 써드파티 소프트웨어 목록입니다.
Helm Chart Repo Name | Version |
---|---|
datawire/ambassador | 6.9.3 |
seldonio/seldon-core-operator | 1.11.2 |
클라이언트
클라이언트는 MacOS (Intel CPU), Ubuntu 20.04 에서 검증되었습니다.
Software | Version |
---|---|
kubectl | v1.21.7 |
helm | v3.7.1 |
kustomize | v3.10.0 |
Minimum System Requirements
모두의 MLOps를 설치할 클러스터는 다음과 같은 사양을 만족시키는 것을 권장합니다.
이는 Kubernetes 및 Kubeflow 의 권장 사양에 의존합니다.
- CPU : 6 core
- RAM : 12GB
- DISK : 50GB
- GPU : NVIDIA GPU (Optional)