데이터 과학/머신 러닝 모델 개발 시 가장 흔한 장애물 중 하나는 대규모로 실시간으로 작동할 수 있는 엔드투엔드 파이프라인을 설계하는 것입니다. 데이터 과학자와 엔지니어는 실험을 위해 인프라를 학습하고, 개발하고, 유지보수해야 하는 경우가 많습니다.
이 과정에서 살만(Salman)은 머신 러닝과 무관한 작업을 추상화하면서도 제어권을 유지할 수 있도록 설계된 오픈 소스 쿠버네티스 기반 플랫폼인 Kubeflow의 장점을 논의합니다.
주요 학습 내용:
- Kubeflow 아키텍처 및 설치
- Kubeflow 파이프라인을 사용한 엔드투엔드 머신 러닝 실험 오케스트레이션
- Kubeflow의 현재 사용 사례 및 다른 업계 분야의 팀들이 클라우드 기술을 활용해 머신 러닝 운영을 확장하는 방법