Mlops에 대해 공부해보고자 지난번에 Kubeflow를 구축했다.
- Kubeflow 설치: https://hd-engineering.tistory.com/23
- 모델 레지스트리 설치: https://hd-engineering.tistory.com/24
이번에는 테스트 코드를 활용하여 Kubeflow에서 학습을 진행하고, 학습된 모델을 모델 레지스트리에 저장한 뒤, 증분 학습을 시키는 과정을 수행해 보았다.
pipeline.py 테스트 코드 설명
실제로 의미 있는 모델을 만들면 좋겠지만.. 그것이 목적이 아니므로, 단순히 과정을 실습해보기 위한 테스트 코드를 AI를 활용해 생성했다.
- 애플 주가 예측 모델을 예시로 사용했다.
- 1년치 데이터를 외부에서 받아 학습하도록 구성했다.
- Kubeflow에서 년도와 기존 모델 경로를 변수로 입력할 수 있도록 설정했다.
- 기존 모델이 주어지지 않은 경우에는 초기 모델을 새로 생성하고, 기존 모델이 주어질 경우에는 해당 모델을 불러와 증분 학습을 진행하도록 분기처리 했다.
기본 순서
pipeline.py코드를 작성하여 실행하면pipeline.yaml파일이 생성된다- 생성된
pipeline.yaml을 Kubeflow Pipelines에 등록한다.
- 등록한 파이프라인에서 Run(Create Run) 을 생성하여 실행한다.
- 이 과정에서 Experiment 도 함께 지정해야 한다.
- Experiment는 실행 내역을 관리하고 여러 실험을 구분하기 위해 필요하다.


- Run이 성공하면 모델 레지스트리에 모델이 저장되고, 해당 모델의 URL을 확인할 수 있다.

- 증분 학습 과정에서는 이 URL을 변수로 넘겨주어 Run을 실행한다.

결과
- 초기 모델 생성 확인(2024년 데이터 학습)
- 모델 레지스트리에 모델이 저장 확인.
- 저장된 모델을 불러와 증분 학습 실행 확인(초기모델에 2022, 2023년 데이터 추가로 학습)
(실행 화면 스크린샷은 추후 추가 예정)
다음 단계
다음번에는 해당 모델을 서빙(Serving) 하여, 데이터를 입력하면 예측값을 반환받을 수 있는 과정을 진행해볼 예정이다.
'Data > MLOps' 카테고리의 다른 글
| Kubeflow 모델 레지스트리(Model Registry) 추가하기 (0) | 2025.09.08 |
|---|---|
| Kubeflow 설치 가이드 (0) | 2025.09.03 |