[애저듣보잡] MLOps 101 | ep2. ML 생애주기 1 - 데이터 준비
데이터 준비
1. 문제/데이터 정의, 가설 수립
2. 데이터 이동/연계
(1) 데이터 수집
(2) 데이터 연계
(3) 데이터셋 공유 및 재사용
Azure ML플랫폼을 사용할 경우 공유 및 재사용에 유리
- 데이터 버전 관리가 가능
- 데이터셋의 여러 메타정보 관리 가능
- 관련 정보들 추가 가능
- 데이터 시각화를 통해 간단하고 신속하게 데이터 확인 가능
3. 데이터 탐색/가공
(1) 데이터셋 및 주피터 노트북에서 탐색
Azure ML플랫폼을 통해 데이터 상태를 보며 부족한 부분 확인
(2) 데이터 레이블링
목표값을 제공
(3) Feature Importance 탐색
Feature의 중요도나 연관성 체크
'MLOps 프로젝트 > [애저듣보잡] MLOps 101' 카테고리의 다른 글
[애저듣보잡] ML 생애주기 4 - 배포/서빙과 Data Drift (0) | 2021.09.26 |
---|---|
[애저듣보잡] ML 생애주기 3 - 모델 해석 (0) | 2021.09.26 |
[애저듣보잡] ML 생애주기 2 - 실험 학습 (0) | 2021.09.26 |
[애저 듣보잡] MLOps와 DevOps의 차이 (0) | 2021.09.26 |
[애저듣보잡] MLOps 개념 공부 계획 (0) | 2021.09.26 |