MLOps 프로젝트/[애저듣보잡] MLOps 101

[애저듣보잡] ML 생애주기 1- 데이터준비

youjin86 2021. 9. 26. 15:53

[애저듣보잡] MLOps 101 | ep2. ML 생애주기 1 - 데이터 준비

https://youtu.be/zyGYnYZaUEk

 

데이터 준비

1. 문제/데이터 정의, 가설 수립

 

2. 데이터 이동/연계

(1) 데이터 수집

(2) 데이터 연계

(3) 데이터셋 공유 및 재사용

Azure ML플랫폼을 사용할 경우 공유 및 재사용에 유리

- 데이터 버전 관리가 가능

- 데이터셋의 여러 메타정보 관리 가능

- 관련 정보들 추가 가능

- 데이터 시각화를 통해 간단하고 신속하게 데이터 확인 가능

 

3. 데이터 탐색/가공

(1) 데이터셋 및 주피터 노트북에서 탐색

Azure ML플랫폼을 통해 데이터 상태를 보며 부족한 부분 확인

 

(2) 데이터 레이블링

목표값을 제공

 

(3) Feature Importance 탐색

Feature의 중요도나 연관성 체크