🔸날짜🔸
2021.08.03(화)
🔸제목🔸
[14] 머신러닝, 데이터 준비 방법 - 데이터 제공 사이트, 전처리 방법
🔸내용🔸
데이터 준비 방법
1. 문제 정의
어떤 문제를 해결하고 싶은가?
2. 데이터 수집
필요한 데이터 모으기
- 공개 데이터 활용
[국내]
- AI 팩토리 : http://aifactory.space
- 공공데이터포털 : https://www.data.go.kr/datasetsearch
- AI허브 : http://www.aihub.or.kr
- 데이콘 : https://dacon.io
- 보건의료빅데이터개방시스템 : https://opendata.hira.or.kr
[국외]
- kaggle : https://www.kaggle.com/datasets
- google : https://toolbox.google.com/datasetsearch
- redit : https://www.reddit.com/r/datasets/
- UCI : https://archive.ics.uci.edu/ml/ - 자체 데이터 수집
- 데이터 저장소(.csv,.txt,.xlsx)
- 웹 수집(웹 크롤링, google Image search)
3. 데이터 전처리
데이터 손질하기
- 데이터 형식 맞추기
- 비어있는 값 채우기
4. 연관 데이터 추가
!!!데이터의 양보다 질이 중요!!!
'MLOps 프로젝트 > 머신러닝 기초 공부' 카테고리의 다른 글
[머신러닝 기초] 9일차 #1 (0) | 2021.08.05 |
---|---|
[머신러닝 기초] 8일차 #2 (0) | 2021.08.03 |
[머신러닝 기초] 7일차 #2 (0) | 2021.08.03 |
[머신러닝 기초] 7일차 #1 (0) | 2021.08.03 |
[머신러닝 기초] 6일차 #2 (0) | 2021.08.02 |