MLOps 프로젝트 71

[머신러닝 기초] 10일차 #2

🔸날짜🔸 2021.08.05(목) 🔸제목🔸 [19] 빅 데이터의 뜻과 특징 - 3V와 6V of Big Data 🔸내용🔸 빅데이터 많은 양의 데이터를 수집하고 처리하고 거기서부터 가치를 뽑아내기 위한 모든 기술들의 모임 (데이터 저장 / 데이터 관리 / 데이터 추출 / 데이터 처리 / 데이터 시각화 / 데이터 분석) [빅데이터 역사] 1990~2000 - 컴퓨터 보급(엑셀, 관계형 데이터베이스) 2000~2010 - 인터넷 보급 웹 기반 데이터(야후, 아마존, 이베이) 2010~ - 모바일 센서 IoT 기기 발달(구글, 페이스북, 인스타그램) [특징 - 3Vs] Volume(양) 대량의 정형/비정형 데이터 Velocity(속도) 빠른 데이터 유입과 실시간 처리 속도 Variety(다양성) 다양한 비정형 ..

[머신러닝 기초] 10일차 #1

🔸날짜🔸 2021.08.05(목) 🔸제목🔸 [18] 데이터란 무엇이며, 왜 중요할까요? - 정의와 활용 🔸내용🔸 datum=자료(단수) data=자료들(복수) [DIKW Pyramid] Data -> Information -> Knowledge -> Wisdom 경험,사실(과거, 현재) 방향(미래) Data,Information Knowledge, Wisdom [예시] Data (160/100) +의미와 문맥 추가+ Information (혈압 수치) + 경험과 목적 추가 + Knowledge (혈압이 매우 높다) + 반영과 적용 + Wisdom (운동과 채식을 병행해야겠다!) Data (821023456789) +의미와 문맥 추가+ Information (친절한 AI 연락처) + 경험과 목적 추가 + ..

[머신러닝 기초] 9일차 #2

🔸날짜🔸 2021.08.04(수) 🔸제목🔸 [17강] 머신러닝의 작업 순서 - 문제정의, 데이터 준비 그리고.. 🔸내용🔸 머신러닝 작업 순서 1. 문제 정의 분류 / 회귀 / 예측 / 이상값 감지 / 그룹화 / 강화학습 2. 데이터 준비 데이터 수집 / 데이터 전처리 / 데이터 추가 3. 알고리즘 선택 4.모델 학습 학습용 데이터 + 알고리즘 = 모델 5. 모델 평가 언더피팅 / 오버피팅 / 모델 용량 / 평가 지표 6. 알고리즘 / 데이터 수정 7. 모델 활용 local / web / app

[머신러닝 기초] 8일차 #2

🔸날짜🔸 2021.08.03(화) 🔸제목🔸 [15] 오버피팅, 언더피팅 무엇일까요? - 오버피팅을 피하려면 뭔지 알아야겠죠 :) 🔸내용🔸 Overfitting(과적합, 과대적합) 훈련 데이터에 맞추기 위해 과하게 학습을 하게 되면 모델이 복잡해지고 꼬이게 됨. Underfitting 갖고 있는 데이터에 대해 모델이 학습해야 할 것들이 많이 남아 있음. "다양한 훈련 데이터를 수집해 실전에 대비해야 함."

[머신러닝 기초] 8일차 #1

🔸날짜🔸 2021.08.03(화) 🔸제목🔸 [14] 머신러닝, 데이터 준비 방법 - 데이터 제공 사이트, 전처리 방법 🔸내용🔸 데이터 준비 방법 1. 문제 정의 어떤 문제를 해결하고 싶은가? 2. 데이터 수집 필요한 데이터 모으기 공개 데이터 활용 [국내] - AI 팩토리 : http://aifactory.space - 공공데이터포털 : https://www.data.go.kr/datasetsearch - AI허브 : http://www.aihub.or.kr - 데이콘 : https://dacon.io - 보건의료빅데이터개방시스템 : https://opendata.hira.or.kr [국외] - kaggle : https://www.kaggle.com/datasets - google : https://t..

[머신러닝 기초] 7일차 #2

🔸날짜🔸 2021.08.02(월) 🔸제목🔸 [13] 머신러닝에서 '러닝'의 의미 - Feature, label, weight, bias 🔸내용🔸 Feature은 Label에 영향을 주지만, Label은 Feature에 영향을 주지 않음. w와 b를 머신러닝 모델이 구해주는 과정을 Learning이라고 함. 머신러닝이란? Feature(특징)와 Label(결과)을 통해 Learning(학습)을 통해 Weight(가중치)와 Bias(바이어스)를 구하는 것

[머신러닝 기초] 7일차 #1

🔸날짜🔸 2021.08.02(월) 🔸제목🔸 [12] 머신러닝 vs 딥러닝 비교 - 전통적인 머신러닝과 딥러닝 차이점 4가지 🔸내용🔸 머신러닝, 딥러닝 이 두개를 비교하는 건 이상함. (포함관계로 머신러닝에 딥러닝이 포함되어 있기 때문에) 이에, 전통적인 머신러닝과 딥러닝을 비교하는 게 올바른 표현 전통적인 머신러닝 VS 딥러닝 1. 데이터와 성능 데이터 양이 많아질수록 성능 차이가 두드러짐. 데이터 양이 많을 때 성능 : 딥-러닝 > 전통적인 머신러닝 2. 하드웨어 딥러닝을 하기 위해 고사양의 하드웨어 필요 3. 학습 시간 딥러닝(몇 일~몇 주) > 전통적인 머신러닝(몇 초~몇 시간) 4. 특징 특징에 따른 결과 값이 달라짐. (특징(변수,feature) -> 결과(label)) 필요한 특징들만 사용할 ..

[머신러닝 기초] 6일차 #2

🔸날짜🔸 2021.08.01(일) 🔸제목🔸 [11] 근데, 딥러닝은 뭔가요? - 딥러닝의 개념, 인공신경망 🔸내용🔸 인공지능 : 기계를 인간과 비슷하게 만드는 기술 인공 신경(Artificial Neural Network - ANN) : 뉴런(뇌의 신경세포)를 본따 비슷한 알고리즘을 만듦. 예시) 딥러닝 인공 신경망을 활용해 층을 깊게 쌓아가며 학습을 하는 것 [활용] 이미지, 자연어 처리, 가격 예측, 신약 개발, 질병 진단, 음성 인식, 로봇 자율주행 등 [종류] MLP, CNN, RNN Artificial Neural Network (인공 신경) ⬇ Deep Neural network (여러 인공 신경이 모인 것) ⬇ Deep Learning (이것들이 모인 집합)

[머신러닝 기초] 06일차 #1

🔸날짜🔸 2021.08.01(일) 🔸제목🔸 [10] 머신러닝의 방법, 어떻게 공부하지? - 수많은 머신러닝 방법 공부법 🔸내용🔸 머신러닝 종류(What) : 머신러닝으로 풀 수 있는 문제 종류 머신러닝 방법(How) : 머신러닝을 구현하기 위한 알고리즘 첫 번째 종류. Supervised Learning(지도학습) - 분류, 회귀, 에측 [방법] SVM, Logistic Regression, Liner Regression, Decision Tree, Random Forest, KNN 두 번째 종류. Unsupervised Learning(비 지도학습) - 이상값 감지, 그룹화 [방법] K-means, PCA, Apriori 세 번째 종류. Reinforcement Learning(강화학습) - 강화학습 ..