MLOps 프로젝트 71

1부 1.1 인공지능과 머신 러닝, 딥러닝

1부 딥러닝의 기초 1장 딥러닝이란 무엇인가? 1.1 인공 지능과 머신 러닝, 딥러닝 인공지능 보통의 사람이 수행하는 지능적인 작업을 자동화하기 위한 연구 활동 심볼릭 AI (전통적인 프로그래밍) 명시적인 규칙을 충분하게 많이 만들어 지식을 다루면 인간 수준의 인공 지능을 만들 수 있음. 머신 러닝을 하기 위해 필요한 3가지 입력 데이터 포인트 기대 출력 알고리즘의 성능을 측정하는 방법 머신 러닝 데이터와 결과를 입력하면 훈련을 하여 규칙을 찾아줌. 입력 데이터를 기반으로 기대 출력에 가깝게 만드는 유용한 표현을 학습(더 나은 표현을 찾는 자동화된 과정)하는 것 가능성 있는 공간을 사전에 정의하고 피드백 신호의 도움을 받아 입력 데이터에 대한 유용한 변환을 찾는 것 심볼릭AI(전통적인 프로그래밍)와 머신..

[K-ICT_머신러닝] 2강 1. 파이썬 Numpy 소개

🔸제목🔸 파면 팔수록 쉽고 재미있는 머신러닝 2강 1. 파이썬 Numpy 소개 🔸날짜🔸 2021.08.18(수) 🔸내용🔸 NumPy(넘피, Numerical Python) 입출력 자료구조로 사용 파이썬의 내장 타입인 리스트보다 데이터의 저장 및 처리에 있어 효율적인 NumPy배열을 제공 선형 대수와 관련된 기능을 제공 파이썬을 기반으로 한 데이터 과학 도구의 핵심 패키지 데이터 사이언스 영역의 대 부분의 도구(Pandas, Scipy 패키지, scikit-learn 패키지 등) NumPy 기반 Pandas(판다스) 입력 데이터를 만드는 과정과 데이터 시각화 과정에서 사용

[머신러닝 기초] 16일차 #1

🔸날짜🔸 2021.08.11(수) 🔸제목🔸 [35] 깜짝 퀴즈 정답 공개! 스팸메일 분류할 때/질병 유무 판단할 때 Precision or Recall?! 🔸내용🔸 Recall이 아닌 Precision이 높게 나오는 알고리즘을 선택해야 함. 이유 - 스팸 메일에 일반 메일이 들어가는 것이 더 안좋기 때문 Precision이 아닌 Recall이 높게 나오는 알고리즘을 선택해야 함. 이유 - 질병이 있는 사람을 없다고 잘못 판단하는 경우보단 질병이 없는 사람을 잘못 판단하는 게 더 낫기 때문에 만약 Accuracy가 100%인 모델은 Recall이나 Precision도 100%으로 나올 확률이 높음. 하지만 overfitting이 의심되니 데이터와 모델을 다시 한번 살펴봐야함!

[머신러닝 기초] 15일차 #3

🔸날짜🔸 2021.08.10(화) 🔸제목🔸 [34] 분류 모델 지표의 의미와 계산법 : True Positive, False Posivite, True Negative, False Negative 🔸내용🔸 metric 학습 완료된 모델의 성능이 얼마나 되는지 숫자로 표현 학습 모델에 따라 살펴봐야하는 지표도 달라짐. 분류의 metric 1) True Positive(TP) 모델이 예측한 게 True이면서 예측이 맞았을 때 2) False Positive(FP) 모델이 예측한 게 True이면서 예측이 틀렸을 때 3) False Negative(FN) 모델이 예측한 게 False이면서 예측이 틀렸을 때 4) True Negative(TN) 모델이 예측한 게 False이면서 예측이 맞았을 때 1) Accura..

[머신러닝 기초] 15일차 #2

🔸날짜🔸 2021.08.10(화) 🔸제목🔸 [33] Azure ML Studio(classic) 모델 정확도/성능 확인하기 :: Evaluate Model 🔸내용🔸 1. Initialize Model 2. Train Model 3. Score Model 우리가 갖고 있는 모델을 평가데이터를 이용해 결과 내는 것 4. Evaluate Model 우리가 만든 모델의 성능을 확인하며 전체 결과 분석 Two-Class Logistic Regression 알고리즘과 Two-Class Support Vector Machine 알고리즘 비교 Two-Class Logistic Regression 알고리즘 결과 - 약 76% 정확 Two-Class Support Vector Machine 알고리즘 결과 - 약 72% 정..

[머신러닝 기초] 14일차 #3

🔸날짜🔸 2021.08.09(월) 🔸제목🔸 [31] Azure ML Studio(classic) 학습된 모델 이해하기(중요!) :: Logistic Regression 🔸내용🔸 Weight가 크면 영향을 많이 끼치게 됨. [학습 결과] Label을 생존여부로 선정 (범위는 0~1로 0.5보다 적으면 False로 사망이라 판단) Feature가 숫자일 경우 나이가 클수록 생존확률이 낮아짐. 함께 탑승한 형제배우자 수가 많을수록 생존확률이 낮아짐. 함께 탑승한 형제배우자의 여부는 기본적으로 0.56의 값을 해줌.(한명도 없더라도 0.56.이 먹고 들어감.) Feature가 숫자가 아닐 경우 -> 선택지만큼 분류되어서 weight가 생성됨. 성별은 여성일수록 생존확률이 높아지고 남성일수록 낮아짐. 선실등급은 ..

[머신러닝 기초] 14일차 #2

🔸날짜🔸 2021.08.09(월) 🔸제목🔸 [30] Azure ML Studio(classic) 모델 학습 :: Logistic Regression 알고리즘 활용한 Initialize Model, Train Model 🔸내용🔸 1. Initialize Model 2. Train Model Two-Class Logistic Regression 모듈 Random number seed - 숫자마다 적용되는 램덤이 다르고, 해당 숫자를 입력하면 그 랜덤이 계속 유지가 됨. Allow unknown category - 원래 데이터가 아닌 다른 데이터를 입력했을 때 허용을 할 것인가 Train Mode 모듈 레이블을 학습에서 다시 한번 더 지정해 줘야 함.