머신러닝 기초 공부 32

[머신러닝 기초] 13일차 #1

🔸날짜🔸 2021.08.08(일) 🔸제목🔸 [26] Azure ML Studio(classic) 데이터 전처리2 : 빠진값 채워넣기, Clean Missing Data 모듈 🔸내용🔸 데이터 전처리 과정 1. Feature Selection 2. Feature Metadata Edit 3. Clean metadata 머신러닝 모델을 만들 때 어떤 알고리즘은 빠진 값이 있어도 알아서 진행하지만, 어떤 알고리즘은 아예 진행을 못함. 이에, 이 경우는 비운 값들을 채워야 함. 나이, 요금, 출항지에 빈 데이터가 존재 Clean Missing Data에서 동시 작업은 같은 타입끼리만 가능 (나이, 요금 - 숫자 / 출항지 - 문자) 나이와 요금의 빈 값을 평균값으로 채우기 출항지 빈 값을 최빈값으로 채우기 [속성..

[머신러닝 기초] 12일차 #3

🔸날짜🔸 2021.08.07(토) 🔸제목🔸 [25] Azure ML Studio(classic) Titanic 데이터 전처리1. Feature 선택, Edit Metadata 모듈 활용 🔸내용🔸 Titanicdata_csv의 내용 - 타이타닉 탑승객 생존 여부 예측 선실등급, 생존여부, 이름, 성별, 나이, 형제배우자, 부모자식, 티켓, 티켓 요금, 사물함 위치, 탑승 장소(출항지), 구조될 때 탑승한 보트, 신체, 도착 장소 데이터 전처리 1. Feature Selection 이름 - 생존여부와 관련도 없는데 이름이 다 다르기 때문에 서로 다른 값의 양이 많음. 머신러닝할 때 영향을 주는 feature로 역할을 제대로 수행하지 못하기 때문에 제거 티켓 - 이름과 동일하게 종속변수인 생존하는 데 큰 영향..

[머신러닝 기초] 12일차 #2

🔸날짜🔸 2021.08.07(토) 🔸제목🔸 [24] 환경의 날 특집 :: 멸종 위기의 동물을 구하기 위한 인공지능 프로젝트 Wild Me(feat. 고래상어와 만났던 추억의 사진) 🔸내용🔸 6월 5일 - 세계 환경의 날 1972년 6월 5일 스웨덴 스톡홀름에서 총 113개의 나라, 3개의 국제 기구, 257개 민간 단체에서 인류 최초의 세계적인 환경 회의를 함. 1974년 6월 5일부터 매년 세계 환경의 날을 지정, only, one earth 슬로건으로 세움. 세계 환경의 날은 매년마다 주제가 달라짐. 2018년 - 플라스틱없는 하루 2019년 - 푸른 하늘을 위한 오늘의 한 걸음 2020년 - 다양한 동물과 함께 살기 AI for Earth - WILDME "AI + Computer Vision + ..

[머신러닝 기초] 11일차 #3

🔸날짜🔸 2021.08.06(금) 🔸제목🔸 [22] Azure ML Studio(classic) 메뉴 및 실험 화면 소개 🔸내용🔸 [기본 메뉴] Experiments ML model 만드는 곳 My experiments - 내가 만드는 것들 Samples - 다른 사람들이 만든 것들 Projects 모델, 실험, 데이터 등 하나의 주제에 관한 리소스들을 담아놓는 곳 (폴더라 생각하면 됨.) Web services 만든 모델을 인터넷에 배포하는 곳 Datasets 데이터셋을 관리하는 곳 My datasets - 내가 올리는 데이터들 Samples - 다른 사람들이 썼던 공개된 데이터들 Trend models 학습을 완료한 모델들의 리스트를 확인할 수 있는 곳 Setting 기본적인 ML스튜디오의 설정을 확..

[머신러닝 기초] 11일차 #2

🔸날짜🔸 2021.08.06(금) 🔸제목🔸 [21] Azure Machine Learning Studio(classic) 소개 🔸내용🔸 Azure ML Studio(classic) https://studio.azureml.net/ (chrome 권장) Azure - 파란색, 하늘색을 의미로 마이크로소프트 사에서 제공하는 클라우드 서비스 이름 [특징] Visual Interface No Terminal / No Code -> Drag&Drop R, Python, SQL / Tensorflow, keras도 사용 가능

[머신러닝 기초] 10일차 #2

🔸날짜🔸 2021.08.05(목) 🔸제목🔸 [19] 빅 데이터의 뜻과 특징 - 3V와 6V of Big Data 🔸내용🔸 빅데이터 많은 양의 데이터를 수집하고 처리하고 거기서부터 가치를 뽑아내기 위한 모든 기술들의 모임 (데이터 저장 / 데이터 관리 / 데이터 추출 / 데이터 처리 / 데이터 시각화 / 데이터 분석) [빅데이터 역사] 1990~2000 - 컴퓨터 보급(엑셀, 관계형 데이터베이스) 2000~2010 - 인터넷 보급 웹 기반 데이터(야후, 아마존, 이베이) 2010~ - 모바일 센서 IoT 기기 발달(구글, 페이스북, 인스타그램) [특징 - 3Vs] Volume(양) 대량의 정형/비정형 데이터 Velocity(속도) 빠른 데이터 유입과 실시간 처리 속도 Variety(다양성) 다양한 비정형 ..

[머신러닝 기초] 10일차 #1

🔸날짜🔸 2021.08.05(목) 🔸제목🔸 [18] 데이터란 무엇이며, 왜 중요할까요? - 정의와 활용 🔸내용🔸 datum=자료(단수) data=자료들(복수) [DIKW Pyramid] Data -> Information -> Knowledge -> Wisdom 경험,사실(과거, 현재) 방향(미래) Data,Information Knowledge, Wisdom [예시] Data (160/100) +의미와 문맥 추가+ Information (혈압 수치) + 경험과 목적 추가 + Knowledge (혈압이 매우 높다) + 반영과 적용 + Wisdom (운동과 채식을 병행해야겠다!) Data (821023456789) +의미와 문맥 추가+ Information (친절한 AI 연락처) + 경험과 목적 추가 + ..

[머신러닝 기초] 9일차 #2

🔸날짜🔸 2021.08.04(수) 🔸제목🔸 [17강] 머신러닝의 작업 순서 - 문제정의, 데이터 준비 그리고.. 🔸내용🔸 머신러닝 작업 순서 1. 문제 정의 분류 / 회귀 / 예측 / 이상값 감지 / 그룹화 / 강화학습 2. 데이터 준비 데이터 수집 / 데이터 전처리 / 데이터 추가 3. 알고리즘 선택 4.모델 학습 학습용 데이터 + 알고리즘 = 모델 5. 모델 평가 언더피팅 / 오버피팅 / 모델 용량 / 평가 지표 6. 알고리즘 / 데이터 수정 7. 모델 활용 local / web / app