MLOps 프로젝트/머신러닝 기초 공부

[머신러닝 기초] 10일차 #2

youjin86 2021. 8. 5. 19:29

🔸날짜🔸

2021.08.05(목)

 

🔸제목🔸

[19] 빅 데이터의 뜻과 특징 - 3V와 6V of Big Data

 

🔸내용🔸

빅데이터
많은 양의 데이터를 수집하고 처리하고 거기서부터 가치를 뽑아내기 위한 모든 기술들의 모임
(데이터 저장 / 데이터 관리 / 데이터 추출 / 데이터 처리 / 데이터 시각화 / 데이터 분석)

[빅데이터 역사]
1990~2000 - 컴퓨터 보급(엑셀, 관계형 데이터베이스)
2000~2010 - 인터넷 보급 웹 기반 데이터(야후, 아마존, 이베이)
2010~ - 모바일 센서 IoT 기기 발달(구글, 페이스북, 인스타그램)

[특징 - 3Vs]

Volume(양)
대량의 정형/비정형 데이터

Velocity(속도)
빠른 데이터 유입과 실시간 처리 속도

Variety(다양성)
다양한 비정형 데이터

[특징 - +3Vs]

Value(가치)
데이터 속 가치

Veracity(정확성)
데이터의 품질

Variability(가변성)
문맥에 따른 데이터 의미 가변성

 

[정형/비정형 데이터]
정형 데이터(Structured Data)
데이터의 형태가 이미 다 정해져있는 데이터
(Data Model - Schema, SQL)

비정형 데이터(Unstructured Data)
정형 데이터가 아닌 그 외의 모든 것
(Everything else - Texual or non-textual, No pre-defined data model, Difficult to search)