MLOps 프로젝트/프로젝트 진행 상황

모기예보와 날씨 상관 분석

youjin86 2021. 10. 14. 22:39

가정 데이터

feature - 일별

최저기온 최고기온 평균기온 일강수량 최고풍속 평균풍속 최소상대습도 평균상대습도 일조량 평균지면온도 최저초상온도 연속누적강수량

 

label - 일별

모기 개체 수

  • 서울시가 제공하는 모기 개체수가 2020년 이전(1000)과 이후(100)의 측정단위가 달라 이후의 단위인 100으로 통합
  • 5월~10월까지의 데이터는 제외 - 측정을 안하고 기온에 따른 예측값만 설정하기 때문
  • 20년도부터 수변부, 주거지, 공원로 따로 데이터를 제공하지만, 20년도 이전에는 통합이었기에 거기에 맞춰 20년도 이후도 통합데이터로만 사용
  • 기존 날씨 데이터에 연속누적강수량도 같이 상관분석을 함. - 비가 연속으로 오면 모기알이 떠내려가 영향을 줄 거 같다고 가정했기 때문

 

Pandas를 통한 상관분석 코드 및 결과

https://github.com/urtbest86/MLOps/blob/master/%EB%8D%B0%EC%9D%B4%ED%84%B0%ED%86%B5%ED%95%A9%EB%B0%8F%EC%A0%84%EC%B2%98%EB%A6%AC.ipynb

 

GitHub - urtbest86/MLOps

Contribute to urtbest86/MLOps development by creating an account on GitHub.

github.com

 

최고풍속을 제외한 나머지는 다 상관관계가 있었음.

 

확정 데이터

feature - 일별

최저기온 최고기온 평균기온 일강수량 최고풍속 평균풍속 최소상대습도 평균상대습도 일조량 평균지면온도 최저초상온도 연속누적강수량

 

label - 일별

모기 개체 수

 

이제 이 데이터들을 가지고 최적의 모델을 찾아야 함!


[참고 자료]

1. 서울시 모기예보 - 여기에 있는 데이터들로 수집

https://news.seoul.go.kr/welfare/mosquito

 

모기예보

모기예보

news.seoul.go.kr

 

2. 공공데이터에서 제공하는 모기예보 - 정확하진 않아 Q&A들만 참고

https://data.seoul.go.kr/dataList/OA-13285/S/1/datasetView.do

 

열린데이터광장 메인

데이터분류,데이터검색,데이터활용

data.seoul.go.kr

 

3. 모기 밀도와 기후 요인 연관성 논문 - 기존의 연구자료로 상관관계가 있음을 확신할 수 있게 되었고, 우리의 상관분석을 다시 돌려봄.

http://www.riss.kr/search/detail/DetailView.do?p_mat_type=be54d9b8bc7cdb09&control_no=c3a3273d67112aa4ffe0bdc3ef48d419&outLink=K

  • 모기 밀도는 최저초상온도(지표에 접해있는 풀 위 온도)와 가장 높은 상관 관계
  • 이후 최저기온, 평균기온, 지면온도, 최대기온, 최소상대습도, 강수량, 상대습도, 최대순간풍속, 평균 풍속
  • 음의 상관관계는 일교차와 일조시간
  • 최대풍속과는 유미의한 관계 X

'MLOps 프로젝트 > 프로젝트 진행 상황' 카테고리의 다른 글

모기예보 1차 모델 생성  (0) 2021.10.14
모기예보 내용 정리  (0) 2021.10.14
주제 선정  (0) 2021.10.14