가정 데이터
feature - 일별
최저기온 최고기온 평균기온 일강수량 최고풍속 평균풍속 최소상대습도 평균상대습도 일조량 평균지면온도 최저초상온도 연속누적강수량
label - 일별
모기 개체 수
- 서울시가 제공하는 모기 개체수가 2020년 이전(1000)과 이후(100)의 측정단위가 달라 이후의 단위인 100으로 통합
- 5월~10월까지의 데이터는 제외 - 측정을 안하고 기온에 따른 예측값만 설정하기 때문
- 20년도부터 수변부, 주거지, 공원로 따로 데이터를 제공하지만, 20년도 이전에는 통합이었기에 거기에 맞춰 20년도 이후도 통합데이터로만 사용
- 기존 날씨 데이터에 연속누적강수량도 같이 상관분석을 함. - 비가 연속으로 오면 모기알이 떠내려가 영향을 줄 거 같다고 가정했기 때문
Pandas를 통한 상관분석 코드 및 결과
최고풍속을 제외한 나머지는 다 상관관계가 있었음.
확정 데이터
feature - 일별
최저기온 최고기온 평균기온 일강수량 최고풍속 평균풍속 최소상대습도 평균상대습도 일조량 평균지면온도 최저초상온도 연속누적강수량
label - 일별
모기 개체 수
이제 이 데이터들을 가지고 최적의 모델을 찾아야 함!
[참고 자료]
1. 서울시 모기예보 - 여기에 있는 데이터들로 수집
https://news.seoul.go.kr/welfare/mosquito
2. 공공데이터에서 제공하는 모기예보 - 정확하진 않아 Q&A들만 참고
https://data.seoul.go.kr/dataList/OA-13285/S/1/datasetView.do
3. 모기 밀도와 기후 요인 연관성 논문 - 기존의 연구자료로 상관관계가 있음을 확신할 수 있게 되었고, 우리의 상관분석을 다시 돌려봄.
- 모기 밀도는 최저초상온도(지표에 접해있는 풀 위 온도)와 가장 높은 상관 관계
- 이후 최저기온, 평균기온, 지면온도, 최대기온, 최소상대습도, 강수량, 상대습도, 최대순간풍속, 평균 풍속
- 음의 상관관계는 일교차와 일조시간
- 최대풍속과는 유미의한 관계 X
'MLOps 프로젝트 > 프로젝트 진행 상황' 카테고리의 다른 글
모기예보 1차 모델 생성 (0) | 2021.10.14 |
---|---|
모기예보 내용 정리 (0) | 2021.10.14 |
주제 선정 (0) | 2021.10.14 |