어쩌다 보니 10명 안에 들어가서 경진대회에 참가하게 되었다. 1월 18일 선발 문자를 받고 부랴부랴 공부 시작.. 오프라인 강의 때 어려워서 포기했던 부분, 그냥 듣기 싫었던 부분들 다시 온라인 강의로 들으려니 죽을 맛 ㅋ쿠ㅜㅜ
암튼 분류, 예측 모형 둘 중에 분류모형만 주구장창 공부하다 경진대회 이틀 전, 교수님과 예상 문제로 예측모형을 공부해보니 '이게 더 괜찮네?' 생각이 들어서 이틀 동안 예측모형만 파기 시작!
시험은 9시까지 입실 후 10시에 시작되었다. 유형 두 개 중 하나를 골라서 풀어서 제출하면 되는데, 예측- 분류 중 분류 모형 문제는 읽지도 않고 예측 모형으로 올인했다. 문제는 '에너지 생산량 예측' 이었는데 건물의 태양광 에너지 생산량을 분석하여 어떤 기후 특성을 가진 지역에 자가발전 건물이 증설하는 것이 효율적인지 파악하고 태양광 에너지 생산량 예측을 하는 것이었다. 구해야 하는 것은 1~8월 에너지 생산량이 나와 있는데 그에 따라 9~12월 에너지 생산량 예측하기 !!
변수로는 건물 번호, 사용 용도, 건물면적, 준공연도, 기온, 구름 양, 이슬점 등등 ,,, 많았다.
처음에 전처리하는 과정에서 애를 많이 먹었다. 결측치를 처리하는데 준공연도와 층 수가 없는 데이터가 많아서 처음에는 다 뺐는데 데이터가 너무 없어섴ㅋㅋㅋ 그냥 다시 넣고 실행,,, 그냥 에너지 생산량과는 거리가 멀어보여 아무 값이나 넣어도 feature selection에서 걸러질 거 같아서 평균값으로 넣고 했다.
예측 모델은 총 6개 만들었는데 그중에 XGBoost 모델이 가장 좋아 XGBoost 모델로 R^2 높고 RMSE 제일 낮은 걸로 테스트 데이터를 예측했다.
솔직히 답을 못 구해서 제출조차 못 할 줄 알고 많이 쫄아있었는데 나름 답은 제출해서 만족 ㅎㅋㅋㅋㅋ
시험시간 3시간이 길 줄 알았는데 레포트도 쓰고, 모델 구성도 해보니 ㅜ 엄청나게 오래 걸리더라. 5분 남기고 겨우 제출
(중간중간 허전해서 사진 넣긴 했는데 자세한 건 시간 날 때 전처리과정, EDA, 모델 탐색, 모델 구축으로 나눠서 포스팅 할 예정!)
23.02.09 추가
아침 일찍 문자와서 눈 떴는데 최우수상 수상했다고 ㅜㅜㅜ 기분 최고
관련기사
'일상생활' 카테고리의 다른 글
롯데장학재단 취업준비생 5기 선발후기 (0) | 2023.05.08 |
---|---|
Leaders Club(리더스클럽) 20-1기 취업캠프 회고 (0) | 2023.03.30 |
2022학년도 Dong-ABO봉사단(1기) 표창창 수여 (0) | 2023.02.24 |
[JUMP-UP 전공 멘토링] 멘토- 최우수상(1등) 수상! (0) | 2023.01.19 |
CDS 빅데이터 전문가 과정 수료 (0) | 2023.01.18 |