분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
기본 EDA로부터 모델 만들기 (점수 : 0.71470)
기본적으로 제공되는 EDA 코드를 보면서 개인적으로 떠올린 생각들과 이로부터 모델을 만드는 과정입니다.
많이 부족하지만 생각을 나눠보고 싶어서 올리게 되었습니다.
잘못 생각한 부분들을 알려주시면 감사하겠습니다!
불쾌지수는 다른 대회에서 나왔던 아이디어인데, 특징 추출하는 과정을 다른 분들과 같이 생각해 보고 싶어서 한번 사용해 보았습니다! 좋게 봐주셔서 감사합니다!
그런데, 조금 의아한 부분은 제가 상관관계를 돌려보니까... 왜 불쾌지수랑 대여량의 상관관계가 양으로 나오는 걸까요...???
+ 불쾌지수 공식이 (5/9)가 아니라 (9/5)를 곱하는 것으로 알고 있습니다..!
알려주셔서 감사합니다! 수정했습니다!
말씀하신 상관관계 부분은 저도 정확하게 파악을 못했습니다! 도움이 되어드리지 못해서 죄송합니다.
다만 개인적인 생각을 말씀 드린다면
불쾌지수는 68미만->쾌적, 68~75->보통으로 구분이 되는데, 불쾌지수의 최댓값은 76이 나타납니다.
이를 보았을 때, 4~6월 기간 동안은 거의 대부분 쾌적하거나 보통이기 때문에 오히려 온도가 포근해질수록(불쾌지수가 상승) 대여량이 상관하지 않았나 생각이 됩니다!
불쾌지수와 온도의 상관관계가 거의 비슷하게 나오는것으로 봤을 때, 불쾌지수가 예측 성능에 부정적인 영향을 줄수도 있다고 생각이 됩니다!
좋은 지적해 주셔서 다시 한번 생각해 볼 수 있었습니다. 감사합니다!
강수확률 시각화를 통해 구간별 특성에 대한 인사이트를 얻고 범주 처리하는 스킬 멋지네요! :)
인사이트를 얻는 과정은 베이스라인 EDA에서 모두 얻었습니다! 베이스라인 EDA를 보고 어떤 것들을 생각할 수 있을지 나눠보고 싶었는데, 도움이 되셨으면 좋겠습니다! 부족한 코드를 봐주셔서 감사드립니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
불쾌지수 아이디어가 굉장히 좋은 것 같네요. 실제로 타는 사람의 입장에서는 단순히 습하다를 논할게 아니라, '못탈거 같다' 라는 생각이 들 때 안 탈 것인데, 그 '못탈거 같다'라는 지표가 있었다는 것을 깨닫게 되네요. 공유 감사합니다:)