따릉이 대여량 예측 AI 해커톤

알고리즘 | 정형 | 회귀 | 행태심리 | NMAE

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 691명 마감

 

기본 EDA로부터 모델 만들기 (점수 : 0.71470)

2021.11.01 14:47 3,405 Views language

기본적으로 제공되는 EDA 코드를 보면서 개인적으로 떠올린 생각들과 이로부터 모델을 만드는 과정입니다.

많이 부족하지만 생각을 나눠보고 싶어서 올리게 되었습니다.

잘못 생각한 부분들을 알려주시면 감사하겠습니다!

Code
로그인이 필요합니다
0 / 1000
다람이도토리
2021.11.04 08:53

불쾌지수 아이디어가 굉장히 좋은 것 같네요. 실제로 타는 사람의 입장에서는 단순히 습하다를 논할게 아니라, '못탈거 같다' 라는 생각이 들 때 안 탈 것인데, 그 '못탈거 같다'라는 지표가 있었다는 것을 깨닫게 되네요. 공유 감사합니다:)

대동
2021.11.09 21:33

불쾌지수는 다른 대회에서 나왔던 아이디어인데, 특징 추출하는 과정을 다른 분들과 같이 생각해 보고 싶어서 한번 사용해 보았습니다! 좋게 봐주셔서 감사합니다!

다람이도토리
2021.11.10 09:01

그런데, 조금 의아한 부분은 제가 상관관계를 돌려보니까... 왜 불쾌지수랑 대여량의 상관관계가 양으로 나오는 걸까요...??? 
+ 불쾌지수 공식이 (5/9)가 아니라 (9/5)를 곱하는 것으로 알고 있습니다..!

대동
2021.11.10 21:29

알려주셔서 감사합니다! 수정했습니다!
말씀하신 상관관계 부분은 저도 정확하게 파악을 못했습니다! 도움이 되어드리지 못해서 죄송합니다.

다만 개인적인 생각을 말씀 드린다면
불쾌지수는 68미만->쾌적, 68~75->보통으로 구분이 되는데, 불쾌지수의 최댓값은 76이 나타납니다.
이를 보았을 때, 4~6월 기간 동안은 거의 대부분 쾌적하거나 보통이기 때문에 오히려 온도가 포근해질수록(불쾌지수가 상승) 대여량이 상관하지 않았나 생각이 됩니다!

불쾌지수와 온도의 상관관계가 거의 비슷하게 나오는것으로 봤을 때, 불쾌지수가 예측 성능에 부정적인 영향을 줄수도 있다고 생각이 됩니다!

좋은 지적해 주셔서 다시 한번 생각해 볼 수 있었습니다. 감사합니다!

정팔팔
2021.11.06 16:27

강수확률 시각화를 통해 구간별 특성에 대한 인사이트를 얻고 범주 처리하는 스킬 멋지네요! :)

대동
2021.11.09 21:36

인사이트를 얻는 과정은 베이스라인 EDA에서 모두 얻었습니다! 베이스라인 EDA를 보고 어떤 것들을 생각할 수 있을지 나눠보고 싶었는데, 도움이 되셨으면 좋겠습니다! 부족한 코드를 봐주셔서 감사드립니다!