분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Deep Gaussian Process 코드 공유
Deep Gaussian Process (DGP)로 Regression 하는 코드를 공유합니다.
Gaussian Process 라면 Machine Learning을 공부하면 조금 익숙하실 수 있습니다.
DGP는, Gaussian Process를 Layer로 생각하며 쌓아나가 model화 하고 이용하는 framework입니다. 한 10년 된 framework예요.
요새는 public 코드가 잘 되어있어서 Gpytorch 라는 package를 설치하여 어느 정도 구현가능합니다. 이름에서 보다시피 pytorch 기반입니다.
저 같은 경우 데이터를 Google Drive(GDrive)에 넣어놓고 colab에서 mount하여 사용하고 있어서,
코드 첫줄에 Gdrive mount 하는 부분과 gpytorch 하는 셀이 있습니다. 참고 바랍니다.
경험상 같은 feature로 lgbm 만큼의 성능이 나오는 것 같긴합니다.
원리적으로 uncertainty를 modeling 하는 것이므로 추가적으로 아주 다양한 분석을 할 수 있습니다만,
이 코드에서는 그냥 일단 평균값으로 prediction 하는 것만 올렸습니다.
한 일단 이 코드로도 13m 후반대는 나오는 것 같네요.
모델도 모델이지만, feature가 중요한 것 같아요.
축구 전략에 이런저런 feature가 중요하겠다 싶은것들을 이것저것 생각해 내 봤지만,
그리고 그것들로 조금씩 성능이 오르는 것을 확인해봤지만, 뭔가 번뜩이는 기발한 것이 더 떠오르질 않네요.
성능 향상을 위해 다른 분들은 어떤 feature들을 쓰셨는지, 어떤 다양한 방법들을 활용하고 계신지 궁금합니다.
( ¯꒳¯ )b 넵 감사합니다
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드 공유 감사합니다