월간 데이콘 신용카드 사용자 연체 예측 AI 경진대회

알고리즘 | 정형 | 분류 | 금융 | LogLoss

  • moneyIcon 상금 : 100만원
  • 3,624명 마감

 

[주의] 기존 베이스라인 코드 수정 및 data leakage 규칙 설명

2021.04.20 15:27 4,768 조회

안녕하세요. 데이콘입니다.


신용카드 사용자 연체 예측 AI 경진대회는

신용카드 사용자 데이터를 보고 사용자의 대금 연체 정도를 예측하는 알고리즘을 개발하는 경진대회입니다.


참가자분들은 train 데이터로 모델을 학습시킨 뒤, test 데이터의 반응 변수를 예측하는 알고리즘을 만들어 결과물을 제출해주시면 되며,

이 과정에서 test 셋은 "아예 모른다고 가정"하고 학습을 진행해주셔야 합니다.

모델 학습에서 검증 혹은 평가 데이터셋을 활용할 시 해당 참가자는 실격처리됩니다.



다만, 저희 데이콘 측에서는 이러한 저희의 규칙에도 불구하고

기존 베이스라인 코드에서 전처리 하는 과정 중 test set을 fit하는 실수를 범했기에 이를 알려드리며,

많은 참가자 분들께 혼란을 드린 점에 사과의 말씀을 전합니다.



아울러, 베이스라인 코드를 수정했음을 공지드리며

참가자 분들께서도 대회 참여하면서 놓칠 수 있는 data leakage 규칙을 다시 한 번 상기하시길 바랍니다!.



신용카드 사용자 연체 예측 AI 경진대회를 참가해주시는 많은 분들께

다시 한 번 혼란을 드려 죄송하다는 사과의 말씀을 전합니다.


감사합니다.

데이콘 드림



[기존 베이스라인의 규칙 위반 사례 예시]


설명: test data를 전처리 과정에서 fit_transform 시킴




[수정 예시]


로그인이 필요합니다
0 / 1000
논논노눈누난나
2021.04.21 19:12

아이구...

성민석
2021.05.02 15:17

아고