스마트 창고 출고 지연 예측 AI 경진대회

알고리즘 | 정형 | 회귀 | 스마트물류 | MAE

  • moneyIcon 데이스쿨 프로 구독권
  • 1,069명 마감

 

스마트 창고 출고 지연 예측 | Mega33 앙상블 + Sequential Oracle

2026.05.05 00:20 425 조회 language

OOF MAE 8.3825 / Public LB 9.7527 / Private 10.01261 / 17등

Mega33 앙상블
LGB(MAE·Huber)·XGB·CatBoost를 v23/v24/v26/domain_aug/offset/neural_army 6개 피처 버전 × 다중 시드로 총 33개 Base 모델 학습. GroupKFold(layout_id, n=5)로 unseen layout이 val fold에 자연 포함되도록 설계. OOF를 Level-2 Meta(LGB·XGB·CB)로 스태킹.

피처(v31, 335개)
lag·lead·rolling·SC 시나리오 집계·상호작용 조합.

FIXED base
Mega33 + Ranking 보정(rank_adj) + Pseudo-Labeling 3라운드를 고정 가중치로 블렌드.
FIXED = mega33×0.7637 + rank_adj×0.1589 + pseudo×0.0775

Sequential Oracle
FIXED OOF를 proxy lag으로 활용해 oracle_xgb·oracle_lv2·oracle_remaining 3종 재학습.
oracle_NEW = FIXED×0.64 + oracle_xgb×0.12 + oracle_lv2×0.16 + oracle_rem×0.08

250개 이상 실험에서 Gate 분기·Scipy 최적화·Temporal CV·unseen 보정 등 OOF 개선에도 LB 악화 일관 확인. GroupKFold(layout_id)가 결국 최선이었습니다. 

제 최대 병목은 unseen layout(test 절반) 분포 시프트였는데, 모든 실험에서 unseen 올리는 시도는 LB가 악화되었습니다. 
다른 분들은 어떻게 접근하셨는지 궁금합니다. 다들 고생하셨습니다!

github: https://github.com/tkddnjs-dlqslek/dacon-warehouse-delay-prediction.git

PDF
코드