와인 품질 분류 AI 해커톤

알고리즘 | 정형 | 분류 | 품질 | Accuracy

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 581명 마감

 

Private 4위, FLAML와 이상치 제거를 사용한 와인 품질 분류

2021.12.11 00:29 1,860 Views language

public score가 낮아서 크게 기대하지 않았는데 private 등수가 높아서 너무 놀랐습니다.
저는 이번에 이상치가 품질 분류에 크게 영향을 줄 수 있다 판단하여 이상치 제거에 집중하였습니다.
모델 같은 경우는 AutoML인 FLAML을 사용하였습니다.
다들 대회 고생하셨습니다!

Code
로그인이 필요합니다
0 / 1000
joniekwon
2021.12.12 15:31

공부가 많이 됐어요! 감사합니다~~
혹시 autoML settings에  metric, task 를 'accuracy', 'classification'이 아닌 'mae', 'regression'로 하신 이유가 있을까요? 
그리고 코드를 그대로 따라해 봤는데요, 2번째 폴드부터  
model.fit(X_train, y_train, 
                    eval_set=[(X_val, y_val)],
                        eval_metric='mae', 
                    early_stopping_rounds=10
                    ) 
이 부분에서 fit() got an unexpected keyword argument 'eval_set' 라는 에러가 나는데 AutoML API 보고 eval_set=[(X_val, y_val)] 를 X_val=X_val, y_val=y_val 로 변경해 봤는데도 에러가 납니다. 해결 방법 알 수 있을까요? 답변 부탁드려요 ㅠ.ㅠ

datu
2021.12.12 15:43

에러가 나는 부분은 model이 선택되었을 때 lgbm이나 xgboost가 아닐 경우 나타나는 에러입니다. eval_set=[(X_val, y_val)],eval_metric='mae', early_stopping_rounds=10 이 부분을 모두 주석처리하여 코드를 다시 돌려보시면 작동할 것입니다.
대회가 classification 모델이지만 저는 품질이라는 변수가 딱 떨어지지 않을 수 있을 것이라고 생각하였기에 regression으로 모델을 돌리게 되었습니다.

joniekwon
2021.12.12 16:00

로그 확인해보니 정말 다른 모델이 선택되어있네요! 
분류는 당연히 classification으로 사용해야 된다고 생각했는데 다시 한 번 생각해보게 됐어요. ㅎㅎ 답변 정말 감사드립니다 :D