분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 4위, FLAML와 이상치 제거를 사용한 와인 품질 분류
public score가 낮아서 크게 기대하지 않았는데 private 등수가 높아서 너무 놀랐습니다.
저는 이번에 이상치가 품질 분류에 크게 영향을 줄 수 있다 판단하여 이상치 제거에 집중하였습니다.
모델 같은 경우는 AutoML인 FLAML을 사용하였습니다.
다들 대회 고생하셨습니다!
에러가 나는 부분은 model이 선택되었을 때 lgbm이나 xgboost가 아닐 경우 나타나는 에러입니다. eval_set=[(X_val, y_val)],eval_metric='mae', early_stopping_rounds=10 이 부분을 모두 주석처리하여 코드를 다시 돌려보시면 작동할 것입니다.
대회가 classification 모델이지만 저는 품질이라는 변수가 딱 떨어지지 않을 수 있을 것이라고 생각하였기에 regression으로 모델을 돌리게 되었습니다.
로그 확인해보니 정말 다른 모델이 선택되어있네요!
분류는 당연히 classification으로 사용해야 된다고 생각했는데 다시 한 번 생각해보게 됐어요. ㅎㅎ 답변 정말 감사드립니다 :D
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
공부가 많이 됐어요! 감사합니다~~
혹시 autoML settings에 metric, task 를 'accuracy', 'classification'이 아닌 'mae', 'regression'로 하신 이유가 있을까요?
그리고 코드를 그대로 따라해 봤는데요, 2번째 폴드부터
model.fit(X_train, y_train,
eval_set=[(X_val, y_val)],
eval_metric='mae',
early_stopping_rounds=10
)
이 부분에서 fit() got an unexpected keyword argument 'eval_set' 라는 에러가 나는데 AutoML API 보고 eval_set=[(X_val, y_val)] 를 X_val=X_val, y_val=y_val 로 변경해 봤는데도 에러가 납니다. 해결 방법 알 수 있을까요? 답변 부탁드려요 ㅠ.ㅠ