쇼핑몰 리뷰 평점 분류 AI 해커톤

알고리즘 | NLP | 분류 | 리뷰 | Accuracy

  • moneyIcon Prize : 인증서, 장학금, 스타벅스 기프티콘 등
  • 621명 마감

 

Private 3rd | 0.71128 | 5-Model | Hard-Voting

2022.08.08 05:12 1,270 Views language

안녕하세요! Private 3등 코드 공유합니다.

Pororo를 활용하여 BackTranslation(영어, 일본어)를 진행하여 데이터셋의 사이즈를 3배로 만들었습니다.

[klue/bert-base | klue/roberta-large | kykim/bert-kor-base | kykim/electra-kor-base | kykim_funnel-kor-base]
BackTranslation데이터셋을 활용하여 5개의 모델에 대해 학습을 진행하였습니다.

하이퍼파라미터 튜닝의 경우, 학습셋 비율을 (0.9/0.1)로 진행하고, 최종 제출에서 (0.999/0.001)로 변경하였습니다. 
이외에 batch_size=200, epoch=5, lr=2e-5로 고정하고, 2에폭의 결과 CSV를 총 5개 하드보팅하여 제출하였습니다.

Code