쇼핑몰 리뷰 평점 분류 AI 해커톤

알고리즘 | NLP | 분류 | 리뷰 | Accuracy

  • moneyIcon Prize : 인증서, 장학금, 스타벅스 기프티콘 등
  • 621명 마감

 

[Baseline] 1. 자연어 처리 입문자를 위한 데이터 분석 & 예측

2022.07.07 16:13 2,694 Views language

이번 베이스라인 코드에서는 CountVectorizer를 이용한 word embedding과 LogisticRegression 모델을 이용한 분류 모델을 소개하겠습니다. 

Code
로그인이 필요합니다
0 / 1000
HYU_OSAC_LAB
2022.07.23 21:25

<4. train 셋 + val 셋 100% 활용하는 모델 만들기>

# 최종적으로 학습에 사용할 모든 리뷰를 설정해줍니다.
X = train_data.reviews ------> X = train.reviews

y = train_data.target ------> y = train.target

이렇게 해야 train 셋 + val 셋 100% 활용하는 모델이 되는 거 아닌가요?

DACONIO
2022.07.25 17:06

안녕하세요 Gratefulness님!

말씀하신대로 X = train.reviews,  y = train.target 으로 작성하시는게 
train 셋 + val 셋 100% 활용하는 모델이 되는 것이 맞습니다.
코드에 오류가 발생하여 죄송합니다.
수정하여 재 업로드 하였습니다.

감사합니다.

이전 글
Pytorch Lightning을 사용한 kogpt2 classification구현 score: 0.64
Competition - 쇼핑몰 리뷰 평점 분류 AI 해커톤
Likes 13
Views 1,784
Comments 0
2년 전
현재 글
[Baseline] 1. 자연어 처리 입문자를 위한 데이터 분석 & 예측
Competition - 쇼핑몰 리뷰 평점 분류 AI 해커톤
Likes 8
Views 2,694
Comments 2
2년 전
다음 글
다음 글이 존재하지 않습니다.