쇼핑몰 리뷰 평점 분류 AI 해커톤

알고리즘 | NLP | 분류 | 리뷰 | Accuracy

Prize : 인증서, 장학금, 스타벅스 기프티콘 등
621명 마감

Practice

Overview Data Code (share) Talk Leaderboard

Submission

[Baseline] 1. 자연어 처리 입문자를 위한 데이터 분석 & 예측

DACONIO

2022.07.07 16:13 2,694 Views language

이번 베이스라인 코드에서는 CountVectorizer를 이용한 word embedding과 LogisticRegression 모델을 이용한 분류 모델을 소개하겠습니다.

Code

Comments 2개

로그인이 필요합니다

comment

0 / 1000

HYU_OSAC_LAB

2022.07.23 21:25

<4. train 셋 + val 셋 100% 활용하는 모델 만들기>

# 최종적으로 학습에 사용할 모든 리뷰를 설정해줍니다.
X = train_data.reviews ------> X = train.reviews

y = train_data.target ------> y = train.target

이렇게 해야 train 셋 + val 셋 100% 활용하는 모델이 되는 거 아닌가요?

DACONIO

2022.07.25 17:06

안녕하세요 Gratefulness님!

말씀하신대로 X = train.reviews, y = train.target 으로 작성하시는게
train 셋 + val 셋 100% 활용하는 모델이 되는 것이 맞습니다.
코드에 오류가 발생하여 죄송합니다.
수정하여 재 업로드 하였습니다.

감사합니다.

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동하였습니다!

List

Pytorch Lightning을 사용한 kogpt2 classification구현 score: 0.64

Competition - 쇼핑몰 리뷰 평점 분류 AI 해커톤

현재 글

[Baseline] 1. 자연어 처리 입문자를 위한 데이터 분석 & 예측

Competition - 쇼핑몰 리뷰 평점 분류 AI 해커톤

Likes 8

Comments 2

2년 전

다음 글이 존재하지 않습니다.