운수종사자 인지적 특성 데이터를 활용한 교통사고 위험 예측 AI 경진대회

알고리즘 | 코드 제출 평가 | 정형 | 회귀 | 데이터 분석 | AUC | Brier Score | ECE

  • moneyIcon 상금 : 6,000 만원
  • 955명 종료까지 D-26

설명

※ 2025.10.16 09:30 일부 데이터가 보완되어 재배포 되었습니다. 자세한 데이터 업데이트 사항은 [링크]에서 확인할 수 있습니다.


[배포용 데이터 구조]

open_v2.zip/

├── baseline_submit.zip

└── data/

   ├── sample_submission.csv

   ├── train.csv

   ├── test.csv

   ├── test/

├── A.csv

     └── B.csv

   └── train/

├── A.csv

     └── B.csv


[주요 구성]

  • baseline_submit.zip: 베이스라인 코드 기반 코드 제출 대회 제출 예시 파일 (제출 시 채점 대기를 제외하고 실 채점에 약 1분 소요)
  • data/sample_submission.csv: 모델 출력 결과 형식 예시 CSV (실제 생성 CSV 파일명은 반드시 submission.csv 이어야 합니다.)
  • Test_id : 검사 식별 ID
  • Label : 해당 검사 결과로부터 예측한 교통사고 위험군에 속할 확률 (0 ~ 1)
  • data/train.csv: 학습 샘플 목록이 포함된 CSV (944,767행)
  • Test_id : 검사 식별 ID
  • Test : 검사 종류 (A: 신규 자격 검사, B: 자격 유지 검사)
  • Label : 해당 검사 결과가 교통사고 위험군에 해당 하는 지의 여부 (0: 교통사고 위험군 X, 1: 교통사고 위험군 O)
  • data/test.csv: 테스트 샘플 목록이 포함된 CSV (배포용 데이터에는 참고용 테스트 더미 샘플로 구성되어 있으며 제출 시에는 실제 평가 데이터로 대체됩니다.)
  • Test_id : 검사 식별 ID
  • Test : 검사 종류 (A: 신규 자격 검사, B: 자격 유지 검사)
  • data/train/A.csv: 학습 샘플 중 신규 자격 검사 샘플 (647,241행)
  • Test_id : 검사 식별 ID
  • Test : 검사 종류 (A: 신규 자격 검사, B: 자격 유지 검사)
  • PrimaryKey : 운수종사자 식별 ID
  • Age : 검사 시점의 운수종사자 나이 (a : 0~4, b : 5~9, ex) 30a : 30~34, 30b : 35~59)
  • TestDate : 검사 시점 (년월: yyyymm)
  • data/train/B.csv: 학습 샘플 중 자격 유지 검사 샘플 (297,526행)
  • Test_id : 검사 식별 ID
  • Test : 검사 종류 (A: 신규 자격 검사, B: 자격 유지 검사)
  • PrimaryKey : 운수종사자 식별 ID
  • Age : 검사 시점의 운수종사자 나이 (a : 0~4, b : 5~9, ex) 30a : 30~34, 30b : 35~59)
  • TestDate : 검사 시점 (년월: yyyymm)
  • data/test/A.csv: 테스트 샘플 중 신규 자격 검사 샘플 (배포용 데이터에는 참고용 테스트 더미 파일로 구성되어 있으며 제출 시에는 실제 평가 데이터로 대체됩니다.)
  • data/test/B.csv: 테스트 샘플 중 자격 유지 검사 샘플 (배포용 데이터에는 참고용 테스트 더미 파일로 구성되어 있으며 제출 시에는 실제 평가 데이터로 대체됩니다.)


※ A검사(신규 자격 검사)의 세부 명세는 [링크]에서 확인하실 수 있습니다.

※ B검사(자격 유지 검사)의 세부 명세는 [링크]에서 확인하실 수 있습니다.

※ 실제 평가 데이터셋은 총 162,216개의 샘플로 구성되어 있습니다.

상세