Tech. Forum 개발자들을 위한 정보 공유의 장입니다
닫기

Tech.Forum

문제, 정답 데이터에서 영화 중복 문의

#1

안녕하세요. Deeppangyo팀의 이태호 입니다.

문제 데이터는 전체 영화 시청 이력 중 20%의 사용자에서, 사용자 당 초기 10 건의 영화 시청 이력입니다.
정답 데이터는 사용자 당 초기 10건 이후 실제 영화 시청 목록인데,
submission으로 제출할 50개의 유저별 영화 순위 리스트가 문제 데이터의 시청한 영화와 중복되나요?
또 정답 데이터의 영화 리스트에서 순서가 중요한가요?

0 Likes

#2

안녕하세요.
T&B code challenge 운영팀입니다.

첫번째 질문 관련,
문제 데이터와 정답 데이터는 말씀하신 대로 20%의 사용자 데이터로
답안 구성을 위해 전체 데이터 구분을 %로 나누었을 뿐이므로
분석을 위해 제공된 80%의 사용자 데이터들로부터 유추하실 수 있으실 것이라 생각됩니다.

두번째 질문 관련,
정답데이터의 영화리스트 순서 자체보다 제출하시는 추천영화리스트에서 정답데이터의 영화들이 앞 부분에 나타나게 하는 것이 중요합니다.

감사합니다.

0 Likes

#3

학습 데이터와 테스트 데이터는 확인해봤었습니다… 이전 질문글의 답변을 보고 했갈렸던것은 정답 데이터에는 유저별 영화가 중복되지 않는다는 답변 이었습니다. 하지만 학습데이터나 테스트 데이터는 영화가 중복되어 있습니다. 정답 데이터만 unique movie_id를 갖는 것 인가요?

0 Likes

#4

다른팀입니다만, 저희도 비슷한 질문이 있습니다.

라벨데이터를 구성하실때 처리 방법에 대한 설명이 없어서 다들 혼란스러워 하는것 같습니다.

만약 한 사용자의 11~15번 째 시청한 영화가 [A, B, C, B, A] 일 경우
정답지가 [A, B, C] 인지 [A, B, C, B, A] 인지 궁금합니다.

1 Like

#5

안녕하세요.
T&B code challenge 운영팀입니다.
추가 문의에 대한 답변드립니다.

smartdolphin님 >
정답데이터내에서의 영화 ID는 중복되지 않습니다.
이전 답변 드린 것과 동일합니다.

dhznsdl@naver.com님 >
[A, B, C]로 구성되어 있다고 보시면 됩니다.

감사합니다.
좋은 결과 있으시길 바랍니다.

0 Likes