<aside> 🤔

가장 먼저 해야할 일은 프로젝트 목적에 맞는 데이터셋을 설정하는 것이다.

</aside>

데이터셋: Fashionpedia


Fashionpedia

iMaterialist (Fashion) 2020 at FGVC7

• 출처: https://www.kaggle.com/c/imaterialist-fashion-2020-fgvc7

• 출처: https://www.kaggle.com/c/imaterialist-fashion-2020-fgvc7

장점 1: production level image

장점 2: 다수의 데이터 포인트

<aside> 💬

이번 실습을 진행할 추천 서비스의 DB에는 각 아이템별로 이미지 및 텍스트를 같이 저장한다. 그리고 해당 텍스트에는 옷의 전반적인 특징뿐만 아니라 소매나 주머니와 같은 디테일한 특징도 같이 들어간다.

그러면 파인튜닝된(세부적인) 검색이 가능해지고 사용자의 니즈에 맞는 정확한 아이템들을 검색 할 수 있다.

따라서 이러한 구체적인 특징들을 같이 담기 위해서는 구축하려는 데이터셋에 데이터 포인트가 충분한가를 고려하는 것이 매우 중요하다.