Introduction

빅데이터분석방법론 수업 프로젝트

Steam 게임 태그로 Clustering

BearHunter49/steam_gametag_kmeans

문제 접근


학기 중 수업, '빅데이터분석방법론' 수업 때 했던 프로젝트이다. 주제는 자율 주제라, 아무 주제나 선정해도 됐다(물론 AI쪽).

평소 Steam 게임을 하면서, 재밌게 플레이 했던 게임과 비슷한 게임을 찾는 과정이 별로였던 기억이 났다. 게임별로 테그도 주고, 비슷한 게임을 추천해 주기는 하는데 생각보다 비슷하다기 보단, 그냥 같은 범주에 들어가면 추천해 주는 것 같았다. 마침 평소 해보고 싶었던 프로젝트라 주제 선정에 큰 어려움은 없었다. 결국 프로젝트 주제는 'Steam Game Tag를 통한 Clustering'.

Clustering은 비지도 학습의 일종인데, 비슷한 데이터끼리 군집화(그룹화)를 이루는 학습 방법이다. 따라서 Steam 게임들의 태그를 수집하고 각 태그가 속성(Attribute)이 되도록 한 뒤, 군집화 알고리즘을 적용하면 되겠다 싶었다. 그리고 군집화 중 가장 유명한 K-means 알고리즘을 적용하였다.

과정


  1. 데이터 수집
  2. 데이터 전처리
  3. 군집화
  4. 시각화

시각화