피트니스 센터의 고객 세분화 및 재등록 예측에 관한 연구
- Alternative Title
- 피트니스 센터 소규모 운동 회원 정보를 이용하여
- Abstract
- 본 연구는 피트니스 센터 소규모 운동 회원 정보를 이용하여 피트니스 센터의 고객 세분화 및 재등록 예측모델을 활용한 마케팅 방안을 제안하였다. 피트니스 산업은 다른 서비스 업종과 마찬가지로 고객과의 관계 형성이 중요하며, 고객의 특성을 반영한 고객 관계로 결국 재등록으로 이어져 수익성과 직결된다.
매번 설문 조사를 진행하여 재등록 여부를 예측하기에는 설문 응답의 한계가 있어, 평소 회원들의 센터 이용 데이터를 분석하는 체계적인 데이터 마케팅 전략이 현실적인 대안이 된다. 마케팅 분야에서 각광을 받는 마테크(Martech)를 활용하는 시도가 필요하다. 마테크(Martech)는 마케팅(Marketing)과 기술(Technology)의 합성어로 실시간으로 수집된 고객의 로그에서 특정 패턴 행동을 감지하고, 디지털 환경에서 잠재 고객의 니즈를 찾아 행동 패턴을 분석하고 타겟 마케팅 캠페인을 설계할 수 있다.
연구의 목적은 센터 내부의 고객 데이터를 수집 및 가공하여 센터 회원이 이탈되지 않고 재등록할 수 있는 프로모션, 이벤트 등 올바른 마케팅 의사결정을 할 수 있는 실무적인 측면에서 도움을 줄 수 있는 시사점을 제시하였다.
A 피트니스 프랜차이즈 N 지점을 조사 기간 (2020년 2월 ~ 2022년 1월/24개월)에 걸쳐 소규모 운동(GX)에 참여한 재등록과 이탈이 확인된 회원 1,160명의 이력 513,530건에 대해 데이터를 취합하였다.
피트니스 분야 선행 문헌 연구를 통해 총 7개 변수로 출석, 노쇼, 취소, 선호 강사, 선호 수업, 선호 시간, 선호 요일을 선정하였다. 범주형 변수인 선호 강사, 선호 수업, 선호 시간, 선호 요일에 대해 Frequency encoding을 통해 수치형 변수로 변환하였다. 왜도/첨도 및 KS(Kolmogorov-Smirnov) 검정을 통해 정규분포가 아닌 것으로 확인되어 비모수 통계를 이용해서 분석하였다. 비모수 검정을 진행하여 해당 변수가 재등록 여부에 의미가 있는지 확인하였다.
피처(Feature)는 데이터의 값을 잘 예측하기 위한 데이터의 특징으로, 정규분포를 하지 않아 최소-최대 스케일링을 진행하여 min_max값을 기반으로 후속 작업을 실시하였다.
군집 분석(Clustering)은 데이터 안에 존재하는 의미 있는 그룹을 찾아내는 작업으로, 팔꿈치 방법과 실루엣 계수를 비교하여 K=3일 때 실루엣 계수가 가장 크기에 3개의 군집으로 나누었다.
3개 이상의 집단에 대해 차이가 있는 지 없는 지를 알 수 있는 비모수적 분석방법으로 Kruskal-Wallis H 검정 결과 모두 유의확률이 0.000으로 귀무가설을 모두 기각하였다. 군집별 세부 분석을 할 때, 군집 1, 군집 3의 경우 취소 min_max는 유의확률이 0.05보다 작아 통계적으로 유의하여 취소 min_max 변수를 적용하며, 군집 2는 취소 min_max가 유의확률이 0.650으로 통계적으로 유의하지 않아 취소 min_max 변수를 제외하고 진행하였다.
군집 1은 총 7개 변수에 대해 노쇼 min_max는 다른 군집에 비해 높은 값, 취소 min_max는 군집2와 군집3의 중간값이 나타났다. 종합적으로 변수 속성을 비교하면 총 3개 군집 중에서 가장 취약한 회원 군집이라 볼 수 있어 군집 1은 “취약 회원군”으로 이름 지었다. 군집 2는 총 7개 변수에 대해 속성값 H값(평균 순위)이 중간 위치로 총 3개 군집 중에서 중간 회원 군집이라 할 수 있다. 따라서 군집2는 “중간 회원군”으로 이름 지었다. 변수 군집 3은 노쇼 min_max를 제외하고 다른 군집에 비해 높은 값이 나타났다. 종합적으로 변수 속성을 비교하면 총 3개 군집 중에서 가장 우수한 회원 군집이라 볼 수 있어 군집 3은 “우수 회원군”으로 이름 지었다.
의사결정나무(DT), 랜덤 포레스트(RF), 극한 경사도 부스팅 (XGB)에 대해 공통적으로 학습용 데이터(Training data) 70%, 평가용 데이터(Test data) 30%로 분리하였다. 일반적으로 사용하는 K값을 5로 지정한 교차검증(Cross Validation)을 통해 데이터를 여러 번 반복해서 나누어 여러 모델을 학습하여 예측 성능을 평가하였다.
재등록 예측 성능을 평가하고자 총 6가지 지표인 정확도, 정밀도, 재현도, 특이도, F1 스코어, AUC를 이용하였다. 단일 모형, 군집 1(취약 회원군), 군집 2(중간 회원군), 군집 3(우수 회원군) 모두 DT < RF < XGB 순으로 성능이 우수한 것으로 확인되었다. XGB는 Boosting 앙상블 모델로 한 개의 예측 모델에 대해 error를 줄이는 방식이며, Bagging 앙상블 모델인 RF와 차이가 있다. 군집 1(취약 회원군) < 군집 2(중간 회원군) < 군집 3(우수 회원군) 순으로 예측 성능이 우수하였다.
재등록 여부를 알고 싶은 데이터의 경우 K-means 군집 분석을 통해 군집을 분류 후 해당 군집에서 최적 예측모델인 XGB 재등록 예측 확률을 확인하여 고객 관리에 활용할 수 있다.
군집별 타겟 마케팅 전략을 통해 이탈을 방지하고 재등록으로 연계하게 할 수 있다. 예약확인 안내 문자, 포인트 관리 등 각 군집의 변수 중요도를 고려하여 마케팅 방안을 실시할 수 있다.
학문적 시사점으로 첫째, 피트니스 분야 고객 세분화 재등록 예측에 있어 선행연구에 비해 고도화된 분석을 진행한 연구이다. 둘째, 비모수 통계기법을 이용하여 정규분포가 아닌 데이터에 대해 통계적으로 접근하였다. 셋째, 교차검증(Cross Validation)을 통해 특정 데이터셋의 과적합을 방지하고 일반화된 모델 생성이 가능하다. 넷째, 지도학습/비지도학습 간의 유기적인 연계를 손꼽을 수 있다. 끝으로, 다양한 인공지능 알고리즘을 적용하여 성능을 비교한 결과 XGB가 가장 우수하였으며, XGB의 변수 중요도 (Feature Importance)를 통해 재등록에 영향에 주는 피처의 상대적인 중요도를 정량적으로 검토하여 향후 지표 관리에 활용할 수 있다.
실무적 시사점으로 첫째, 평소 고객 DB를 이용하여 자료 접근성을 개선하였다. 둘째, 고객의 특성을 고려한 고객 세분화를 통해 목표 고객을 집중적으로 관리할 수 있다. 셋째, 마케팅 관점에서 이용할 수 있는 참고자료로서 재등록 예측 확률 추정 등 실질적인 고객 관리에 초점을 맞추었다. 끝으로, 소상공인진흥공단 등 정부 기관에서 각 업종에 맞는 재등록(재구매) 예측 알고리즘을 개발하여 보급한다면 지속가능한 성장의 기반이 조성될 수 있다.
연구의 한계 및 향후 연구방향으로는 A 피트니스 센터 N지점의 소규모 운동에 참여한 재등록과 이탈이 확인된 회원 1,160명의 이력 513,530건 데이터를 근거하였으나, 보다 나은 일반화를 위해 더 많은 데이터를 확보할 필요가 있다. 실증적 연구 결과의 일반화를 위해 다양한 피트니스 센터로 범위를 확대한다면 보다 가치 있는 연구가 될 것으로 기대된다.
【주요어】마테크, 비모수 검정, 고객 세분화, 재등록 예측, 타겟 마케팅
- Author(s)
- 김영진
- Issued Date
- 2024
- Awarded Date
- 2024-02
- Type
- Thesis
- Keyword
- 마테크; 비모수 검정; 고객 세분화; 재등록 예측; 타겟 마케팅
- URI
- http://dspace.hansung.ac.kr/handle/2024.oak/9163
- Authorize & License
-
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.