마케팅을 위한 통계분석을 본격적으로 한 번 알아보자! 마케팅은 단순히 상품과 서비스를 파는 행위일까? 이제는 옛말... 마케팅은 <고객의 니즈와 필요를 파악하고 그에 맞는 전략을 수립하는 과정!!>
그렇다면 내가 하고자 하는 '마케팅'은 과연 무엇인가?

마케팅의 목표는 이제 더이상 제품의 대량 판매가 아니다. 제품의 품질이나 브랜드 경쟁력만 가지고선 마케팅의 목적을 달성할 수 없다. 이제는 제품만 알던 때를 넘어서 고객의 데이터를 파악하고 니즈를 분석하는 능력이 필요하다.
직관과 경험에 의해 창조적인 마케팅 활동을 기획하는 것은 맞지만, 여기엔 과학적인 데이터 분석과 체계적인 절차가 기반이 되어야 한다. 시장 환경뿐만 아니라, 기업 경영을 둘러싼 다양한 요인들이 변화됨으로써 기업이 마케팅 직무영역에 요구하는 사항이 변화하고 있다.
따라서, 우리는 이 시대의 마케팅이 요구하는 변화의 움직임을 설명하고, 과학적 마케팅을 위해 필요한 통계기법들은 무엇인지 알아봄으로써 마케팅 통계분석의 필요성을 파악할 것이다!!
그렇다면 마케팅을 위한 통계분석 기법이 뭔데??
간단 목차
- 기초 통계분석 기법
- 인과관계 분석기법
- 기타
1. 기초 통계분석 기법
1) 기술통계량
평균, 분산, 표준편차, 빈도, 비율, 최빈값, 중위값 등의 기본적인 통계값.
다변량 통계분석을 활용하기 전에 분석 대상이 되는 변수들의 전반적인 현황을 검토하거나 외형적인 차이를 파악하기 위해 사용한다. 마케팅에서는 지역별, 매장별, 상품별 고객의 성별/나이 비율, 고객 방문빈도, 매출액 평균, 객단가의 계산 등을 계산할 때 사용한다.
2) T-검정
특정 수치형 변수에 대해 두 집단 간의 차이를 통계적으로 검증할 때 사용. 단일표본 t-test, 독립표본 t-test, 쌍체표본 t-test가 있다.
Ex)
- 단일표본 t- test: 특정 브랜드의 구매 평균 연령이 32세라고 알려져 있을 때, 과연 그러한지 통계적으로 검증함.
- 독립표본 t-test: 완전히 독립적인 두 집단의 평균 차이가 통계적으로 유의한지 판단할 때 사용함. 가령, 멤버십 프로그램 가입 고객군과 비가입 고객군의 매출액이나 구매빈도와 같은 데이터의 차이를 통계적으로 검증하고자 할 때 활용한다.
- 쌍체표본 t-test: 동일하지만, 특정 사건이나 실험에 의해 두 개의 다른 시점으로 분류될 수 있는 그룹들 간의 평균 차이가 통계적으로 유의한지 판단할 때 사용한다. 현 멤버십 프로그램 사입 고객들을 멤버십 가입 이전과 가입 이후로 구분하고, 매출액이나 구매 빈도의 차이를 검증하는 것은 매우 의미있는 통계적 분석이다.
3) 상관관계분석
두 개 이상 변수들 간의 상관관계가 존재하는지를 통계적으로 검증할 때 사용하는 기법.
상관관계 분석은 변수의 형태가 수치 척도인지, 서열 또는 명목 척도인지에 따라 사용하는 상관관계 분석 기법이 달라지나 해석은 모두 동일하다. 마케팅에서는 방문빈도와 구매금액의 상관관계, 성별과 상품 카테고리의 상관관계, 고객등급과 마케팅반응도의 상관관계 등의 주제에 활용이 가능하다.
고객등급과 마케팅 반응도의 상관관계가 높다면, 둘은 비슷한 의미를 담고 있다고도 볼 수 있다. 개별 변수뿐만 아니라, 여러 변수들로 구성된 변수 그룹들 간의 연관성 파악에도 적용할 수 있는데, 이를 정준상관분석이라고 한다.
Ex)
- 서비스 만족도와 가격 만족도로 구성된 고객만족 변수그룹(A)과 구매금액과 구매빈도로 구성된 고객행태 변수그룹(B)의 연관성을 분석하고자 할 때, 정준상관분석을 사용한다.
4) 범주형 데이터 분석
명목척도로 구성된 변수들 간의 연관이 있는지 혹은 독립인지를 판단하는 통계적 검정방법.
카이제곱(Chi-Square)검정이라고도 부름. CRM이나 마케팅에서 특히 활용도가 높은데, 행과 열로 구분되는 분할표 상의 각 셀에 나타나는 빈도의 차이를 바탕으로 행과 열의 분류 변수들 간의 연관성을 통계적으로 규명한다.
Ex)
- 행: 매장지역, 열: 상품유형 --> 각 상품에 대한 구매빈도를 교차표로 만들면 매장지역과 상품유형이 서로 연관되어 있는지 객관적으로 판단 가능하다.
5) 신뢰성 분석
신뢰성이란 일관성과 같은 의미. 특정 변수의 측정값들이 일관된 수준으로 나타나는지 판단하는 분석기법.
고객survey 데이터에 대한 다변량 통계분석을 하기 위한 사전분석 단계에서 많이 사용된다.
Ex)
- 고객들이 인지하는 구매 가치 수준: 품질수준/가격수준/편의성 수준의 측정 변수들에 의해 평균된 점수라고 한다면 구매가치 점수를 나타내기 위해선 하위 세 가지 변수들의 측정값이 어느 정도 일관된 수준으로 측정되어야 한다는 전제를 내포!
2. 인과관계 분석기법
최소 2개 이상의 변수들을 원인(Cause)과 결과(Effect) 변수로 구분해 변수들 간의 인과관계를 파악하고 검증하기 위한 분석기법. 인과관계 분석 기법은 대개 다변량 통계분석 기법에 속하며, 실무나 학술영역에서 많은 활용도를 보인다.
1) 분산 분석
3개 이상의 집단에 대한 평균값의 차이를 검점하는 통계분석기법(ANOVA).
집단 간의 차이를 규명하는데도 쓰이지만, 그룹 또는 집단을 분류하는 변수를 독립변수로, 비교 대상이 되는 측정변수를 종속변수로 생각하면, 분류변수에 의한 측정변수의 인과관계를 검증하는 것도 가능하다.
Ex)
- 매장 별 구매빈도/구매액의 차이, 주요 고객세그먼트 별 교차구매 지수의 차이 등.
2) 회귀 분석
하나 이상의 수치형 변수들을 독립변수로, 또 다른 결과적인 수치형 변수를 종속변수로 설정. 개별 독립변수들의 값이 주어졌을 때, 종속변수 값을 예측하거나, 독립변수와 종속변수 간의 인과관계를 검증할 수 있는 기법. 다변량 회귀분석 등에서 많이 사용된다.
Ex)
- 기업의 CRM or 마케팅활동이 고객로열티에 어떤 영향을 미치는지.
- 고객이 인지하는 상품가치, 브랜드가치, 관계가치가 고객만족과 고객로열티에 어떻게 영향을 미치는지.
- 고객과의 커뮤니케이션 횟수가 실제 매출에 어떤 영향을 미치는지 등.
3) 요인분석
하위 구성요소를 갖는 상위 변수들을 요인(factor)이라고 했을 때, 요인과 하위 구성 변수들 간의 구조가 적절한지 판단하는 다변량 통계분석 기법.
개별 하위 측정변수들이 상위 요인으로 적절히 묶일 수 있느냐를 판단한다. 요인구조의 적합성을 파악하기 위해 신뢰성 분석기법과 회귀분석의 개념을 동시에 사용한다. 수많은 데이터 항목들을 소수의 요인으로 요약 또는 축약하기 위한 목적으로 활용된다. 가령, 마케팅 실무에서는 요인분석을 통해 고객들의 구매액, 구매빈도, 구매 최근성, 거래 기간, 교차구매 지수 등의 데이터를 요약하고, 거래우량도와 같은 축약된 정보를 추출할 수도 있다. 그리고 해당 항목들을 몇 가지 대표적인 요인으로 추출하여 요인 간의 인과관계 검증에 활용한다.
4) 판별분석
독립변수와 종속변수 간의 인과관계를 파악하는 것은 맞지만, 종속변수가 수치형이 아닌 이분형 또는 다분형 분류변수이기 때문에 수치값을 예측하기 보다 특정 그룹으로 분류되는 결과를 예측한다.
Ex)
- 고객의 나이, 구매빈도, 구매품목 수 -> 구매액 예측. (회귀 분석)
- 고객의 나이, 구매빈도, 구매품목 수 -> 고객의 이탈여부, 우량고객여부. (판별분석)
- 기타...
통계분석을 활용한 문제해결 과정은??
1 . 문제 파악 및 가설 수립
당면한 과제를 정확하게 파악하고, 이를 검정 가능한 가설의 형태로 구성해야 한다. 보통 귀무가설과 연구가설로 구분하는데, 분석결과를 통해 주장하고자 하는 내용을 연구가설로 설정한다.
어느 기업에서 지역에 따라 마케팅 예산 할당을 차별화해야 하는지의 여부를 객관적으로 판단하고자 할 때, 지역에 따라 매출액의 차이를 검정함으로써 마케팅 예산 차별화의 타당성을 부여할 수 있다. 따라서 다음과 같은 귀무가설과 연구가설을 설정한다.
Ex)
- H0(귀무가설) = 기업의 매출액은 지역에 상관없이 모두 같을 것이다.
- H1(연구가설) = 기업의 매출액은 지역에 따라 달라질 것이다.
+ 가설을 수립한 후, 해당 가설을 검정하기 위한 최적의 통계분석 기법이 무엇인지도 함께 고려해야 한다. 위 예시의 경우, 명목척도인 지역구분 코드에 따라 비율척도인 매출액의 수준이 동질적인지를 검정하는 것. 따라서 분산분석이 가장 적합한 통계이다.
2. 유의수준 및 임계치 설정
가설을 설정한 후, 해당 마케팅 가설을 채택 혹은 기각하기 위한 일종의 기준값을 설정한다. 이러한 기준 값을 통계학에서는 '임계치'라고 하며 통계분석 기법과 유의수준에 따라 그 값이 달라진다.
만약 분산 분석을 선택했다면, F 통계량의 임계치를 설정해야 한다. 또한, 분석자가 연구결과의 신뢰수준을 99%로 높게 설정했다면, F 분포표에서 유의수준1%와 분석 표본의 자유도에 따라 임계치를 설정할 수 있다.

Ex)
- F 통계량의 임계치가 1.94로 설정되었다면, 분석결과 F 통계량 값이 1.94 이상일 경우 귀무가설을 기각하고(연구가설 채택), 1.94 미만일 경우 귀무가설을 채택한다( = 연구가설 기각).
3. 분석 및 검정 통계량 산출
가설을 수립하고, 해당 가설을 검정하기 위한 기준값, 즉 임계치가 설정되었다면 통계분석을 수행해 검정통계량을 산출한다.
4. 결과 해석 및 가설 검증
산출 후에는 분석결과를 해석하고, 가설에 대해 최종 판단을 내린다.
+ 마케팅과 추가 기획 과정의 도입!
'데이터 분석(DA) > 📊 통계분석' 카테고리의 다른 글
범주형 데이터의 분석 (0) | 2024.01.12 |
---|---|
상관관계 분석 (0) | 2024.01.06 |
T-검정 (0) | 2024.01.02 |
기술통계분석 (0) | 2023.12.31 |
Step by Step [파이썬 비즈니스 통계분석] (1) | 2023.12.26 |