통계적 사고의 필요성
비즈니스 가치 창출
RFM 분석
세분화 기준
실무 적용 예시
# RFM 점수 계산
customer_data$recency_score <- ifelse(customer_data$days_since_last_purchase <= 30, 5,
ifelse(customer_data$days_since_last_purchase <= 90, 4,
ifelse(customer_data$days_since_last_purchase <= 180, 3,
ifelse(customer_data$days_since_last_purchase <= 365, 2, 1))))
customer_data$frequency_score <- ifelse(customer_data$purchase_count >= 10, 5,
ifelse(customer_data$purchase_count >= 5, 4,
ifelse(customer_data$purchase_count >= 3, 3,
ifelse(customer_data$purchase_count >= 2, 2, 1))))
customer_data$monetary_score <- ifelse(customer_data$total_amount >= 1000000, 5,
ifelse(customer_data$total_amount >= 500000, 4,
ifelse(customer_data$total_amount >= 200000, 3,
ifelse(customer_data$total_amount >= 100000, 2, 1))))
# RFM 점수 합계
customer_data$rfm_score <- customer_data$recency_score +
customer_data$frequency_score +
customer_data$monetary_score
CLV 계산 방법
CLV 공식
CLV = (평균 구매 금액 × 구매 빈도 × 고객 수명) - 고객 획득 비용
실무 적용
계절성 분석
추세 분석
실무 예시: 월별 매출 분석
# 시계열 데이터 생성 library(tseries) library(forecast) # 월별 매출 데이터 monthly_sales <- ts(sales_data$amount, frequency = 12, start = c(2020, 1)) # 계절성 분해 decomposed_sales <- decompose(monthly_sales) # 시각화 plot(decomposed_sales) # ARIMA 모델로 예측 arima_model <- auto.arima(monthly_sales) forecast_result <- forecast(arima_model, h = 12) plot(forecast_result)
이동평균법
회귀분석 기반 예측
가설 설정
표본 크기 결정
랜덤화
전환율 비교
# 전환율 계산 conversion_rate_A <- sum(group_A$converted) / nrow(group_A) conversion_rate_B <- sum(group_B$converted) / nrow(group_B) # 비율 차이 검정 prop_test_result <- prop.test( x = c(sum(group_A$converted), sum(group_B$converted)), n = c(nrow(group_A), nrow(group_B)), alternative = "two.sided" ) print(prop_test_result)
통계적 유의성 판단
관리도 (Control Charts)
관리 한계선
# X-bar 차트 관리 한계선 UCL = X̄ + A₂ × R̄ CL = X̄ LCL = X̄ - A₂ × R̄ # R 차트 관리 한계선 UCL = D₄ × R̄ CL = R̄ LCL = D₃ × R̄
실무 적용
DMAIC 프로세스
시그마 레벨
ROI (Return on Investment)
ROI = (투자 수익 - 투자 비용) / 투자 비용 × 100%
ROAS (Return on Ad Spend)
ROAS = 광고로 인한 매출 / 광고 비용
고객 획득 비용 (CAC)
CAC = 마케팅 비용 / 신규 고객 수
VaR (Value at Risk)
시나리오 분석
채널별 성과 측정
어트리뷰션 모델
전환 퍼널 분석
실무 예시: 이메일 캠페인 분석
# 이메일 캠페인 성과 분석
email_campaign <- data.frame(
sent = 10000,
opened = 2500,
clicked = 500,
converted = 50
)
# 주요 지표 계산
open_rate <- email_campaign$opened / email_campaign$sent * 100
click_rate <- email_campaign$clicked / email_campaign$opened * 100
conversion_rate <- email_campaign$converted / email_campaign$clicked * 100
cat("오픈율:", round(open_rate, 2), "%\n")
cat("클릭율:", round(click_rate, 2), "%\n")
cat("전환율:", round(conversion_rate, 2), "%\n")
문제 상황
분석 과정
# 1. 데이터 전처리
customer_data <- read.csv("customer_data.csv")
customer_data$purchase_date <- as.Date(customer_data$purchase_date)
# 2. RFM 분석
library(dplyr)
rfm_data <- customer_data %>%
group_by(customer_id) %>%
summarise(
recency = as.numeric(Sys.Date() - max(purchase_date)),
frequency = n(),
monetary = sum(purchase_amount)
)
# 3. 고객 세분화
rfm_data$segment <- case_when(
rfm_data$recency <= 30 & rfm_data$frequency >= 5 & rfm_data$monetary >= 500000 ~ "VIP",
rfm_data$recency <= 90 & rfm_data$frequency >= 3 & rfm_data$monetary >= 200000 ~ "충성",
rfm_data$recency <= 180 & rfm_data$frequency >= 1 & rfm_data$monetary >= 100000 ~ "일반",
TRUE ~ "이탈위험"
)
# 4. 세그먼트별 분석
segment_analysis <- rfm_data %>%
group_by(segment) %>%
summarise(
count = n(),
avg_recency = mean(recency),
avg_frequency = mean(frequency),
avg_monetary = mean(monetary)
)
결과 및 제언
문제 상황
분석 과정
# 1. 불량 데이터 수집
defect_data <- read.csv("defect_data.csv")
# 2. 불량 유형별 분석
defect_analysis <- defect_data %>%
group_by(defect_type) %>%
summarise(
count = n(),
percentage = n() / nrow(defect_data) * 100
) %>%
arrange(desc(count))
# 3. 파레토 차트
library(ggplot2)
ggplot(defect_analysis, aes(x = reorder(defect_type, -percentage), y = percentage)) +
geom_bar(stat = "identity", fill = "steelblue") +
geom_line(aes(y = cumsum(percentage)), color = "red", size = 1) +
labs(title = "불량 유형별 파레토 차트", x = "불량 유형", y = "비율 (%)") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
개선 결과
정확한 데이터 수집
실시간 모니터링
비즈니스 관점 해석
스토리텔링
도서
온라인 강의
💡 팁: 비즈니스 통계는 복잡한 수식보다는 실무 적용에 초점을 맞추세요. 작은 개선부터 시작해서 점진적으로 고도화된 분석을 도입하는 것이 성공의 비결입니다!