Skip to content

Analyzing and visualizing online grocery service data using Python.

Notifications You must be signed in to change notification settings

songjayhyun/instacart-EDA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 

Repository files navigation

instacart-EDA

0. 사용 기술

  • Python (pandas, numpy, matplotlib)
  • ChatGPT
  • Colab
  • Slack, Google Docs

1. 문제 정의

해결해야 하는 주요 문제는 매출 상승입니다. 이를 위해 다음 두 가지 분석을 진행하였습니다:

A) 이탈 고객 분석: 이탈 고객과 이탈하지 않은 고객의 특성을 분석하여 비교.

B) 재구매를 많이 하는 사용자의 특징 분석: 재구매를 많이 하는 사용자와, 그렇지 않은 사용자의 특성을 분석하여 비교.

2. 목표

고객 이탈률을 감소시키고 재구매를 유도하여, 매출을 증가시키기 위한 목표를 설정하였습니다.

3. 해결 방법

이탈 고객 가설 검증


  1. 이탈고객은 유통기한이 긴 제품의 구매가 많다.
    • 제품의 유통기한은 이탈 고객 수치에 영향을 주지 않는다
  2. 이탈고객이 발생한다면 첫 구매이후가 가장 많다.
    • 고객의 구매횟수와 고객의 이탈은 비례하지 않는다.
  3. 이탈 고객은 비이탈고객보다 새벽시간 구매비율이 높다.
    • 이탈 고객, 비 이탈 고객의 구매시간대는 큰 차이가 없다. 이탈 고객은 오후 시간대, 비 이탈 고객은 주로 오전 시간에 구매하는 경향이 있다.
  4. 장바구니의 사용률이 낮은 고객은 이탈고객이 될 확률이 높다.
    • 이탈 고객는 한번에 대량 구매를 하기 때문에 구매주기가 긴 것으로 확인. 원인을 배송비라고 여기고 그에 따른 마케팅 전략 수립
  5. 특정 aisle에서 이탈 고객이 많이 발생한다.
    • Baby, Bulk 등 특정 aisle에서 이탈 고객과 비 이탈 고객 간의 차이가 많이 났다. 가족 구성원의 수와 관련되었다고 생각하였으나, user data가 없는 관계로 더 이상의 분석은 불가능했다.

재주문


  1. milk와 egg, yogurt와 같은 카테고리가 재주문률이 높았다. 카테고리 특성을 이용한 정기배송 프로모션을 진행하면 매출 증가에 도움이 될 것으로 보인다.
  2. 하위 5%에게 마케팅을 한다고 가정한다면, morning segment에 해당하는 시간대에 진행하는 것이 유리할 것이다.
  3. 상위 5% 사용자를 대상으로 마케팅할때는 주말보다는 주중에 하는것이 매출상승에 도움이 된다.
  4. 하위 5%의 사용자들은 instacart를 사용하는 목적성이 “건강하고 신선한” 상품을 구매하기 보다는, “장보기”에 더 가깝다고 분석
  5. 오전 9시부터 오후 5시까지 주문량이 증가하므로 해당 시간대에 더 프로모션등을 진행하여 더 많은 주문을 유도할 수 있음

4 .핵심 성과

  1. 이탈 고객 분석:
    • 이탈 고객의 특성 파악.
    • 대량 구매 및 장바구니 사용률이 높은 고객을 대상으로 한 정책 제안.
  2. 재구매를 많이 하는 사용자의 특징 분석:
    • 특정 카테고리의 재주문률이 높은 패턴 도출.
    • 시간대 및 주간별 주문 패턴 파악.
    • 상위, 하위 5% 사용자에 대한 특성 파악 및 대응 전략 수립.

5. 맡은 역할 및 기여 부분

프로젝트에서 저는 데이터 결측치 제거, 추출, 분석 및 시각화를 담당했습니다. Python를 통해 고객 데이터를 추출하고, 세분화된 분석을 수행했습니다. 특히 대량 구매 및 장바구니 사용률이 높은 고객군에서의 특이한 패턴을 찾아내고, 이를 토대로 전략 수립에 기여했습니다.

보고서 및 결과물 설명 파일

📌 보고서

2차 프로젝트 보고서.pdf

About

Analyzing and visualizing online grocery service data using Python.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published