본문 바로가기

LG Aimers

Module 8. B2B 고객데이터 기반 예측 단서 스코어링 모델

Part1.  B2B 고객 행동 예측 방법론

[고객 행동 예측 방법론 ]

  • Who? - targeting
    • 방법론 - Binary classification  
      - Logistic regression 
      - ANN (인공신경망)
      - Decision tree
      - K-nearest neighbor 
      - SVM
      - RFM (CRM - Consumer Relationship manager)
         Relationship - 구매이력
         Frequency - 빈도
         Monetary value - 한번에 얼마나 구매하는지 (B2B는 큰 편)
  • What? - product matching
    • 방법론 - Recommendations 
      - Content-based filtering
      - Collaborative filtering 
         (KNN과 비슷, 비슷한 사용자 탐색)
  • When? - right time
    • Purchase interval -고객마다 개인화된 주기
  • How much? - expected revenue
    • Demand forecasting

 

[B2B]

  • B2B Buyer - companies 
    • age : 26-40, 41-55
    • Go to the suppier's website 60% 
    • Attend a webinar 55% (온라인 환경)
    • 자체적으로 조사 과정 거침
    • large scale sales 
    • look for efficiency
    • specific necessities 
    • long relationships

 

[Data Analytics]

  • Descriptive Analytics 
    가장 기본적, 과거~현재 데이터
  • Predictive Analytics
    과거~현재 데이터로 미래 scoring
  • Prescriptive Analytics
    optimization and simulation tools to recommend actions
  • 데이터 소스 측면에서의 세 가지 발전 단계
    •  Business Intelligence & Analytics 1.0 - 기본
    •  Business Intelligence & Analytics 2.0 - 웹 데이터 (웹 로그 데이터, 리뷰, 소셜미디어)
    •  Business Intelligence & Analytics 3.0 - IoT 데이터 
  • 딥러닝 기반 인공지능 기술은 영상 및 음성 정보를 손쉽게 처리, 더 풍부한 데이터를 기반으로 분석을 할 수 있음

  • 사례 ) 재무 & 비재무 데이터 기반 사업자 폐업 예측 사례 
    • 동일한 데이터를 사용하면서 알고리즘 별로 성과 차이 비교
    • 재무 + 비재무 데이터 추가해 동일 알고리즘에 의한 성과 개선 
  • Macro vs Micro
    • 고객이 이탈할지 아닌지 - Macro
    • 1번 고객이 이탈할지 아닌지 - Micro

Part2.  고객에게 최적의 상품을 제시하는 추천 알고리즘

[추천 시스템 ]

  • 임의의 고객을 선택했을 때 추천 시스템이란 그 고객의 Utility Function을 통해 효용 값을 극대화할 수 있는 Product를 전체 Product 중에 찾아서 그것을 전달 (Utility Maximization)하는 것
  • 회사의 제품 중 어떤 상품일 때 고객의 Utility를 Maximize하는 지 Return
  • 방법론
    • Content-based Recommendations (연관 상품 추천)
      : target의 지속적인 수요 상품(content) 정보를 통해 비슷한 상품의 정도 score
      • content에 대한 정보를 구축하는 데 딥러닝 사용 
      • 아직 추천 자체에서 딥러닝을 쓰기 보다는 meta 정보를 풍부하게 하는 데에 쓰임 
      • ex) 교보문고 도서 추천 
    • Collaborative Recommendations (유사 사용자 탐색) 
      : 비슷한 선호를 가진 사람들 찾아 scroring 
      • 비슷한 선호 Top K 명 -> 다양성 제공
      • ex) 유튜브 - 내가 본 영상을 본 사람들이 본 영상 추천
    • Hybrid Approaches 
      : 두가지 혼용, 가장 대표적 

Part3.  로지스틱 회귀분석과 인공신경망 (ANN)

[로지스틱 회귀분석]

  • 독립변수가 비선형적으로 영향 미칠 때 사용
  • 수식적 이해

  • 분류 정확도 측정 - confusion matrix

-> weight를 다르게 두어 평가할수도 있음 (고객예측 - FN cost 크게, Promotion - FP cost 크게)

 

[Universal Approximation Theorem]

: 특정 함수가 주어졌을 때 Data를 통해 기계가 학습해서 Hidden layer로 그 함수와 비슷하게 작동하는 인공신경망을 근사할 수 있다는 이론

 

 

[Logistic Regression vs ANN]

  • 일반적으로 ANN의 성능이 더 높은 것으로 알려져 있으나, 데이터가 적은 상황에서는 로지스틱 회귀분석이 유리할 수도
  • 두 가지 이상의 방법론을 적용하여 결과를 비교하는 것을 권장
  • ANN - multy classification도 가능, 복잡한 모델, 비용↑ 
  • Logistic - Binary classification, 빠른 training

강의 내용 정리 : LG Aimers AI Essential Course - Module8 by KAIST 박성혁 교수님

 

 

'LG Aimers' 카테고리의 다른 글

Module 7. B2B 마케팅  (0) 2024.01.21
Module6. 딥러닝 (2)  (0) 2024.01.20
Module6. 딥러닝 (1)  (0) 2024.01.20
Module4. 지도학습(분류/회귀)  (0) 2024.01.16
Module2. Mathematics for ML  (1) 2024.01.11