Part1. B2B 고객 행동 예측 방법론
[고객 행동 예측 방법론 ]
- Who? - targeting
- 방법론 - Binary classification
- Logistic regression
- ANN (인공신경망)
- Decision tree
- K-nearest neighbor
- SVM
- RFM (CRM - Consumer Relationship manager)
Relationship - 구매이력
Frequency - 빈도
Monetary value - 한번에 얼마나 구매하는지 (B2B는 큰 편)
- 방법론 - Binary classification
- What? - product matching
- 방법론 - Recommendations
- Content-based filtering
- Collaborative filtering
(KNN과 비슷, 비슷한 사용자 탐색)
- 방법론 - Recommendations
- When? - right time
- Purchase interval -고객마다 개인화된 주기
- How much? - expected revenue
- Demand forecasting
[B2B]
- B2B Buyer - companies
- age : 26-40, 41-55
- Go to the suppier's website 60%
- Attend a webinar 55% (온라인 환경)
- 자체적으로 조사 과정 거침
- large scale sales
- look for efficiency
- specific necessities
- long relationships
[Data Analytics]
- Descriptive Analytics
가장 기본적, 과거~현재 데이터 - Predictive Analytics
과거~현재 데이터로 미래 scoring - Prescriptive Analytics
optimization and simulation tools to recommend actions - 데이터 소스 측면에서의 세 가지 발전 단계
- Business Intelligence & Analytics 1.0 - 기본
- Business Intelligence & Analytics 2.0 - 웹 데이터 (웹 로그 데이터, 리뷰, 소셜미디어)
- Business Intelligence & Analytics 3.0 - IoT 데이터
- 딥러닝 기반 인공지능 기술은 영상 및 음성 정보를 손쉽게 처리, 더 풍부한 데이터를 기반으로 분석을 할 수 있음

- 사례 ) 재무 & 비재무 데이터 기반 사업자 폐업 예측 사례
- 동일한 데이터를 사용하면서 알고리즘 별로 성과 차이 비교
- 재무 + 비재무 데이터 추가해 동일 알고리즘에 의한 성과 개선
- Macro vs Micro
- 고객이 이탈할지 아닌지 - Macro
- 1번 고객이 이탈할지 아닌지 - Micro
Part2. 고객에게 최적의 상품을 제시하는 추천 알고리즘
[추천 시스템 ]
- 임의의 고객을 선택했을 때 추천 시스템이란 그 고객의 Utility Function을 통해 효용 값을 극대화할 수 있는 Product를 전체 Product 중에 찾아서 그것을 전달 (Utility Maximization)하는 것
- 회사의 제품 중 어떤 상품일 때 고객의 Utility를 Maximize하는 지 Return
- 방법론
- Content-based Recommendations (연관 상품 추천)
: target의 지속적인 수요 상품(content) 정보를 통해 비슷한 상품의 정도 score- content에 대한 정보를 구축하는 데 딥러닝 사용
- 아직 추천 자체에서 딥러닝을 쓰기 보다는 meta 정보를 풍부하게 하는 데에 쓰임
- ex) 교보문고 도서 추천
- Collaborative Recommendations (유사 사용자 탐색)
: 비슷한 선호를 가진 사람들 찾아 scroring- 비슷한 선호 Top K 명 -> 다양성 제공
- ex) 유튜브 - 내가 본 영상을 본 사람들이 본 영상 추천
- Hybrid Approaches
: 두가지 혼용, 가장 대표적
- Content-based Recommendations (연관 상품 추천)
Part3. 로지스틱 회귀분석과 인공신경망 (ANN)
[로지스틱 회귀분석]

- 독립변수가 비선형적으로 영향 미칠 때 사용
- 수식적 이해

- 분류 정확도 측정 - confusion matrix

-> weight를 다르게 두어 평가할수도 있음 (고객예측 - FN cost 크게, Promotion - FP cost 크게)
[Universal Approximation Theorem]
: 특정 함수가 주어졌을 때 Data를 통해 기계가 학습해서 Hidden layer로 그 함수와 비슷하게 작동하는 인공신경망을 근사할 수 있다는 이론

[Logistic Regression vs ANN]

- 일반적으로 ANN의 성능이 더 높은 것으로 알려져 있으나, 데이터가 적은 상황에서는 로지스틱 회귀분석이 유리할 수도
- 두 가지 이상의 방법론을 적용하여 결과를 비교하는 것을 권장
- ANN - multy classification도 가능, 복잡한 모델, 비용↑
- Logistic - Binary classification, 빠른 training
강의 내용 정리 : LG Aimers AI Essential Course - Module8 by KAIST 박성혁 교수님
'LG Aimers' 카테고리의 다른 글
Module 7. B2B 마케팅 (0) | 2024.01.21 |
---|---|
Module6. 딥러닝 (2) (0) | 2024.01.20 |
Module6. 딥러닝 (1) (0) | 2024.01.20 |
Module4. 지도학습(분류/회귀) (0) | 2024.01.16 |
Module2. Mathematics for ML (1) | 2024.01.11 |