1. 확률변수란?
확률변수 (random variable)
: 표본공간에서 정의된 실함수
- 정의역이 표본공간 Ω이고 공역이 실수인 함수 -> 확률실험
- 불확실성을 가지는 사회적, 자연적 현상을 일종의 확률실험으로 이해
- 표본공간을 숫자로 표시하고 불확실한 현상을 수학적으로 모형화
-> 구체적으로 계량화된 분석을 할 수 있음 (불확실성을 제거하는 것이 아님) - 확률변수는 대문자 X,Y,Z 등으로 표시하며 확률변수의 값은 소문자 x, y, z 등으로 표시
이산확률변수
- 확률변수가 가질 수 있는 값들이 가산 또는 셀 수 있는 경우
- 예) 불량품의 개수, 사고건수...
연속확률변수
- 가질 수 있는 값이 셀 수 없을 정도로 많은 경우
- 예) 수명, 신장, 체중
- 예) 휴대전화의 수명
확률분포 (Probability Distribution)
- [0,1]
- 확률변수는 표본공간의 값을 숫자로 바꾼 함수
-> 확률변수가 어떤 값을 가진다는 것은 표본공간 내에 대응하는 원소들이 존재 - 수식표현
- 확률변수는 숫자로 표시되고 해당 숫자에 대한 확률을 구할 수 있음
-> 확률변수의 값에 따라 확률이 어떤 형태로 분포되어 있다는 말을 할 수 있음 (그림으로 표시가능) - 확률분포 (probability distribution) : 확률변수의 값에 대해 확률을 표시한 것
- 확률분포표 : 확률변수의 확률을 표로 표시한 것
- 확률은 모집단이 어떤 형태로 이루어져 있는지를 보여줌
-> 확률분포는 모집단을 숫자로 표시했을 때의 형태
= 모집단의 확률구조 - 모집단의 확률구조를 표시하는 방법
- 이산확률변수 : 확률질량함수, 누적분포함수...
- 연속확률변수 : 확률밀도함수, 누적분포함수...
2. 이산확률변수와 확률질량함수
확률질량함수 (probability mass function)
- pmf
- 이산확률변수 : 확률변수의 치역이 셀 수 있는 경우
- 이산확률변수 X가 임의의 값 x일 확률 = P(X = x)
확률질량함수의 성질
예) - 윷 하나를 젖혀질 때까지 던지는 확률실험
- 젖혀지는 S, 엎어지면 F
- X : 윷을 던진 횟수, Y : 엎어진 수
=> 기하급수적으로 감소
누적분포함수
확률변수의 변환
- 확률변수의 변환(함수) -> 확률변수의 함수도 확률변수
- 변환된 확률변수의 확률분포 유도 가능
- 예시
예) - 동전 3개 던지기
- X : 앞면의 수
- Y : 앞면과 뒷면의 수의 차이
3. 연속확률변수와 확률밀도함수
확률밀도함수 (probability density function)
- 연속확률변수 : 확률변수의 치역이 실수
- 히스토그램
- 밀도 : 히스토그램의 높이
- 전체 면적 = 1
- 밀도 : 데이터가 얼마나 밀집되어 있는지
확률밀도함수에서의 확률
- 히스토그램의 면적 = 해당 구간에서의 비율 (상대도수)
- 확률밀도함수의 면적 = 해당 구간에서의 확률
예) - 0~12까지의 숫자가 표시된 돌림판
- X = 3일 확률 P(X=3) 은 0
- x에서의 확률 (면적)은 0
확률밀도함수의 성질
누적분포함수
4. 확률변수의 기댓값
기댓값 ( expectation, expected value)
- 표본평균
- {1,2,3,4,5,6}으로 이루어진 모집단으로부터 5개의 표본을 무작위로 선택 : 1,1,2,5,6
기댓값 계산
- 예시)
변환된 변수의 기댓값
기댓값의 성질
요약
1.
2.
3.
4.
'수학 > 확률론' 카테고리의 다른 글
통계학의 이해 1 - week6 : 조건부확률 (1) | 2023.11.02 |
---|---|
통계학의 이해 1 - week5 : 확률의 기본 개념과 원리 (0) | 2023.10.25 |