-
통계) 연속형 확률 분포통계 2023. 4. 5. 01:38
확률밀도함수(PDF)


누적분포함수(CDF): 확률밀도함수를 적분하면 누적분포함수가 됨

🔔 누적분포함수의 성질
1. 0 ≤ F(x) ≤ 1
2. 만약 b ≥ a, F(b) ≥ F(a)
3. F(b) - F(a) = P [ a ≤ X ≤ b ]
균일분포(uniform distribution): 확률변수 X가 a와 b 사이에서 아래와 같은 확률 밀도 함수를 가짐

cdf)


정규 분포(normal distribution)
확률 밀도 함수는 확률 변수 X가 평균이 g 이고, 분산이 ù인 정규분포를 따를 때 아래와 같음
🔔 파라메터의 따른 정규분포 모양 비교

🔔 정규분포의 성질

🔔 표준 정규 분포(standard normal distribution)
평균 μ이 0 이고 표준편차 σ가 1 로 규격화시킨 것 (Z ~ N(0,1))
이항분포의 정규 근사
X~B(n,p) 일 때, 확률 변수 X는 n이 충분히 크면 근사적으로 정규 분포 X ~ N(np, np(1-p))를 따름

🔔 엑셀 활용

1) NORM.DIST(1.96,0,1,1)
2) NORM.DIST(-1.96,0,1,1)
3) NORM.DIST(1.96,0,1,1) - NORM.DIST(0.5,0,1,1)
4) NORM.DIST(110,100,10,1) - NORM.DIST(100,100,10,1)
5-1) NORM.INV(0.05,30,5)
5-2) NORM.INV(0.9,30,5)지수분포(exponential distribution)
단위 시간당 발생할 확률 λ인 어떤 사건의 횟수가 포아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따름 (이벤트 A와 이벤트 B 사이에 걸린 시간)ex) 버스정류장에서 100번 버스가 도착하는 횟수가 포아송 분포를 따른다면, 첫 번째 버스가 도착할 때까지 대기 시간의 분포는 지수분포
🔔 연속되는 사건 사이의 대기시간도 지수분포 / 즉 앞의예시에서 두번째 버스가 도착하고 세번째 버스가 도착할 때까지 대기시간의 분포도 지수분포



🔔 λ : 단위 시간당 이벤트가 발생하는 수

🔔 지수분포의 무기억성(Memoryless Property)

- 어떤 시점 부터 소요되는 시간은 과거 시간에 영향을 받지 않음
- 예시) 버스를 기다리는 대기시간은 먼저 기다린 사람과 확률이 같음
- 지수분포를 활용할 경우, 전구를 한달 동안 사용 했을 때 남은 수명은 한달 간 사용했던 영향을 받지 않음
- 즉 새전구와 한달 간 사용한 전구의 남은 수명은 같다고 생각함
=> 이런 문제로 실제적용에 문제가 있고, 생존 분석에서는 weibull분포 또는 log-normal 분포를 사용하여 예측


'통계' 카테고리의 다른 글
통계) 모집단과 표본분포 (0) 2023.04.05 통계) 이산형 확률 분포 (0) 2023.03.29 통계) 확률 (0) 2023.03.29 통계) 데이터의 이해 (0) 2023.03.29