Post on 10-Mar-2020
연속확률분포
Continuous Distribution
학습 내용
기본 개념
일양분포
정규분포
지수분포
류문찬(quality@korea.ac.kr)
연속확률분포
연속확률변수(continuous random variable )
실수(셀 수 없는; uncountable) 값들을 가질 수 있는 확률변수
특정한 값이 발생할 확률은 0이다.
연속확률변수가 가질 수 있는 값은 무한개
가질 수 있는 값을 나열할 수도 없다.
따라서 연속확률변수의 확률분포는 이산확률변수와 같은 방법으로 확률분포를 나타낼 수 없다.
확률은 구간(interval)에 대해서만 정의될 수 있다.
예
주사위 1개를 던지는 실험에서 P(X=5)=1/6
P(X=특정 학생이 정확히 10분 늦게 입실)은 무한히 작기 때문에 의미가 없고 P(9분 ≤ X ≤ 10분) 와 같이 어떤 구간에 있을 확률만이 의미를 가진다.
류문찬(quality@korea.ac.kr)
0.01
0.05
0.08
0.12
0.20
0.27
0.15
0.07
0.04 0.01
106 108 110 122 120 112 118 116 114 124
확률밀도함수
류문찬(quality@korea.ac.kr)
Probability is area
under curve! dxXfdXcP
d
c )()(
f(x)
x c d
확률밀도함수 …
probability density function(pdf)
모든 x에 대하여 f(x) ≥ 0
f(x) 아래의 총면적은 1이다.
류문찬(quality@korea.ac.kr)
일양분포(uniform distribution)
류문찬(quality@korea.ac.kr)
확률밀도함수와 모양
f(x)
x b a
area = width x height = (b – a) x = 1
류문찬(quality@korea.ac.kr)
𝑓 𝑥 =1
𝑏 − 𝑎, where 𝑎 ≤ 𝑥 ≤ 𝑏
정규분포(normal distribution)
통계적 추론에서 핵심적인 분포- 중심극한정리
종 모양이며 좌우대칭
mean = median = mode
- < 확률변수 < +
Mean
Median
Mode
류문찬(quality@korea.ac.kr)
확률밀도함수(probability density function)
E(X) =
V(X) = 2
xxf
x
,e2
1)(
2
2
1
X~N(,2)
= 3.14159; e = 2.71828
류문찬(quality@korea.ac.kr)
정규분포의 모양
”평균이 커지면 곡선이 오른쪽으로 이동한다…”
류문찬(quality@korea.ac.kr)
정규분포의 모양 …
” 표준편차가 커지면 곡선이 더 낮고 넓어진다…”
류문찬(quality@korea.ac.kr)
정규분포 확률
c dX
f(X)
?)()( dxxfdXcPd
c
Probability is
area under
curve!
류문찬(quality@korea.ac.kr)
X
f(X)
Normal distributions differ by mean & standard deviation.
That is an infinite number!
Each distribution would require its own table.
Infinite Number of Tables
류문찬(quality@korea.ac.kr)
표준정규분포
2
2
1
2
1)(
z
ez
0 z
2
2
1
e2
1)(
x
xf
μ x
σ
Z~N(0,1) X~N(,2) μ=0, σ=1
류문찬(quality@korea.ac.kr)
표준정규분포표
)(
)()(
tZP
dzzt
t
누적분포함수
0 z
t
Z~N(0,1)
z .00 .01 .02 .03 ...
-3.0 .0013 .0013 .0013 .0012
-2.9 .0019 .0018 .0018 .0017
-2.8 .0026 .0025 .0024 .0023
...
류문찬(quality@korea.ac.kr)
표준정규분포표
0 z
P(Z>t)
t 0
P(0<Z<t)
t 0
P(Z<t)
t 0
류문찬(quality@korea.ac.kr)
표준정규분포표 이용
z ... .00 .01 .02 .03 ...
.0 ... .5000 .5040 .5080 .5120
.1 ... .5398 .5438 .5478 .5517
.2 ... .5793 .5832 .5871 .5910
... ...
Z~N(0,1) (a) P(Z<0.12)
(b) P(-0.12<Z<0.12)
(c) P(Z>0.12)
류문찬(quality@korea.ac.kr)
ZX
X~N(,2)
표준화(Standardize)
X
One table!
= 0
= 1
Z
2
2
2
1)(
z
ez
Z~N(0,1)
2)(2
1
2
1)(
x
exf
류문찬(quality@korea.ac.kr)
μ b
x
a 0 a-
b-
z
X~N(,2)
ZX
Z~N(0,1)
확률 계산
류문찬(quality@korea.ac.kr)
X~N(5,102) P(5<X<6.2)=?
표준화 - 예
류문찬(quality@korea.ac.kr)
예 : P(3.8 X 5)
류문찬(quality@korea.ac.kr)
예 : P(2.9 X 7.1)
류문찬(quality@korea.ac.kr)
예 : P(X 8)
류문찬(quality@korea.ac.kr)
예 : P(7.1 X 8)
류문찬(quality@korea.ac.kr)
Z 값 구하기
z .00 .01 .02 .03
.0 .5000 .5040 .5080 .5120
.1 .5398 .5438 .5478 .5517
.2 .5793 .5832 .5871 .5910
.3 .6179 .6217 .6255 .6293 .31 Z 0
1 .1217 표준정규분포표(일부)
P(Z<a) = .6217 인 a?
류문찬(quality@korea.ac.kr)
Z값 구하기
P(Z<a) = 0.90
P(-a<Z<a) = 0.99
P(Z>a)=0.05
Z
류문찬(quality@korea.ac.kr)
Excel 함수
누적 확률
P(Z<a) = norm.s.dist(a) / normsdist(a)
Ex : norm.s.dist(1.0)=0.8413
z값
P(Z<a)=p인 a=norm.s.inv(p) / normsinv(p)
Ex : norm.s.inv(0.8413)=1.0
a z
류문찬(quality@korea.ac.kr)
지수분포(Exponential Distribution)
류문찬(quality@korea.ac.kr)
지수분포 함수
확률밀도함수
평균과 표준편차
0,)( xexf x
1,
1
확률
x
f(x)
a
aeaXP 1)(
aeaXP )(
류문찬(quality@korea.ac.kr)
Excel 함수
P(X<a) = expon.dist(a, , true)
류문찬(quality@korea.ac.kr)
포아송분포와 지수분포
일정 기간중 도착회수 :
Poisson분포
도착간 시간:
지수분포
권오진 피부과에는 환자가 시간당 6명꼴로 포아송분포를 따르며 찾아 온다.
권오진 피부과에는 환자가 평균 10분에 한명 꼴로 지수분포를 따르며 찾아온다
류문찬(quality@korea.ac.kr)
예제
최용철 치과의원에서는 환자 1명당 진료시간이 평균 10분인 지수분포를 따른다고 한다.
1) 진료시간이 20분 이상 소요되는 환자의 비율은?
2) 한시간 동안 1명을 진료하게 될 확률은?
류문찬(quality@korea.ac.kr)
무기억성(memoryless property)
P(X>a+b|X>b)=P(X>a)
0 b a+b
류문찬(quality@korea.ac.kr)
응용
queueing theory(대기행렬 이론)
See p.304
reliability(신뢰도)
류문찬(quality@korea.ac.kr)