[ADP/ADSP] 3.4.3 확률 및 확률 분포
1. 확률이란
표본 공간의 원소의 개수에 대한 사건의 개수의 비율로 0에서 1 사이의 값을 갖는 값을 확률이라고 한다.
2. 확률 용어 정의
o 표본 공간(sample case)
- 시험을 통해 나타내는 모든 결과들의 집합
o 사건(event)
- 표본 공간의 부분집합
o 원소(element)
- 나타날 수 있는 모든 결과
3. 확률 변수와 확률 분포
3.1 확률 변수(random variable)
- 특정값이 나타날 가능성이 확률적으로 주어지는 변수 이산확률 변수와 연속확률 변수로 나뉨
이산 확률 변수 : 확률 값을 셀수 있음(동전 던지기, 3번 중 2번 안타를 칠 확률 등)
연속 확률 변수 : 구간에 대한 값을 계산함(센서 값은 연속 확률 변수로 가우시안 분포를 따름)
3.2 확률 분포(distribution)
- 확률 변수가 특정 분포를 가질 확률을 나타내는 함수
A. 이산형 확률 분포
* 베루누이 분포(Bernoulli distribution)
- 동전 던지기와 같이 결과가 2개만 나오는 경우
ex) 동전의 앞면이 나올 확률
* 이항분포(Binomial distribution)
- 결과가 2개만 나오는 베루누이 시행을 N 번 반복했을 때, K번 성공할 확률
ex) 5번 중 3번이 앞면이 나올 확률
*기하 분포(Geometric distribution)
- 베루누이 시행에서 첫번째 성공이 있을 때까지 x번 실패할 확률
ex) 첫 앞면이 나올때까지 뒷면이 나올 확률
* 다항분포(Multinomial distribution)
- 결과가 3가지 이상인 확률 분포
*포아송분포(Poisson distribution)
시간과 공간 내에서 발생하는 사건의 발생횟수에 대한 확률 분포
ex) 10 page에서 10개의 오타가 나왔다면 1page에서 오타가 2개 나올 확률
B. 연속형 확률 분포
* 균일 분포(Uniform Distribution)
- 확률 분포가 일정한 분포를 갖음
* 정규 분포(Normal Distribution)
- 평균이 0이고 표준편차가 1인 종모양의 분포
* 지수 분포(Exponential Distribution)
- 경과 시간에 대한 연속확률분포
* T 분포(T-Distribution)
- 평균이 0이고 좌우가 동일한 분포로 표본이 30개 이상이면 정규분포와 거의 같은 분포가 된다.
- 두 집단간의 편균이 동일한지 알고자 할 때 검정통계량으로 활용된다.
* 카이제곱 분포(chi_square distribution)
- 두 집단의 동질성 검정에 활용하며, 범주형 자료에 대해 얻어진 관측값과 기대값의 차이를 보는 검정에 활용
* F 분포(F-distribution)
- 카이제곱과는 다르게 2개의 자유도를 갖고 있으며, 자유도가 커질 수록 정규분포를 따른다.
- 분산의 동일성 검정에 사용되는 통계량의 분포이다.