말하는 감자

[빅데이터 분석기사] 확률변수와 확률분포 본문

Computer science & Infra/Big Data

[빅데이터 분석기사] 확률변수와 확률분포

개똥벌레25 2023. 3. 30. 16:32
728x90

Random Varialbe 확률 변수와 Probability Distribution Function 확률분포함수

Random Variable 확률 변수는 사건의 시행 결과를 하나의 수치로 대응시키기 위한 함수이다. 

 

Probability Distribution Function 확률분포함수는 확률들을 확률공간으로 할당해주는 함수이다.

RV와 f를 거쳐 새로 태어난 확률

이때 확률변수 X가 취할 수 있는 값이 discrete (finite, countable)하냐 continuous 하냐에 따라서 지칭하는 이름도 살짝 다르다. 이산확률분포인 경우 Probability Mass Function 확률질량함수, 연속확률분포인 경우 Probability Density Function 확률밀도함수이다. 그리고 확률분포의 종류도 discrete과 continuous는 종류가 다르다.

이산확률분포의 종류

  • Bernoulli Distribution, 베르누이 분포
  • Binomial Distribution, 이항분포
  • Multinomial Distribution, 다항분포
  • Poisson Distribution, 포아송분포
  • Geometric Distribution, 기하분포
  • Negative Binomial Distriution, 음이항분포
  • Hypergeometric Distribution, 초기하분포

연속확률분포의 종류

  • Continuous Uniform Distribution, 연속균등분포
  • Exponential Distribution, 지수분포
  • Normal Distribution, 정규분포
  • Standard Normal Distribution, 표준정규분포
  • Gamma Distribution, 감마분포
  • Chi-Squared Distribution, 카이제곱분포
  • Student t-Distribution, 스튜던트 t 분포
  • F Distribution, F 분포

이제 이 확률 분포를 요약해야 한다. 앞서 말했던 기술통계의 세가지 Central Tendency, Degree of Dispersion, Skewness 중 central tendency와 degree of dispersion의 계산 방법과 성질은 너무나도 잘 알려져 있기 때문에 정리만 하고 넘어간다.

Comments