[Python 데이터 분석] 판다스 분포 : 이항분포, 정규분포, 카이제곱분포 (Pandas Distribution : binomial, normal, uniform, chisquare)


 판다스 분포 : 이항분포, 정규분포, 카이제곱분포 (Pandas Distribution : binomial, normal, uniform, chisquare) 


판다스에서는 여러 확률분포들을 시뮬레이션 할 수 있도록 유용한 기능을 제공하고 있습니다. 다음은 그와 관련된 예제들입니다.

import pandas as pd
import numpy as np

# 0.5의 확률로 1번 시도했을 경우
# 성공한 횟수를 나타냄 (binomial distribution)
binom = np.random.binomial(1, 0.5)
print(binom)
# 0

# 0.5의 확률로 1000번 시도해서 성공한 비율
binom_possible = np.random.binomial(1000, 0.5)/1000
print(binom_possible)
# 0.509

# 0-1 사이의 값 중 하나를 반환
uniform = np.random.uniform(0,1)
print(uniform)
# 0.017569841468665137

# normal distribution의 값 중 하나를 반환
norm = np.random.normal(0)
print(norm)
# -0.01514817076947644

# mean=0.75인 normal distribution 의 표본 1000개를 뽑고
# 그 표본의 표준편차를 구함
distribution = np.random.normal(0.75, size=1000)
np_std = np.std(distribution)
print(np_std)
# 1.0138256135609354

import scipy.stats as stats
# 첨도를 계산
kurto = stats.kurtosis(distribution)
print(kurto)
# -0.04864969368079697

# 쳐짐을 계산
skew = stats.skew(distribution)
print(skew)
# 0.14249808939585273

chi_squared_df2 = np.random.chisquare(2, size=10000)
skew = stats.skew(chi_squared_df2)
print(skew)
# 1.9495243299128926

chi_squared_df5 = np.random.chisquare(5, size=10000)
skew = stats.skew(chi_squared_df5)
print(skew)
# 1.2211123354349391


참고자료 : https://www.coursera.org/learn/python-data-analysis



이 글을 공유하기

댓글(0)

Designed by JB FACTORY