반응형
| 판다스 분포 : 이항분포, 정규분포, 카이제곱분포 (Pandas Distribution : binomial, normal, uniform, chisquare)
판다스에서는 여러 확률분포들을 시뮬레이션 할 수 있도록 유용한 기능을 제공하고 있습니다. 다음은 그와 관련된 예제들입니다.
import pandas as pd
import numpy as np
# 0.5의 확률로 1번 시도했을 경우
# 성공한 횟수를 나타냄 (binomial distribution)
binom = np.random.binomial(1, 0.5)
print(binom)
# 0
# 0.5의 확률로 1000번 시도해서 성공한 비율
binom_possible = np.random.binomial(1000, 0.5)/1000
print(binom_possible)
# 0.509
# 0-1 사이의 값 중 하나를 반환
uniform = np.random.uniform(0,1)
print(uniform)
# 0.017569841468665137
# normal distribution의 값 중 하나를 반환
norm = np.random.normal(0)
print(norm)
# -0.01514817076947644
# mean=0.75인 normal distribution 의 표본 1000개를 뽑고
# 그 표본의 표준편차를 구함
distribution = np.random.normal(0.75, size=1000)
np_std = np.std(distribution)
print(np_std)
# 1.0138256135609354
import scipy.stats as stats
# 첨도를 계산
kurto = stats.kurtosis(distribution)
print(kurto)
# -0.04864969368079697
# 쳐짐을 계산
skew = stats.skew(distribution)
print(skew)
# 0.14249808939585273
chi_squared_df2 = np.random.chisquare(2, size=10000)
skew = stats.skew(chi_squared_df2)
print(skew)
# 1.9495243299128926
chi_squared_df5 = np.random.chisquare(5, size=10000)
skew = stats.skew(chi_squared_df5)
print(skew)
# 1.2211123354349391
반응형
'파이썬 > 파이썬 데이터 분석' 카테고리의 다른 글
[Python 데이터 분석] 가설 검정 (Hypothesis Testing) (6) | 2018.12.26 |
---|---|
[Python 데이터 분석] 판다스(Pandas Timestamp, Period로 시계열 데이터 다루기 (0) | 2018.12.15 |
[Python 데이터 분석] 파이썬 판다스 피벗 테이블(Python Pandas Pivot Table) (0) | 2018.12.14 |
[Python 데이터 분석] 파이썬 카테고리 타입 및 cut을 이용한 범위 나누기(Python Category, cut method) (0) | 2018.12.14 |
[Python 데이터 분석] groupby 집계함수 예제(Python groupby) (1) | 2018.12.14 |
이 글을 공유하기