python 独立性の検定、期待度数の計算を行う


python で、独立性の検定、期待度数の計算を行う方法を調べてみました。
結果を記載します。


使用するライブラリ

scipy.stats.chi2_contingency を使用します。

計算する

統計検定2級 2017年6月の、問13 のデータを使って計算してみます。

from scipy import stats
import numpy as np
array = np.array([[19, 8], [30, 43]])
result = stats.chi2_contingency(array)

print("カイ二乗の統計量",result[0])
print("p値",result[1])
print("自由度",result[2])
print("期待度数",result[3])
カイ二乗の統計量 5.63856186818
p値 0.0175696130794
自由度 1
期待度数 [[ 13.23  13.77]
 [ 35.77  37.23]]

p値が、0.01757 なので、Aが好きか嫌いかは、性別と関係があるになります。


参考

以下、参考にした記事になります。
* Python: SciPyを使った仮説検定 - け日記
* データサイエンスをPythonで試す(1_検定) - あれもPython,これもPython

以上です。

コメント