数据挖掘 - 如何决定使用哪种正态性检验 - 吾爱随笔录

给定一个包含特征的数据集，你想检查正态性，一次一个特征没有多元正态检验，你如何决定使用哪个正态检验？例如，使用 python 模块 scipy 我可以使用：

http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.shapiro.html

或者我可以使用：

http://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.mstats.normaltest.html

例如，在相同的功能上，我得到以下输出：

scipy.stats.shapiro(data[:,0])
(0.9985173940658569, 0.77845299243927)


scipy.stats.mstats.normaltest(data[:,0])
NormaltestResult(statistic=1.492603328675163, pvalue=0.47411675723570479)


scipy.stats.anderson(data[:,0], dist='norm')
AndersonResult(statistic=0.17542490527580412, critical_values=array([ 0.573,  0.653,  0.783,  0.913,  1.086]), significance_level=array([ 15. ,  10. ,   5. ,   2.5,   1. ]))