给定一个包含特征的数据集,你想检查正态性,一次一个特征没有多元正态检验,你如何决定使用哪个正态检验?例如,使用 python 模块 scipy 我可以使用:
http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.shapiro.html
或者我可以使用:
http://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.mstats.normaltest.html
例如,在相同的功能上,我得到以下输出:
scipy.stats.shapiro(data[:,0])
(0.9985173940658569, 0.77845299243927)
scipy.stats.mstats.normaltest(data[:,0])
NormaltestResult(statistic=1.492603328675163, pvalue=0.47411675723570479)
scipy.stats.anderson(data[:,0], dist='norm')
AndersonResult(statistic=0.17542490527580412, critical_values=array([ 0.573, 0.653, 0.783, 0.913, 1.086]), significance_level=array([ 15. , 10. , 5. , 2.5, 1. ]))