使用python解释统计公式(mu + sigma * data)

数据挖掘 Python 大数据 统计数据 可视化 描述性统计
2022-03-05 10:04:26

我正在使用 python 处理数据。我尝试使用 绘制直方图mathplotlib

我找到了一些关于如何分析数据以获得更准确图表的示例。

所以我编码:

# Call csvfile
csvdata = pandas.read_csv('data/education_data/' + filename + '.csv', low_memory=False, encoding='latin-1')

# Convert amount field into int()
def str_to_int(mainList):
    for item in mainList:
        newList = [(int(item.replace('$', '').replace(',', '')) / (1000000)) for item in mainList]
    return newList

# Convert str to int using str_to_int() function
csvdata['str_costo'] = str_to_int(csvdata['Cuantía'])
sigma = numpy.std(csvdata['str_costo'])
mean = numpy.mean(csvdata['str_costo'])
x = mean + sigma * csvdata['str_costo']

但是,我特别看到了一个步骤:

In[0] x = mean + sigma * csvdata['str_costo']
Out[0] 1.371822e+08, 1.608953e+08, etc...

来自的所有值csvdata['str_costo']都是整数。

我的问题是如何解释x价值观。

理论上它们是什么意思?

0个回答
没有发现任何回复~