1.1 常用统计方法

除了可视化展示数据分析结果,一些统计描述也很有必要。因此,罗列一些简单的统计性描述概念。

使用Numpy,平均值、最大值、最小值、求和。

标准误差:表示样本平均数和总体平均数的变异程度,可以用来反映结果精密度。

标准差(均方差):计算一组数据偏离均值的平均幅度,不管这组数据是样本数据还是总体数据。

方差:在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。

中位数:对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。

众数:在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。

1.2 常用图表

数据通常包含五种关系:构成、比较、趋势、分布及联系。

构成:关注每个部分所占整体的百分比,适用饼图。

比较:展示事物的排列顺序,首选条图。

趋势:常见的时间序列关系,适用线图能更好的展示变化。

分布:关心各数值范围包含多少项目,适用柱图。

联系:查看两个变量之间关系,适用气泡图。


https://www.cnblogs.com/arnoldlu/p/7553978.html