1973年,统计学家弗朗西斯·安斯库姆(Francis Anscombe)提出了四个数据集,它们的平均数、方差、相关系数、线性方程式完全一致,这些数据集具有几乎相同的简单描述性统计数据,但具有非常不同的分布,并且在绘制图形时显得非常不同。 从特征值上面,根本不会发现这四个数据集是完全不同的。 他以此证明分析数据之前绘制数据
这四个例子是完全不同的分布: 安斯库姆四重奏(Anscombe's quartet...两位) y的方差 4.122或4.127(精确到小数点后三位) x与y之间的相关系数 0.816(精确到小数点后三位)线性回归线 (分别精确到小数点后两位和三位) 安斯库姆四重奏的四组数据图表在四...
Anscombe 数据集创建器 v1.1.0 用户指南说明书 Package‘anscombiser’October12,2022 Title Create Datasets with Identical Summary Statistics Version1.1.0 Date2022-10-03 Description Anscombe's quartet are a set of four two-variable datasets that have several common summary statistics but which have ...
43 − 相关性 线性相关 数据在一条直线附近波动,则变量间是线性相关 非线性相关 数据在一条曲线附近波动,则变量间是非线性相关 不相关 数据在图中没有显示任何关系,则不相关 平均值 N个数据 的平均值计算公式: 标准差 标准差表示了所有数据与平均值的平均距离,表示了数据的散度,如果标准差小,表示数据集......