总结不同类型的统计单变量测试

摄影者乔安娜·科辛斯卡(Joanna Kosinska)Unplash

介绍

统计检验的目的是帮助分析师根据收集的数据做出基本推论或得出一般结论。许多统计测试都可以使用,并且可能会使用户记住应该使用哪些测试。这是因为不同的测试对数据有不同的假设,例如数据类型,数据分布,数据变化等,我们必须考虑所有这些假设,然后才决定使用合适的测试拟合数据。

在这篇文章中,我将总结一些单变量测试和相应的假设,以帮助您在选择要应用哪些测试时避免混淆。

参数测试

我们将从参数测试开始。简而言之,一个参数统计测试定义了有关总体参数和数据分布的假设。学生的t检验,Z检验和ANOVA测试是这些测试的示例,这些测试假设来自正态分布的数据。

测试一个平均值

图1-作者图像

情况1:已知差异(σ))

假设我们要测试y的平均值是否等于特定值µ0,假设y的n观察结果来自正态分布,并且已知方差。我们将计算y的样品平均值,并通过应用Z检验统计。您可以在上图中找到公式。如果z值小于临界值,我们接受零假设,这是利益的假设,否则我们拒绝了零假设。

要注意的是,即使观察值不是来自正态分布,中央限制定理也可以保证Z几乎正常。

案例2:未知方差

同样,但是如果我们不知道差异,单样本t检验被申请;被应用。我们通过样本方差(S²)估算样本均值和种群方差(σ²)的均值,并给出t检验作为图像1。如果t-test统计量≥t表的临界值为t(α/2,n-1),我们拒绝零假设。

两种方法测试:比较两种方法

图2-作者图像

在一个单个变量的情况下,假设我们从正常分布中获得两个随机和独立的样本,σ1²=σ2²=σ²和σ²未知。这t检验统计在图像2中计算出,分母中的汇总方差为公共方差(σ²)的无偏估计量。注意到,具有t分布的t统计量需要独立性和均等差异假设。然后,自由度为N1+N2-2。因此,如果测试统计量更大或等于t(α/2,n1+n2-2),则无效假设将被拒绝。

配对观测测试

图3-作者的图像

当我们想在不同条件下检查相同的主题时,应用测试。例如,同一女孩收到两个不同的皮肤护理程序。因此,获得的两个样本是相关的,因为它们与同一个人相关。在这种情况下,我们不能使用两样本测试,因为样品不是独立的,因此未获得测试的T分布。

进行测试的一种方法是将两个样本转换为一个并应用单样本t检验。在上面的示例中,女孩在2种不同的治疗方法中接受的2个结果称为配对观察结果。我们将获得配对观察结果之间的差异,并专注于处理这些差异。此外,为了说明配对观测值之间的协方差,我们还必须假设配对观测值具有双变量正态分布。然后,可以像图3所示一样计算测试统计量,而SD代表差异的标准偏差(d)。如果T值> t(α/2,N-1),我们拒绝零假设并得出两种处理之间存在差异。

单向方差分析:比较K表示

图片4-作者的图像

假设我们有一个随机样品,该样品包含来自每个K正常种群的独立样品,具有相等的方差。每个K样品都有N观察结果,被认为是一组。然后,我们想进行测试,以查看K组的均值是否彼此相等。

例如,我想知道科学测试的平均得分在四种教学方法之间是否有所不同。我们可以用SSH进行F测试作为“之间” - 正方形的样品总和(由于均值)和SSE作为“内部” - 平方的样品总和。当f> f(α)得出结论,样本均值之间至少存在一种不平等时,我们拒绝了无效的假设。

对比

图5-作者图像

进行对比意味着在小组手段之间进行比较。从图像5中,我们可以看到,人口平均值的对比可以定义为线性组合δ,其中系数之和= 0。第一种教学方法的平均测试得分是其他三种方法的三倍。零假设在这种情况下为HO:µ1 - (µ2 + µ3 + µ4)/3 = 0。t检验可以进行检查差异。另外,F检验也可以用作T²=F。

因此,总之,测试如下所述:

作者的图像

非参数测试

非参数测试也称为无分布测试,这意味着没有对人口分布的假设。在统计数据中,该术语并不总是暗示您对人口不了解。尽管如此,与上面的参数测试相反,“非参数”通常表明您知道人口数据不会遵循正态分布。

仅在必要时才使用非参数测试,例如,当您知道违反正态性假设时。此外,人们认为参数测试更准确,因为测试具有更好的统计能力,并且更有可能发现真正的重要影响。如果您的样本量足够大,则非参数测试可以通过非正常的连续数据表现良好。另外,如果:

  • 您的样本量很小。
  • 您的数据中有不明显的异常值。
  • 兴趣的假设是中位数,而不是均值,因为您的分布非常偏斜)

最好使用非参数测试而不是参数测试。

就是说,我不会详细谈论非参数测试,而是命名一些常见测试。

  • 1个样本符号测试(参数测试中的1个样本z检验,1个样本t检验):估计人口的中位数并将其与给定价值进行比较。
  • 1样本Wilcoxon签名等级测试(参数测试中的〜1个样本z检验,1个样本t检验):您可以还要估计人口中位数并将其与给定值进行比较,但是该测试的假设是您的数据来自像统一分布这样的对称分布。
  • Kruskal-Wallis测试(〜1路ANOVA):弄清楚两个或更多的中位数是否有所不同。

您可以找到更多的非参数测试关联如果你感兴趣。

结论

上面是我对单变量测试的摘要,我希望它可以帮助您对进行各种数据推断时使用适当的测试的简洁视图。在下一篇文章中,我将尝试对多元测试进行类似的摘要。

您可以在这里找到我的旧帖子:

参考

https://www.wiley.com/en-us/methods+multivariate+Multivariate+ Analissis%2C+2nd+Ededition-P-9780471461722

获取中型应用betway娱乐官网

一个说“在应用商店上下载”的按钮,如果单击,它将带您到iOS App Store
一个说“获取它,Google Play”的按钮,如果单击它,它将带您到Google Play商店
Chi Nguyen

统计学硕士。在成为更好的数据分析师的过程中分享我的学习技巧。LinkedIn:https://www.linkedin.com/in/chinguyenphamhai/

Baidu