in

使用这个 Z 分数表轻松理解概率

统计学家们知道在分析中标准化的重要性,但这个概念可能会使我们其他人困惑。当我们想要分析和比较实验值时,重要的是它们具有相同的单位,或者根本没有单位。这就是z分数发挥作用的地方,因为它们为我们提供了比较值的分布和概率的简单方法,以及识别任何异常值的能力。在本文中,我们将介绍什么是z分数以及它们是如何工作的,同时为您提供一个简单的计算自己z分数的图表。

如果您发现这个表对您在科学领域的工作有用,您可能会喜欢我们的其他方便的图表,用于确定分子几何、电负性和度量转换。

什么是z分数?

简单来说,z分数是您的数据值与平均数据值(均值)之间的距离的数值表示,以标准偏差为单位。z分数可以是正数或负数,具体取决于它们是否代表在均值上方或下方的数据点。z分数的大小也提供了重要的信息,即数据偏离均值的程度。较高的分数表示较高的偏离程度。

幸运的是,我们可以参考z分数表或z表,它们具有预先确定的z分数值,以确定我们的数据中将有多少部分位于特定分数之上或之下,并计算分数在百分位数方面的排名。值得注意的是,z分数必须与标准正态分布曲线一起使用。这是一条以均值为中心对称的钟形曲线。

我们如何计算z分数?

首先,您必须有数据的均值和标准差。然后,您可以使用以下公式计算z分数:

z = (x – μ) / σ

其中,z是z分数,x是需要计算的数据点,μ是均值,σ是标准差。

例如,假设我们有一组数据表示学生在一次考试中的分数,其中一个值为75。平均分是60,标准差是15。将这些数字代入我们的公式得到:

z = (75 – 60) / 15 = 1

因此,我们对于这个数据点的z分数等于1。这告诉我们,该分数比数据的均值高一个标准差,因为该值是正数。由于我们使用的是标准正态分布曲线,我们还知道大于我们数据的68%的值将具有z分数(即偏离均值)介于-1和1之间。 95%的数据将介于-2和2之间,99%的数据将介于-3和3之间。

计算z分数有助于标准化数据和评估统计显著性。

©balanceformcreative/shutterstock.com

我们如何使用z分数表?

现在我们有了z分数,是时候参考z分数表了。行对应于我们分数的第一个数字,而列对应于第二个数字。许多z分数表提供正值,但您也可以使用负z分数表。通过定位与我们分数相关联的行和列,我们可以获得一个代表累积概率的值,即获得小于或等于我们分数的值的机会。

例如,下面是一个正z得分表。由于我们的z得分为1,我们定位到1.0行和0.0列。这给我们一个值为0.8413。因此,有84.13%的可能性获得一个小于或等于所讨论的值的值。换句话说,这表示数据量低于或等于这个值的数量。

正z得分表给出了获得小于我们选择的数据点的累积概率。

©jingzhengli.com

负z得分表给出了相同的累积概率,只不过是针对负的z得分。

©jingzhengli.com

z得分表还可以告诉我们什么?

z得分表还有一些更多的技巧。例如,我们还可以从1中减去我们的值以获得我们得分右侧的区域。这是因为正态分布是对称的,意味着均值两侧的区域是相等的。通过计算这个值,我们得到0.1587,即15.87%,意味着15.87%的数据将高于此得分。如果我们的得分是负数,情况基本上是相反的。没有负号的值表示我们得分左侧的区域。从1中减去我们的值(作为正值)得到的是我们得分右侧的区域。我们还可以从较大值中减去两个z得分的较小值。这给我们提供了在这个范围内获得值的概率。

假设检验

z得分的另一种用法是在您希望找到关键的z值时使用。这可以帮助您确定您的测试结果是否具有统计学意义。假设您具有95%的置信水平和双尾测试。这是一个测试,我们希望确定与预期值的任何显着差异。因为我们没有指定方向,所以我们必须将关键区域(即1-置信水平)分为两个部分。这给我们一个值为0.02500的值位于我们值的两侧。在负z得分表中查找这个值得到1.96的值。

现在我们可以计算任何其他值的z得分,并查看是否超过了我们的临界值。如果是的话,那么我们有足够的证据来拒绝我们的零假设(默认假设),支持备择假设。如果它落在我们的临界区域内,那么我们可能可以忽略我们的零假设。以这种方式,z得分在假设检验中非常有用。但是重要的是要理解,未能拒绝我们的初始假设并不一定意味着它是真实的。这可能只意味着我们没有足够的证据。

识别异常值

有时候,我们会有异常数据值,这些数据值可能会严重影响我们的数据。识别这些异常数据的过程类似于测试假设。我们可以计算z得分是否超过临界值。如果是,这些数据有可能是一个异常值,但也可能是对零假设的反证。通常还会使用许多其他统计方法来确定这一点,以及其他技术,例如重复实验。如果我们持续获取到超过临界值的数据值,这使得它们不太可能是异常值。它们可能为我们的零假设提供反证。此外,还需要考虑数据值在整个实验背景下的可能性。有些数据值比其他值更可信。

总结

起初,z得分表可能看起来很令人困惑。但是一旦你知道如何使用它们,它们在统计分析中非常有用。通过使用数据值、均值和标准差计算z得分,你可以找到相应的行和列以获取累积概率。如果z得分为负,则意味着数据低于均值,正得分则相反。z得分表提供了我们z得分左侧的累积概率。由于标准正态分布曲线是对称的,你可以通过从1中减去正z得分的累积概率来得到高于均值的概率。对于负z得分,情况正好相反,但要使用绝对值(正值)替代得分。这些得分在许多领域都很有帮助,特别是在标准化、假设检验和异常值识别中。

Written by 小竞 (编辑)

他们称呼我为小竞, 做作为河小马的助理有5年时间了,作为jingzhengli.com的编辑,我关注每天的科技新闻,帮你归纳一些现有科技以及AI产品来提升你的生产力,拥抱AI,让科技和AI为我们服务!