差异,协方差与相关性概论

2018年3月15日

什么是方差?

在统计学中,方差是指数据集的分布。它是用来确定数据集中每个数字离均值有多远的一种测量方法。

在进行市场研究时,在计算未来事件的概率时,方差特别有用。方差是找到随机变量可以在给定范围内采取的所有可能值和可能性的重要方法。

零的方差值表示数据集内的所有值是相同的,而所有不等于零的差异将以正数为单位。

方差越大,数据集中的分布越广。

一个大的方差意味着一个集合中的数字离平均值很远,而且彼此之间也很远。小的方差意味着数字在价值上更接近。

如何计算方差

方差的计算方法是:取数据集中每个数字与均值之间的差值,将这些差值平方,使其为正,然后将得到的平方和除以集合中值的数量。

方差公式如下:

方差的数学公式。

在该公式中,X表示单独的数据点,U表示数据点的平均值,n表示数据点的总数。

注意,在计算样本方差以估计人口方差时,方差方程的分母变为n - 1.这消除偏见从估计,因为它禁止研究人员低估总体方差。

方差的优势

方差的主要优点之一是,无论方向如何,它都以相同方式与数据集的平均值处理的所有偏差。

这确保了平方偏差不能总和为零,这将导致出现外观,即根本中没有可变性。

方差的缺点

方差最常被讨论的缺点之一是,它给远离平均值或离群值的数字增加了权重。这些数字的平方有时会导致对整个数据集的歪曲解释。

什么是协方差?

协方差提供有关两个变量彼此相关的洞察力的洞察。

更准确地说,协方差指的是数据集中两个随机变量如何一起变化的度量。

正协方差意味着这两个变量是正相关的,并且它们向同一个方向移动。

负协方差意味着变量与它们相反的方向相反。

如何计算协方差

协方差公式如下:

协方差的数学公式

在该公式中,X表示独立变量,Y表示从属变量,n表示样本中的数据点数,x-bar表示x的平均值,y-bar表示从属变量y的平均值。

协方差和相关是一回事吗?

简单地说,没有。

虽然协方差和相关都表明变量之间是正相关还是负相关,但它们并不被认为是相同的。

这是因为相关性也通知了变量倾向于一起移动的程度。

协方差用于测量具有不同测量单位的变量。通过利用协方差,研究人员能够确定单位是否正在增加或减少,但由于协方差不使用一个标准化的测量单位,它们无法巩固变量在一起的程度。

另一方面,相关性标准化两个变量之间相互依存的度量,并通知研究人员如何将两个变量在一起移动。

相关系数

相关系数是用于指代所得到的相关测量的术语。它将始终保持一个和负面之间的值。

当相关系数为1时,所检验的变量完全正相关。换句话说,当一个物体移动时,另一个物体也会按比例朝同一个方向移动。

如果相关系数小于一个,但仍然大于零,则表示少于完美的正相关。相关系数越接近一个,两个变量之间的相关性越强。

当相关系数为零时,它意味着变量之间没有可识别的关系。如果一个变量移动,则无法对其他变量的移动进行预测。

如果相关系数为负1,这意味着变量完全负相关或负相关。如果一个变量增加,另一个将以同样的比例减少。变量会向相反的方向移动。

如果相关系数大于负面,则表示存在不完美的负相关。随着相关方法的相关性,相关性增长。


现在,您对方差,协方差和相关性有了基本的理解,您将能够避免研究人员经常经历的常见混淆。

  • 今天开始alchemer。
    尝试Alchemer 开始我的免费试用
  • 看看炼金术师用起来有多容易
    请参阅帮助文档
  • 开始做更明智的决定

    开始免费试用