- API介绍
- API接口
- 定价


协方差计算器
如果您有两个样本并且想要确定它们是否以相似的方式变化,这个协方差计算器就是您需要的工具。在这里,您将学习协方差公式如何工作,如何计算协方差,以及理解协方差与相关性的关系。
首先,回答这个问题:什么是协方差?
什么是协方差?
如果X和Y是两个具有期望值E(X)和E(Y)的随机变量,它们的协方差是:
上述公式在现实情况中并不实用,因为它依赖于我们知道X、Y和XY的期望值。发现这些数字的唯一方法是知道随机变量X、Y和X*Y是如何分布的。但您通常不知道这一点。相反,这是您想要发现的东西!
相反,我们使用有限大小n的x和y的样本观测值。我们将看到这实际上足以执行以下两个任务之一:
1. 当我们可以访问整个总体数据时,找到X和Y的协方差。
2. 当我们只能访问样本时,找到X和Y总体协方差的估计值。
因此,两个样本x和y中的每一个都由n个随机观测值组成,分别对应X和Y。第一个样本的元素表示为x₁, x₂, ..., xₙ,它们的平均值为x_mean。类似地,第二个样本的元素为y₁, y₂, ..., yₙ,平均值为y_mean。
协方差公式解释
以下公式是两个等大小样本的总体协方差公式。这里的名称来自于我们将两个样本视为全部,即它们构成我们的总体。我们不关心这些样本之外发生的事情。
协方差公式的有用性并不立即明显。让我们将其分解为各部分以更好地理解它。
记住n代表两个样本中每个样本的大小。对于每个i=1,2,...,n,项xᵢ-x_mean和yᵢ-y_mean计算样本元素与样本平均值之间的差异。在协方差公式中,这两项相乘,然后在所有样本元素上求和,最后通过除以n(每个样本的大小)来平均。
如何计算协方差的示例
我们现在将通过查看协方差公式在现实示例中的工作原理来更深入地了解计算的细节。
约翰是一位投资者,刚刚购买了他在"Cool Places"(一家专门从事极地度假的公司)的第一批股票。但是,正如每个聪明的投资者所知,约翰应该分散他的投资组合,所以他决定购买"Star Dust"和"Time Travel Vacations"这两家旅行社中的一些股票。但他无法决定购买哪些股票。他应该怎么做?
逐步计算:
1. 通过将第二列中的值相加并除以样本大小n=5来计算"Cool Places"股票收盘价的平均值。对第三列中的"Star Dust"股票价格执行相同操作:x_mean = 12.666和y_mean = 7.016。
2. 通过从行中列出的股票价格中减去相应的平均值x_mean和y_mean来完成第四列和第五列:x_diff = xᵢ - x_mean和y_diff = yᵢ - y_mean。
3. 通过简单地将第四列和第五列中的相应数字相乘来填写第六列。
4. 最后,当您将第六列中的所有数字相加并将总和除以样本大小(在这种情况下为n=5)时,您得到样本协方差:Cov_sample(x,y) = 0.0483!
使用协方差计算器检查此结果,并继续阅读以了解如何解释这个数字。
如何解释协方差
请注意,协方差值本身并没有特别的意义,尽管我们仍然可以做一些重要的评论。
正协方差: 如果协方差为正,两个样本的观测值相对于它们的平均值倾向于表现出相似的行为。要么它们都高于相应的均值,要么都低于均值。因此,它们偏离平均值的方式是相似的。
负协方差: 在负协方差的情况下,样本通常表现出相反的方式。当一个观测值低于其样本平均值时,另一个样本的相应观测值高于其平均值,反之亦然。但是,我们可以说样本仍然相关,尽管方式与正协方差情况不同。
此外,协方差离零越远,样本越相关,而接近零的协方差值表明样本变化之间没有强烈的关系。
这对约翰的分散化策略意味着什么?如果他购买与他已有股票相比协方差接近零的股票,他可能会更好。为什么?因为这样他就知道第二只股票不太可能与第一只股票同时变化。
方差和相关性与协方差
协方差是两个随机变量X和Y之间变异性的度量,而方差度量特定随机变量本身的变化程度。如果您想了解更多细节,请访问我们的方差计算器。
以下是这两个量之间的关系:因此,X的方差正是X与自身之间的协方差!
表达两个随机变量之间变异性的另一种方法是通过随机变量X和Y之间的相关性。相关性和协方差之间的关系是:
其中σX和σY是随机变量X和Y的标准差。您可以将相关性视为协方差的标准化版本:上述公式保证相关性必须在-1和1之间。这个属性是相关性比协方差更经常和更容易使用的原因,尽管它们做类似的工作。
常见问题
如何从样本估计总体协方差?
在实际情况下,我们可以访问的样本代表更大的总体。幸运的是,即使从有限的样本中,我们也可以通过以下公式估计整个总体中的协方差:分母这里是n-1,这将给出比原始协方差公式稍高的结果。我们直觉上确实期望这种情况发生,因为有限样本通常不能反映整个总体之间的总变异性。
协方差的直观解释是什么?
协方差公式背后的想法实际上非常简单:我们想要测量两个样本的数据一起变化的程度。如果协方差为正,表示变量倾向于同向变化;如果为负,表示变量倾向于反向变化;如果接近零,表示变量之间没有线性关系。
参数名 | 参数类型 | 默认值 | 是否必传 | 描述 |
---|---|---|---|---|
precision | integer | 4 | 否 | 结果保留的小数位数 |
sampleY | array | [7.2,6.8,7.5,6.9,7.1] | 否 | 第二个样本的观测值数组,需要与样本X具有相同的数据长度 |
sampleX | array | [12.5,13.2,11.8,14.1,12.0] | 否 | 第一个样本的观测值数组,可以是股票价格、测量数据等数值序列 |
参数名 | 参数类型 | 默认值 | 描述 |
---|---|---|---|
varianceY | number | 第二个样本的方差值 | |
correlation | number | 标准化后的协方差,取值范围为-1到1之间 | |
covariance | number | 计算得出的协方差结果 | |
meanY | number | 第二个样本的算术平均值 | |
meanX | number | 第一个样本的算术平均值 | |
sampleSize | integer | 参与计算的样本数据点数量 | |
varianceX | number | 第一个样本的方差值 |
错误码 | 错误信息 | 描述 |
---|---|---|
FP00000 | 成功 | |
FP03333 | 失败 |
参考上方对接示例