- API介绍
- API接口
- 定价
三次回归计算器
当您想要将三次回归模型拟合到数据集时,请使用Explinks的三次回归计算器。借助它的帮助,您将能够快速确定最能模拟您数据的三次多项式。如果您需要了解更多关于这种技术的信息,请向下滚动查找文章,我们在其中给出了三次回归公式,解释了如何手动计算三次回归,并用三次回归的例子说明了所有这些理论!
三次回归的定义
一般来说,回归是一种统计技术,它允许我们通过找到最适合观察样本的曲线来建模两个变量之间的关系。如果这条曲线对应于多项式,我们就处理多项式回归,您可以在多项式回归计算器中发现这一点。
在三次回归模型中,我们处理三次函数,即3次多项式。您可以在下面的图片中看到一个例子。这个想法与其他回归模型相同,比如线性回归(我们试图将直线拟合到数据点)或二次回归(我们处理抛物线)。您可以在专门的Explinks工具中了解更多关于它们的信息,即线性回归计算器和二次回归计算器。
既然我们现在理解了三次多项式回归模型,让我们讨论三次回归公式。
三次回归公式
为了更正式地讨论三次回归公式,我们需要引入一些符号。因此,让我们考虑一组数据点:
三次回归函数的形式为:
其中a、b、c、d是实数,称为三次回归模型的系数。如您所见,我们建模x的变化如何影响y的值。换句话说,我们在这里假设x是自变量(解释变量),y是因变量(响应变量)。
这就是三次回归方程的全部内容!现在的主要挑战是确定四个系数的实际值。为了找到三次回归模型的系数,我们通常采用最小二乘法。也就是说,我们寻找这样的a、b、c、d值,使每个数据点之间的平方距离最小化:
和三次回归方程预测的相应点:
为了确定系数,我们使用所谓的正规方程:
其中:Xᵀ — X的转置;(XᵀX)⁻¹ — XᵀX的逆;每两个矩阵之间的运算都是矩阵乘法。
三次回归示例
让我们为以下数据集找到三次回归函数:
数据点:
(0, 1), (2, 0), (3, 3), (4, 5), (5, 4)
我们逐步应用公式:
计算步骤:
1. 首先,我们确定Xᵀ
2. 接下来,我们计算XᵀX
3. 然后,我们找到(XᵀX)⁻¹
4. 最后,我们执行矩阵乘法(XᵀX)⁻¹Xᵀy
因此,最适合我们数据的三次回归函数是:
如您所见,手动找到三次线性回归公式需要进行大量计算。幸运的是,有Explinks的三次回归计算器!
如何使用这个三次回归计算器?
以下是如何使用我们的三次回归计算器的简短说明:
- 输入您的样本 — 最多30个点。请记住,计算器需要至少4个点才能将三次回归函数拟合到您的数据!
- 计算器将显示您数据的散点图和拟合到这些点的三次曲线。
- 在散点图下方,您将找到您数据的三次回归方程。
- 如果您需要更高精度计算的系数,请使用精度字段来更改有效数字的位数。
如您所见,手动找到三次回归并不那么困难,但沿途有一些挑战。为了更好地掌握如何在实践中进行所有这些计算,让我们一起解决一个三次回归的例子。
⚠️ 注意:请记住,对于一些非常特殊的数据集,XᵀX的逆可能不存在。如果发生这种情况,您无法将三次多项式回归拟合到此数据。
手动计算三次回归
现在是时候讨论如何手动计算三次回归的系数了。我们将使用投影方法,这是一种非常快速的方法,因为它使用矩阵运算。
让我们引入一些必要的符号:
矩阵定义:
• 我们让X是一个有四列和n行的矩阵,其中n是数据点的数量。我们用1填充第一列,用解释(自变量)变量的观察值x₁, ..., xₙ填充第二列,用这些观察值的平方填充第三列,用这些观察值的立方填充第四列。这个矩阵通常被称为模型矩阵。
• 我们让y是一个包含响应(因变量)变量值y₁, ..., yₙ的列向量。
• 我们让β是我们正在寻找的三次回归模型系数的列。请记住,顺序很重要 — 从顶部的a开始,以底部的d结束!
特别注意:如果d = 0,我们得到二次回归;如果c = d = 0,那么我们得到一个简单的线性回归模型。
常见问题
什么是三次回归?
三次回归是一种统计技术,它找到最适合我们数据集的三次多项式(3次多项式)。这是多项式回归的一个特例,其他例子包括简单线性回归和二次回归。
如何找到三次回归?
要计算三次回归,我们使用最小二乘法。在实践中,我们采用正规方程,它使用涉及自变量的模型矩阵X和包含因变量值的向量y。通过一系列矩阵运算,这个方程允许我们找到三次回归的系数。
什么时候使用三次回归?
当您在散点图中看到(或您有一些先验理论使您相信)您的数据遵循三次曲线时,使用三次方程。但是,请记住,我们希望我们的模型尽可能简单,所以,只要可能,尝试拟合更简单的模型,如简单线性或二次回归。
我可以将三次回归拟合到3个数据点吗?
您可以将许多(实际上是无限多)三次曲线拟合到3个数据点。您需要4个数据点才能找到唯一的三次模型。请注意,对于4个点,拟合将是完美的,即所有点都将位于曲线上!
| 参数名 | 参数类型 | 默认值 | 是否必传 | 描述 |
|---|---|---|---|---|
| positionY1 | number | 否 | 第一个数据点的纵坐标值(因变量) | |
| positionX1 | number | 否 | 第一个数据点的横坐标值(自变量) | |
| positionY2 | number | 否 | 第二个数据点的纵坐标值(因变量) | |
| positionX2 | number | 否 | 第二个数据点的横坐标值(自变量) | |
| positionY3 | number | 否 | 第三个数据点的纵坐标值(因变量) | |
| positionX3 | number | 否 | 第三个数据点的横坐标值(自变量) | |
| positionY4 | number | 否 | 第四个数据点的纵坐标值(因变量) | |
| positionX4 | number | 否 | 第四个数据点的横坐标值(自变量) | |
| precision | integer | 4 | 否 | 计算结果的有效数字位数 |
| 参数名 | 参数类型 | 默认值 | 描述 |
|---|---|---|---|
| regressionEquation | string | 完整的三次回归方程表达式 | |
| standardError | number | 回归模型的标准误差 | |
| dataPointsCount | integer | 参与计算的数据点总数 | |
| coefficientD | number | 三次回归方程中x³的系数d | |
| rSquared | number | R²值,表示模型对数据的拟合程度,范围0-1 | |
| coefficientC | number | 三次回归方程中x²的系数c | |
| coefficientB | number | 三次回归方程中x的系数b | |
| coefficientA | number | 三次回归方程中的常数项系数a |
| 错误码 | 错误信息 | 描述 |
|---|---|---|
| FP00000 | 成功 | |
| FP03333 | 失败 |
参考上方对接示例
