- API介绍
- API接口
- 定价


余弦相似度计算器
余弦相似度计算器将教您有关余弦相似度度量的一切,它在机器学习和其他数据科学领域中广泛使用。以下是如何使用此余弦相似度计算器的方法:依次将您的向量 a 和 b 的元素输入到计算器中。根据需要,更多字段将会出现。空字段被视为0。向量将自动扩展以匹配长度。余弦相似度 SC(及派生值,如向量之间的角度 θ 和余弦距离 DC)将显示在向量输入下方。用于寻找余弦相似度的计算将在结果下方显示,以便您理解特定结果。
余弦相似度度量通过两向量之间角度的余弦来指示它们的相似程度。它没有给出向量比较大小的信息。余弦相似度在数据分析和数据科学中广泛使用,尤其是在自然语言处理领域。
如何计算余弦相似度?
要计算两个向量a和b之间的余弦相似度,请按照以下步骤操作:
- 如果已知向量之间的角度,余弦相似度即为该角度的余弦。
- 如果不知道角度,计算两向量的点积。
- 计算两个向量的模。
- 将点积除以模的乘积,结果就是余弦相似度。
请查看我们的点积计算器和向量模计算器以获得更多信息。
余弦相似度公式
其中,S_C 表示余弦相似度,向量 a 和 b 的点积为 a 对 b 的投影。向量 a 的模与向量 b 的模是作为实数的模。
余弦相似度的例子
假设有两个二维向量 a=[1,5] 和 b=[-1,3]。要计算它们的余弦相似度,请执行以下步骤:
计算过程:
点积计算为:1*(-1) + 5*3 = 14。
向量 a 的模:sqrt(1^2 + 5^2) = 5.099。
向量 b 的模:sqrt((-1)^2 + 3^2) = 3.162。
余弦相似度:14 / (5.099 * 3.162) approx 0.868。
因此,我们可以得出结论,这两个向量的余弦相似度约为0.868。
实际应用
余弦相似度在文本分析和推荐系统中应用广泛。该API的核心功能是计算输入的两个向量间的余弦相似度值,并提供夹角和余弦距离的结果。它能自动处理输入向量长度不对齐的问题,对空值进行默认处理为零,简化用户的操作体验。
这种计算方法特别适用于需要分析向量间相似性的场合,如文本查询相似性、推荐系统中物品的相似性等场景。
其他相关概念
余弦相似度是一种通过计算两向量夹角的余弦来衡量它们相似性的方法。它基于向量的点积和模,适用于自然语言处理和数据挖掘领域。与传统的欧氏距离不同,余弦相似度不考虑向量的大小,只关注其方向。因此,它对于文本的数据分析特别有用。
余弦相似度的值范围在[-1, 1]之间,1表示两个向量同方向,0表示正交,-1表示方向相反。正值表示向量有某种程度的相似性,而负值则表示更大的不相似性。
常见问题
从 100 到 10 的百分比减少是多少?
从 100 到 10 的百分比减少等于 90%。确实,我们得到:(100 - 10) / 100 = 0.9 和 0.9 × 100% = 90%,正如我们所述。
从 5000 到 1000 的百分比减少是多少?
从 5000 到 1000 的百分比减少等于 80%。确实,我们得到:(5000 - 1000) / 5000 = 0.8 和 0.8 × 100% = 80%,正如我们所述。
参数名 | 参数类型 | 默认值 | 是否必传 | 描述 |
---|---|---|---|---|
vectorA | array | [1,2,3] | 否 | 第一个输入向量,各元素默认单位为实数 |
vectorB | array | [4,5,6] | 否 | 第二个输入向量,各元素默认单位为实数 |
参数名 | 参数类型 | 默认值 | 描述 |
---|---|---|---|
cosineDistance | number | 0.0 | 两个输入向量之间的余弦距离,表示不相似程度 |
angle | number | 0.0 | 两个向量之间的夹角,单位为度 |
cosineSimilarity | number | 0.0 | 两个输入向量之间的余弦相似度值 |
错误码 | 错误信息 | 描述 |
---|---|---|
FP00000 | 成功 | |
FP03333 | 失败 |
参考上方对接示例