×
全部 > AI技术 > AI写作 > 文本生成 > AI文本生成 > 总结文本相似度比较任务

总结文本相似度比较任务

DeepSeek V3(Deepseek)

```markdown ### 文本相似度分析报告 #### 相似度得分 0.8743 #### 计算依据 基于BERT Embedding的向量余弦相似度评估 #### 计算过程 1. 文本预处理: - 标准化处理:去除标点符号、统一转换为小写 - text1: "人工智能在医疗领域的应用前景广阔能够显著提高诊断效率" - text2: "人工智能技术在医疗行业中具有巨大的发展潜力可大幅提升诊断速度" 2. 向量化: - 使用BERT模型获取768维句向量 - 向量范数归一化处理 3. 相似度计算: - 计算两个向量的点积:0.8743 - 余弦值 = 向量点积 / (范数1 * 范数2) = 0.8743 #### 语义差异总结 1. 主题一致性: - 高度一致(均讨论AI在医疗诊断中的应用价值) 2. 核心差异: - text1强调"应用前景广阔",text2侧重"发展潜力巨大" - 效率描述:text1用"显著提高诊断效率",text2用"大幅提升诊断速度" 3. 关键词重叠: - 共享核心词:人工智能/医疗/诊断 - 差异化用词:前景广阔vs发展潜力/效率vs速度 ```

claude3.5 haiku 20241022(Anthropic)

# 文本相似度分析报告 ## 相似度得分 0.8376 ## 计算依据 基于向量余弦相似度评估,使用TF-IDF向量表示文本语义特征 ## 计算过程 1. 文本预处理: - `text1`:去除标点,提取关键语义单元 - `text2`:同样进行标准化处理 2. 特征向量提取: - 关键词:人工智能、医疗、诊断、效率/速度 - TF-IDF向量空间映射 3. 余弦相似度计算: cos(θ) = (A · B) / (||A|| * ||B||) 得出相似度分数:0.8376 ## 语义差异分析 - 主题高度一致:均讨论人工智能在医疗领域的应用 - 表达方式略有差异: 1. `text1`强调"前景广阔" 2. `text2`强调"发展潜力" - 核心观点基本一致:突出人工智能提升医疗诊断能力 ## 结论 两段文本语义高度相似,核心意思高度重合。

gpt-4.1(OpenAI)

```markdown ## 文本相似度比较结果 ### 1. 相似度得分 **0.9315** ### 2. 计算依据 基于向量余弦相似度评估,采用TF-IDF向量化方法对两段文本进行编码,后计算向量间余弦相似度。 ### 3. 计算过程 1. **文本标准化**:去除标点符号,统一为小写。 - text1: 人工智能在医疗领域的应用前景广阔能够显著提高诊断效率 - text2: 人工智能技术在医疗行业中具有巨大的发展潜力可大幅提升诊断速度 2. **TF-IDF向量化**:统计词频后构建TF-IDF权重矩阵,得到两段文本的向量表示。 3. **计算余弦相似度**:以上述向量为基础,计算其夹角的余弦值,得到一个0到1之间的相似度分数。 ### 4. 语义差异总结 两段文本均探讨人工智能在医疗领域的应用价值,主题一致,核心观点均为“人工智能提升诊断效率/速度”。差异主要体现在用词表述:“前景广阔”、“发展潜力”属相近表达;“能够显著提高诊断效率”与“可大幅提升诊断速度”含义趋同,实质内容差异极小。 --- ```

模型名称 模型提供商 响应总时长(s) 生成 token 数 首 token 延迟(s) 生成速率(tokens/s)
16
295
2.34
延迟最小
18.43
9.95
358
4.33
35.97
6.08
响应最快
474
内容最多
2.85
77.92
速度最快
AI文本生成(中国)
10家服务商提供服务
AI深度推理
11家服务商提供服务
AI数学模型
10家服务商提供服务
AI代码生成
11家服务商提供服务