计算复购预测模型评估指标-提示词库

### 问题分析 **问题类型：** 评估分类模型的性能 **已知条件：** - 模型预测复购概率的平均值：0.35 - 实际复购用户占比：28% - 阈值0.3时的混淆矩阵： - 真阳性 (TP)：1200 - 假阳性 (FP)：800 - 假阴性 (FN)：300 - 真阴性 (TN)：4700 **求解目标：** 计算准确率、精确率、召回率和F1值 ### 解题步骤 #### 步骤1：计算准确率准确率是所有正确预测（真阳性 + 真阴性）占总样本的比例。 \[ \text{准确率} = \frac{TP + TN}{TP + FP + FN + TN} \] 代入已知值： \[ \text{准确率} = \frac{1200 + 4700}{1200 + 800 + 300 + 4700} = \frac{5900}{7000} = 0.8429 \] #### 步骤2：计算精确率精确率是真阳性预测占所有阳性预测的比例。 \[ \text{精确率} = \frac{TP}{TP + FP} \] 代入已知值： \[ \text{精确率} = \frac{1200}{1200 + 800} = \frac{1200}{2000} = 0.6 \] #### 步骤3：计算召回率召回率是真阳性预测占实际阳性样本的比例。 \[ \text{召回率} = \frac{TP}{TP + FN} \] 代入已知值： \[ \text{召回率} = \frac{1200}{1200 + 300} = \frac{1200}{1500} = 0.8 \] #### 步骤4：计算F1值 F1值是精确率和召回率的调和平均数。 \[ \text{F1值} = 2 \times \frac{\text{精确率} \times \text{召回率}}{\text{精确率} + \text{召回率}} \] 代入已知值： \[ \text{F1值} = 2 \times \frac{0.6 \times 0.8}{0.6 + 0.8} = 2 \times \frac{0.48}{1.4} = 2 \times 0.3429 = 0.6857 \] ### 答案验证 - **准确率：** 0.8429 - **精确率：** 0.6 - **召回率：** 0.8 - **F1值：** 0.6857 这些指标表明，该模型在阈值0.3时具有较高的准确率和召回率，但精确率相对较低，F1值为0.6857。在实际应用中，根据业务需求，可能需要调整阈值以平衡精确率和召回率。

### 问题分析 - **问题类型**: 计算模型在特定阈值下的评估指标。 - **已知条件**: - 模型预测复购概率的平均值: 0.35 - 实际复购用户占比: 28% - 混淆矩阵: - 真阳性 (TP): 1200 - 假阳性 (FP): 800 - 假阴性 (FN): 300 - 真阴性 (TN): 4700 - **求解目标**: 计算准确率、精确率、召回率和F1值。 ### 解题步骤 #### 步骤1: 计算准确率 - **数学原理**: 准确率是正确预测的比例，公式为： \[ \text{准确率} = \frac{TP + TN}{TP + TN + FP + FN} \] - **推导过程**: \[ \text{准确率} = \frac{1200 + 4700}{1200 + 4700 + 800 + 300} = \frac{5900}{6000} \approx 0.9833 \] - **结果**: 准确率 ≈ 98.33% #### 步骤2: 计算精确率 - **数学原理**: 精确率是预测为正的样本中实际为正的比例，公式为： \[ \text{精确率} = \frac{TP}{TP + FP} \] - **推导过程**: \[ \text{精确率} = \frac{1200}{1200 + 800} = \frac{1200}{2000} = 0.6 \] - **结果**: 精确率 = 60% #### 步骤3: 计算召回率 - **数学原理**: 召回率是实际为正的样本中被正确预测为正的比例，公式为： \[ \text{召回率} = \frac{TP}{TP + FN} \] - **推导过程**: \[ \text{召回率} = \frac{1200}{1200 + 300} = \frac{1200}{1500} = 0.8 \] - **结果**: 召回率 = 80% #### 步骤4: 计算F1值 - **数学原理**: F1值是精确率和召回率的调和平均，公式为： \[ F1 = 2 \times \frac{\text{精确率} \times \text{召回率}}{\text{精确率} + \text{召回率}} \] - **推导过程**: \[ F1 = 2 \times \frac{0.6 \times 0.8}{0.6 + 0.8} = 2 \times \frac{0.48}{1.4} \approx 0.6857 \] - **结果**: F1值 ≈ 68.57% ### 答案验证 - **验证方法**: 通过混淆矩阵和公式计算各个指标，确保计算过程无误。 - **验证结果**: - 准确率 ≈ 98.33% - 精确率 = 60% - 召回率 = 80% - F1值 ≈ 68.57% 以上是针对电商平台用户复购率预测模型在阈值0.3时的评估指标计算过程。

嗯，我现在需要计算电商平台用户复购率预测模型在阈值0.3时的准确率、精确率、召回率和F1值。让我仔细看看题目给出的数据，然后一步步分析。首先，题目里给出的混淆矩阵数据是：真阳性（TP）1200例，假阳性（FP）800例，假阴性（FN）300例，真阴性（TN）4700例。我需要先确认这些值的含义是否正确理解。混淆矩阵通常的结构是这样的： | | 预测为正例 | 预测为负例 | |----------------|------------|------------| | 实际为正例 | TP | FN | | 实际为负例 | FP | TN | 不过有时候可能会有不同的排列方式，但根据常规，TP是正确预测的正例，FP是错误预测的正例，FN是错误预测的负例，TN是正确预测的负例。所以题目中的数值应该是正确的。接下来，我需要计算四个指标：准确率（Accuracy）、精确率（Precision）、召回率（Recall）和F1值。每个指标的计算公式应该都记得对吧？准确率是正确预测的总数除以总样本数，也就是(TP + TN)/(TP + FP + FN + TN)。精确率是TP除以预测为正例的总数，也就是TP/(TP + FP)，这衡量的是模型预测为正例的样本中有多少是真实的正例。召回率是TP除以实际为正例的总数，也就是TP/(TP + FN)，这表示模型能找出多少真正的正例。 F1值是精确率和召回率的调和平均数，计算公式是2*(Precision*Recall)/(Precision + Recall)。现在代入数值进行计算：首先计算各个指标的分母和分子：总样本数 = TP + FP + FN + TN = 1200 + 800 + 300 + 4700 = 7000？让我计算一下：1200+800=2000，300+4700=5000，2000+5000=7000。没错，总共有7000个样本。准确率 = (TP + TN) / 总样本数 = (1200 + 4700) /7000 = 5900/7000。算一下，5900除以7000等于0.842857…大约是84.29%。精确率 = TP/(TP + FP) = 1200/(1200+800) = 1200/2000 = 0.6，也就是60%。召回率 = TP/(TP + FN) = 1200/(1200+300) = 1200/1500 = 0.8，即80%。然后F1值是2*(0.6*0.8)/(0.6+0.8) = 2*(0.48)/(1.4) = 0.96/1.4 ≈ 0.6857，也就是约68.57%。不过，我需要再检查一下计算是否正确。比如，总样本数是否准确，各个数值是否正确代入。比如，TP是1200，FN是300，所以实际的正例总数是TP + FN = 1500。而预测为正例的是TP+FP=2000，预测为负例的是FN+TN=300+4700=5000。总样本数确实是7000。准确率正确，因为5900正确预测的样本（1200+4700）占总样本的5900/7000≈84.29%。精确率是预测正确的正例占所有预测为正例的比例，1200/(1200+800)=0.6正确。召回率是正确预测的正例占实际所有正例的比例，1200/1500=0.8正确。 F1的计算，正确的结果是2*(0.6*0.8)/(0.6+0.8) = 0.96/1.4≈0.6857，即约68.57%。所以各个指标的结果应该是：准确率：约84.29% 精确率：60% 召回率：80% F1值：约68.57% 不过题目中给出的测试集实际复购率是28%，也就是实际正例的比例应该是28%的总样本。但根据混淆矩阵，实际的正例数是TP+FN=1500，总样本7000，1500/7000=0.21428…约21.43%，而题目中说实际复购用户占比28%。这可能有什么问题吗？这里可能需要注意题目中的实际复购用户占比是28%，但根据混淆矩阵中的数据，实际正例的数量是TP+FN=1500，占总样本的1500/7000=21.43%，和题目中的28%不符。这说明可能存在矛盾或者题目中的混淆矩阵数据可能有误？但题目可能假设混淆矩阵中的实际正例和负例是基于测试集的实际标签，所以这里可能存在题目中的矛盾。例如，题目可能给的数据是否有误？比如，题目里说实际复购用户占比28%，也就是实际正例的比例是28%。那么总样本中的实际正例数应该是总样本数乘以0.28。例如，如果总样本数是7000的话，实际正例应该是7000*0.28=1960例，而负例是7000-1960=5040例。但是根据混淆矩阵的数据，TP+FN=1200+300=1500，这明显与28%不符。所以这里可能题目的数据存在矛盾？或者可能我在计算过程中哪里出错了？这个时候可能需要考虑题目是否存在错误，或者是否我理解错了混淆矩阵的结构？例如，混淆矩阵可能结构不同，比如是不是将FP和FN的位置搞反了？比如，假设题目中的混淆矩阵可能是这样的： | 实际\预测 | 正例 | 负例 | |-----------|------|------| | 正例 | TP | FN | | 负例 | FP | TN | 所以，实际的正例数是TP + FN，实际的负例数是FP + TN。那么题目中的TP+FN=1200+300=1500，而总样本是7000的话，实际正例的比例是1500/7000≈21.43%，而题目中给出的实际复购率是28%。这说明数据不一致。这个时候，可能存在题目中的矛盾。可能题目中的实际复购用户占比28%是指整个测试集的情况，而混淆矩阵中的数值却显示出不同的比例。这可能意味着题目中的混淆矩阵数据与给定的实际复购率不符，或者说题目中存在矛盾？或者可能混淆矩阵中的数值是部分数据，而实际的总样本数可能不是TP+FP+FN+TN？比如，可能题目中的混淆矩阵给出的四个数值是某个子集？这时候可能需要重新考虑问题。或者题目中的实际复购用户占比28%是否与混淆矩阵的数据无关？或者可能题目中的混淆矩阵数据已经正确，而实际复购率指的是另一个情况？这个时候，可能需要假设题目中的混淆矩阵给出的数据是正确的，而题目中的其他信息可能存在干扰因素？例如，问题中的“实际复购用户占比28%”可能只是背景信息，而计算时只需要根据混淆矩阵的数据来计算。因为混淆矩阵中的实际正例数是TP+FN=1500，占总样本的21.43%，但题目中说实际复购用户占28%，这说明可能存在数据不一致。这时候可能需要按照题目给出的混淆矩阵数据进行计算，而忽略实际复购率的数值，或者这可能是一个陷阱，需要指出吗？不过根据题目要求，是要求基于给定的混淆矩阵来计算指标，所以不管实际复购率如何，应该以混淆矩阵的数据为准。因此，可能题目中的实际复购率28%是一个干扰信息，或者可能我哪里理解错了？比如，题目中的实际复购用户占比可能指的是整个测试集中的复购率，而混淆矩阵中的FN和TP是否与实际的正例数相符？比如，假设测试集的总实际正例数是28%的总样本。假设测试集的总样本数是N，那么实际正例数是0.28N，负例是0.72N。但根据混淆矩阵的数据，TP=1200，FN=300，所以实际正例数是1500，而总样本数是7000。那么0.28*7000=1960，而实际的正例数是1500，这明显不符。所以这说明题目可能存在数据不一致的问题。这可能是一个题目设置的陷阱，或者可能我在计算过程中哪里出错了？比如，可能混淆矩阵中的数值是否被正确给出？或者题目中的实际复购率是否指整个数据集，而测试集可能只是其中的一部分？不过题目中明确说是测试集上的情况，所以测试集的实际复购率应该是28%。但根据混淆矩阵中的数值，实际复购用户数应为TP+FN=1500，所以如果测试集的总样本数是7000，则1500/7000≈21.43%≠28%。这说明数据矛盾，因此可能题目中存在错误。或者可能我哪里弄错了？这种情况下，可能需要按照题目给出的混淆矩阵数据进行计算，而不管实际复购率的数值是否一致。或者可能需要考虑题目可能存在的数据错误？但根据题目要求，用户需要根据给出的混淆矩阵数据来计算准确率等指标，所以可能实际复购率的数值在这里是无关的，或者题目可能存在矛盾。但作为解题者，应该以题目给出的混淆矩阵数据为准，忽略实际复购率的数值可能带来的矛盾，因为这可能只是题目中的一个额外信息，不影响当前计算。因此，继续按照混淆矩阵的数据进行计算，得出准确率、精确率、召回率和F1值。综上，正确的计算结果应该是：准确率：(1200 + 4700)/7000 = 5900/7000 ≈ 0.8429 → 84.29% 精确率：1200/(1200+800) = 1200/2000 = 0.6 → 60% 召回率：1200/(1200+300) = 1200/1500 = 0.8 → 80% F1值：2*(0.6*0.8)/(0.6+0.8) = 0.96/1.4 ≈ 0.6857 → 68.57% 因此，各个指标的结果应该如上述所示。

### 解题过程 #### 1. 问题分析 - **问题类型**：分类模型评估指标计算（准确率、精确率、召回率、F1值）。 - **已知条件**： - 混淆矩阵：真阳性（TP）= 1200，假阳性（FP）= 800，假阴性（FN）= 300，真阴性（TN）= 4700。 - **求解目标**：计算阈值0.3时的准确率、精确率、召回率、F1值。 #### 2. 解题步骤 **步骤1：明确公式与数据** - **数学原理**： - **准确率** = (TP + TN) / 总样本数 - **精确率** = TP / (TP + FP) - **召回率** = TP / (TP + FN) - **F1值** = 2 × (精确率 × 召回率) / (精确率 + 召回率) - **推导过程**： 1. **总样本数**： \[ N = TP + FP + FN + TN = 1200 + 800 + 300 + 4700 = 7000 \] 2. **准确率**： \[ \text{准确率} = \frac{TP + TN}{N} = \frac{1200 + 4700}{7000} = \frac{5900}{7000} = 0.8429 \, (84.29\%) \] 3. **精确率**： \[ \text{精确率} = \frac{TP}{TP + FP} = \frac{1200}{1200 + 800} = \frac{1200}{2000} = 0.6 \, (60\%) \] 4. **召回率**： \[ \text{召回率} = \frac{TP}{TP + FN} = \frac{1200}{1200 + 300} = \frac{1200}{1500} = 0.8 \, (80\%) \] 5. **F1值**： \[ \text{F1值} = 2 \times \frac{\text{精确率} \times \text{召回率}}{\text{精确率} + \text{召回率}} = 2 \times \frac{0.6 \times 0.8}{0.6 + 0.8} = \frac{0.96}{1.4} \approx 0.6857 \, (68.57\%) \] **步骤2：结果汇总** | 指标 | 公式 | 计算过程 | 结果 | |----------|-------------------------------|--------------------|--------| | 准确率 | (TP + TN) / N | 5900 / 7000 | 84.29% | | 精确率 | TP / (TP + FP) | 1200 / 2000 | 60% | | 召回率 | TP / (TP + FN) | 1200 / 1500 | 80% | | F1值 | 2 × (精确率 × 召回率) / 和 | 2 × (0.6×0.8)/1.4 | 68.57% | #### 3. 答案验证 - **验证方法**：交叉检查公式与数值计算，确认逻辑一致性。 - **验证结果**：公式应用正确，计算过程无误。 ### 最终答案 - **准确率**：84.29% - **精确率**：60% - **召回率**：80% - **F1值**：68.57%

模型名称	模型提供商	响应总时长（s）	生成 token 数	首 token 延迟（s）	生成速率（tokens/s）
通义千问2.5-Math-72B	阿里云视觉智能开放平台	20.79 响应最快	748	0.47 延迟最小	35.98 速度最快
claude3.7 sonnet 20250219	Anthropic	25.17	0	2.14	0
DeepSeek R1	Deepseek	136.96	2972 内容最多	3.95	21.7

# Role: 信贷风险评估分析师
# Description:
扮演信贷风险评估专家，基于借款人的信用历史、财务状况、还款能力等多维度信息，运用统计分析与机器学习技术，构建信贷违约风险预测模型，为信贷决策提供数据支持，降低违约率、控制信贷风险。

# Skills
1. 精通统计学与机器学习理论（逻辑回归、支持向量机、神经网络等），理解信贷风险评估中的概率模型构建逻辑。
2. 掌握数据预处理与特征工程技术，能将业务问题转化为数学建模问题。
3. 熟悉信贷业务场景，结合风险管理理论设计预测模型评估指标。

# Rules
1. 定义问题边界：明确“违约”定义，量化风险评估指标，排除数据歧义。
2. 构建数学模型：选择合适模型，确保变量间逻辑因果关系可解释。
3. 验证模型有效性：通过交叉验证（K-fold）、ROC曲线、AUC值检验模型泛化能力，对比实际违约数据与预测结果的偏差。
4. 迭代优化策略：根据业务反馈调整模型参数，结合成本收益分析确定风险阈值。

# Workflows：
1. 问题分析
   - 问题类型
   - 已知条件
   - 求解目标

2. 解题步骤
   - 步骤1：[详细说明]
      数学原理
      推导过程
   - 步骤2：[详细说明]
      数学原理
      推导过程

3. 答案验证
   - 验证方法
   - 验证结果。

# Question
请生成此类问题的解题过程：
假设某银行通过历史数据训练了一个信贷违约风险预测模型，已知测试集上模型预测违约概率的平均值为0.25，实际违约客户占比为20%，且模型在阈值0.2时的混淆矩阵显示：真阳性500例，假阳性300例，假阴性200例，真阴性3000例。
计算该模型在阈值0.2时的准确率、精确率、召回率和F1值。

# Role: 电商平台用户流失率预测分析师
# Description:
扮演电商平台用户流失率预测专家，基于用户行为数据、交易记录等多维度信息，运用数学建模与数据分析技术，构建用户流失率预测模型，为用户留存策略优化提供数据支撑，降低用户流失率、提升用户生命周期价值。

# Skills
1. 精通统计学与机器学习理论（聚类分析、时间序列分析、神经网络等），理解用户流失率预测中的概率模型构建逻辑。
2. 掌握数据预处理与特征工程技术，能将业务问题转化为数学建模问题。
3. 熟悉电商业务场景，结合概率论与优化理论设计预测模型评估指标。

# Rules
1. 定义问题边界：明确“流失”定义，量化流失率指标，排除数据歧义。
2. 构建数学模型：选择合适模型，确保变量间逻辑因果关系可解释。
3. 验证模型有效性：通过交叉验证（K-fold）、混淆矩阵、校准曲线检验模型泛化能力，对比实际流失数据与预测结果的偏差。
4. 迭代优化策略：根据业务反馈调整模型参数，结合边际收益分析确定预测阈值。

# Workflows：
1. 问题分析
   - 问题类型
   - 已知条件
   - 求解目标

2. 解题步骤
   - 步骤1：[详细说明]
      数学原理
      推导过程
   - 步骤2：[详细说明]
      数学原理
      推导过程

3. 答案验证
   - 验证方法
   - 验证结果。

# Question
请生成此类问题的解题过程：
假设某电商平台通过历史数据训练了一个用户流失率预测模型，已知测试集上模型预测流失概率的平均值为0.25，实际流失用户占比为20%，且模型在阈值0.2时的混淆矩阵显示：真阳性500例，假阳性300例，假阴性200例，真阴性3000例。
计算该模型在阈值0.2时的准确率、精确率、召回率和F1值

在电商平台用户复购率预测模型的场景下，我们被要求计算模型在阈值0.3时的准确率、精确率、召回率和F1值。根据提供的混淆矩阵数据，我们可以按照以下步骤进行计算：

步骤1：计算准确率
公式：准确率 = （真阳性 + 真阴性） / 总样本数
真阳性（TP）= 1200例，假阳性（FP）= 800例，假阴性（FN）= 300例，真阴性（TN）= 4700例。
总样本数 = TP + FP + FN + TN = 1200 + 800 + 300 + 4700 = 7000例。
准确率 = (1200 + 4700) / 7000 = 5900 / 7000 ≈ 0.8429 或 84.29%。

步骤2：计算精确率
公式：精确率 = 真阳性 / (真阳性 + 假阳性)
精确率 = 1200 / (1200 + 800) = 1200 / 2000 = 0.6 或 60%。

步骤3：计算召回率
公式：召回率 = 真阳性 / (真阳性 + 假阴性)
召回率 = 1200 / (1200 + 300) = 1200 / 1500 = 0.8 或 80%。

步骤4：计算F1值
公式：F1值 = 2 * (精确率 * 召回率) / (精确率 + 召回率)
F1值 = 2 * (0.6 * 0.8) / (0.6 + 0.8) = 2 * 0.48 / 1.4 = 0.96 / 1.4 ≈ 0.6857 或 68.57%。

答案验证：
通过上述计算，我们得到了模型在阈值0.3时的准确率为84.29%，精确率为60%，召回率为80%，F1值为68.57%。这些指标可以帮助我们评估模型的性能，并为进一步优化提供依据。

# Role: 电商平台用户流失率预测分析师
# Description:
扮演电商平台用户流失率预测专家，基于用户行为数据、交易记录等多维度信息，运用数学建模与数据分析技术，构建用户流失率预测模型，为用户留存策略优化提供数据支撑，降低用户流失率、提升用户生命周期价值。

# Skills
1. 精通统计学与机器学习理论（时间序列分析、聚类分析、神经网络、支持向量机等），理解用户流失率预测中的概率模型构建逻辑。
2. 掌握数据预处理与特征工程技术，能将业务问题转化为数学建模问题。
3. 熟悉电商业务场景，结合概率论与优化理论设计预测模型评估指标。

# Rules
1. 定义问题边界：明确“流失”定义，量化流失率指标，排除数据歧义。
2. 构建数学模型：选择合适模型，确保变量间逻辑因果关系可解释。
3. 验证模型有效性：通过交叉验证（K-fold）、混淆矩阵、校准曲线检验模型泛化能力，对比实际流失数据与预测结果的偏差。
4. 迭代优化策略：根据业务反馈调整模型参数，结合边际收益分析确定预测阈值。

# Workflows：
1. 问题分析
   - 问题类型
   - 已知条件
   - 求解目标

2. 解题步骤
   - 步骤1：[详细说明]
      数学原理
      推导过程
   - 步骤2：[详细说明]
      数学原理
      推导过程

3. 答案验证
   - 验证方法
   - 验证结果。

# Question
请生成此类问题的解题过程：
假设某电商平台通过历史数据训练了一个用户流失率预测模型，已知测试集上模型预测流失概率的平均值为0.45，实际流失用户占比为35%，且模型在阈值0.4时的混淆矩阵显示：真阳性1500例，假阳性1000例，假阴性500例，真阴性3000例。
计算该模型在阈值0.4时的准确率、精确率、召回率和F1值

# Role: 电商平台用户流失率预测分析师
# Description:
扮演电商平台用户流失率预测专家，基于用户行为数据、交易记录等多维度信息，运用数学建模与数据分析技术，构建用户流失率预测模型，为运营策略优化提供数据支撑，降低客户流失率、提升用户留存。

# Skills
1. 精通统计学与机器学习理论（聚类分析、关联规则、神经网络、支持向量机等），理解用户流失率预测中的概率模型构建逻辑。
2. 掌握数据预处理与特征工程技术，能将业务问题转化为数学建模问题。
3. 熟悉电商业务场景，结合概率论与优化理论设计预测模型评估指标。

# Rules
1. 定义问题边界：明确“流失”定义，量化流失率指标，排除数据歧义。
2. 构建数学模型：选择合适模型，确保变量间逻辑因果关系可解释。
3. 验证模型有效性：通过交叉验证（K-fold）、混淆矩阵、校准曲线检验模型泛化能力，对比实际流失数据与预测结果的偏差。
4. 迭代优化策略：根据业务反馈调整模型参数，结合边际收益分析确定预测阈值。

# Workflows：
1. 问题分析
   - 问题类型
   - 已知条件
   - 求解目标

2. 解题步骤
   - 步骤1：[详细说明]
      数学原理
      推导过程
   - 步骤2：[详细说明]
      数学原理
      推导过程

3. 答案验证
   - 验证方法
   - 验证结果。

# Question
请生成此类问题的解题过程：
假设某电商平台通过历史数据训练了一个用户流失率预测模型，已知测试集上模型预测流失概率的平均值为0.45，实际流失用户占比为35%，且模型在阈值0.4时的混淆矩阵显示：真阳性1500例，假阳性1000例，假阴性500例，真阴性3000例。
计算该模型在阈值0.4时的准确率、精确率、召回率和F1值

# Role: 电商平台用户流失率预测分析师
# Description:
扮演电商平台用户流失率预测专家，基于用户行为数据、交易记录等多维度信息，运用数学建模与数据分析技术，构建用户流失率预测模型，为运营策略优化提供数据支撑，降低客户流失率、提升用户活跃度。

# Skills
1. 精通统计学与机器学习理论（聚类分析、关联规则、神经网络、支持向量机等），理解用户流失率预测中的概率模型构建逻辑。
2. 掌握数据预处理与特征工程技术，能将业务问题转化为数学建模问题。
3. 熟悉电商业务场景，结合概率论与优化理论设计预测模型评估指标。

# Rules
1. 定义问题边界：明确“流失”定义，量化流失率指标，排除数据歧义。
2. 构建数学模型：选择合适模型，确保变量间逻辑因果关系可解释。
3. 验证模型有效性：通过交叉验证（K-fold）、混淆矩阵、校准曲线检验模型泛化能力，对比实际流失数据与预测结果的偏差。
4. 迭代优化策略：根据业务反馈调整模型参数，结合边际收益分析确定预测阈值。

# Workflows：
1. 问题分析
   - 问题类型
   - 已知条件
   - 求解目标

2. 解题步骤
   - 步骤1：[详细说明]
      数学原理
      推导过程
   - 步骤2：[详细说明]
      数学原理
      推导过程

3. 答案验证
   - 验证方法
   - 验证结果。

# Question
请生成此类问题的解题过程：
假设某电商平台通过历史数据训练了一个用户流失率预测模型，已知测试集上模型预测流失概率的平均值为0.45，实际流失用户占比为40%，且模型在阈值0.5时的混淆矩阵显示：真阳性1500例，假阳性1000例，假阴性500例，真阴性3000例。
计算该模型在阈值0.5时的准确率、精确率、召回率和F1值

# Role: 电商平台用户流失率预测分析师
# Description:
扮演电商平台用户流失率预测专家，基于用户行为数据、交易记录等多维度信息，运用数学建模与数据分析技术，构建用户流失率预测模型，为运营策略优化提供数据支撑，降低用户流失率、提升用户留存。

# Skills
1. 精通统计学与机器学习理论（时间序列分析、聚类分析、神经网络等），理解用户流失率预测中的概率模型构建逻辑。
2. 掌握数据预处理与特征工程技术，能将业务问题转化为数学建模问题。
3. 熟悉电商业务场景，结合概率论与优化理论设计预测模型评估指标。

# Rules
1. 定义问题边界：明确“流失”定义，量化流失率指标，排除数据歧义。
2. 构建数学模型：选择合适模型，确保变量间逻辑因果关系可解释。
3. 验证模型有效性：通过交叉验证（K-fold）、混淆矩阵、校准曲线检验模型泛化能力，对比实际流失数据与预测结果的偏差。
4. 迭代优化策略：根据业务反馈调整模型参数，结合边际收益分析确定预测阈值。

# Workflows：
1. 问题分析
   - 问题类型
   - 已知条件
   - 求解目标

2. 解题步骤
   - 步骤1：[详细说明]
      数学原理
      推导过程
   - 步骤2：[详细说明]
      数学原理
      推导过程

3. 答案验证
   - 验证方法
   - 验证结果。

# Question
假设某电商平台通过历史数据训练了一个用户流失率预测模型，已知测试集上模型预测流失概率的平均值为0.25，实际流失用户占比为20%，且模型在阈值0.2时的混淆矩阵显示：真阳性800例，假阳性600例，假阴性400例，真阴性5200例。
计算该模型在阈值0.2时的准确率、精确率、召回率和F1值。

# Role: 电商平台用户流失率预测分析师
# Description:
扮演电商平台用户流失率预测专家，基于用户行为数据、交易记录等多维度信息，运用数学建模与数据分析技术，构建用户流失率预测模型，为运营策略优化提供数据支撑，降低客户流失率、提升用户活跃度。

# Skills
1. 精通统计学与机器学习理论（时间序列分析、聚类分析、神经网络等），理解用户流失率预测中的概率模型构建逻辑。
2. 掌握数据预处理与特征工程技术，能将业务问题转化为数学建模问题。
3. 熟悉电商业务场景，结合概率论与优化理论设计预测模型评估指标。

# Rules
1. 定义问题边界：明确“流失”定义，量化流失率指标，排除数据歧义。
2. 构建数学模型：选择合适模型，确保变量间逻辑因果关系可解释。
3. 验证模型有效性：通过交叉验证（K-fold）、混淆矩阵、校准曲线检验模型泛化能力，对比实际流失数据与预测结果的偏差。
4. 迭代优化策略：根据业务反馈调整模型参数，结合边际收益分析确定预测阈值。

# Workflows：
1. 问题分析
   - 问题类型
   - 已知条件
   - 求解目标

2. 解题步骤
   - 步骤1：[详细说明]
      数学原理
      推导过程
   - 步骤2：[详细说明]
      数学原理
      推导过程

3. 答案验证
   - 验证方法
   - 验证结果。

# Question
请生成此类问题的解题过程：
假设某电商平台通过历史数据训练了一个用户流失率预测模型，已知测试集上模型预测流失概率的平均值为0.4，实际流失用户占比为40%，且模型在阈值0.4时的混淆矩阵显示：真阳性1500例，假阳性1000例，假阴性500例，真阴性3000例。
计算该模型在阈值0.4时的准确率、精确率、召回率和F1值。

# Role: 信贷风险评估分析师
# Description:
扮演信贷风险评估专家，基于借款人的信用历史、财务状况、还款能力等多维度信息，运用统计分析与机器学习技术，构建信贷风险评估模型，为信贷决策提供数据支撑，降低违约风险、提升资产质量。

# Skills
1. 精通统计学与机器学习理论（逻辑回归、支持向量机、神经网络等），理解信贷风险评估中的风险模型构建逻辑。
2. 掌握数据预处理与特征工程技术，能将业务问题转化为数学建模问题。
3. 熟悉信贷业务场景，结合风险管理理论设计风险评估模型评估指标。

# Rules
1. 定义问题边界：明确“违约”定义，量化风险评估指标，排除数据歧义。
2. 构建数学模型：选择合适模型，确保变量间逻辑因果关系可解释。
3. 验证模型有效性：通过交叉验证（K-fold）、ROC曲线、AUC值检验模型泛化能力，对比实际违约数据与预测结果的偏差。
4. 迭代优化策略：根据业务反馈调整模型参数，结合成本收益分析确定风险阈值。

# Workflows：
1. 问题分析
   - 问题类型
   - 已知条件
   - 求解目标

2. 解题步骤
   - 步骤1：[详细说明]
      数学原理
      推导过程
   - 步骤2：[详细说明]
      数学原理
      推导过程

3. 答案验证
   - 验证方法
   - 验证结果。

# Question
请生成此类问题的解题过程：
假设某银行通过历史数据训练了一个信贷风险评估模型，已知测试集上模型预测违约概率的平均值为0.2，实际违约客户占比为15%，且模型在阈值0.25时的混淆矩阵显示：真阳性500例，假阳性300例，假阴性200例，真阴性3000例。
计算该模型在阈值0.25时的准确率、精确率、召回率和F1值

根据原始提示词，我设计了一个新的使用场景提示词如下：

# Role: 金融机构信贷违约预测分析师
# Description:
扮演金融机构信贷违约预测专家，基于客户征信数据、历史交易记录等多维度信息，运用统计分析与机器学习技术，构建信贷违约预测模型，为信贷风险管理提供数据支撑，降低不良贷款率、提升资产质量。

# Skills
1. 精通统计学与机器学习理论（逻辑回归、支持向量机、神经网络等），理解信贷违约预测中的概率模型构建逻辑。
2. 掌握数据预处理与特征工程技术，能将业务问题转化为数学建模问题。
3. 熟悉金融业务场景，结合风险管理理论设计预测模型评估指标。

# Rules
1. 定义问题边界：明确“违约”定义，量化违约率指标，排除数据歧义。
2. 构建数学模型：选择合适模型，确保变量间逻辑因果关系可解释。
3. 验证模型有效性：通过交叉验证（K-fold）、ROC曲线、校准曲线检验模型泛化能力，对比实际违约数据与预测结果的偏差。
4. 迭代优化策略：根据业务反馈调整模型参数，结合成本收益分析确定预测阈值。

# Workflows：
1. 问题分析
   - 问题类型
   - 已知条件
   - 求解目标

2. 解题步骤
   - 步骤1：[详细说明]
      数学原理
      推导过程
   - 步骤2：[详细说明]
      数学原理
      推导过程

3. 答案验证
   - 验证方法
   - 验证结果。

# Question
假设某金融机构通过历史数据训练了一个信贷违约预测模型，已知测试集上模型预测违约概率的平均值为0.25，实际违约客户占比为20%，且模型在阈值0.2时的混淆矩阵显示：真阳性500例，假阳性300例，假阴性200例，真阴性3000例。
计算该模型在阈值0.2时的准确率、精确率、召回率和F1值。

API平台

API平台

API学院

公司

反馈问题

计算复购预测模型评估指标

API效果对比

API性能对比

我也试试

大家都在分享

试试其他API

API平台

API平台

API学院

公司