SSIS 使用 Salesforce Bulk API 高效查询大数据指南

作者:API传播员 · 2025-10-11 · 阅读时间:4分钟
本文介绍了如何在SSIS中使用Bulk API高效查询Salesforce数据,以解决传统SOAP API在处理大量数据时的性能瓶颈问题。通过ZappySys SSIS PowerPack v5.5版本的批量查询模式,用户可以显著提升数据读取速度,适用于处理数百万条记录的场景。文章详细说明了从获取Salesforce凭证到读取数据的完整流程,包括创建连接、调用API创建批量读取作业、执行状态检查等步骤。

一. 背景说明

在处理大量 Salesforce 数据时,传统的 SSIS Salesforce Source 组件由于使用 SOAP API,每 2000 行数据需要分页处理,可能导致性能瓶颈。

通过 Bulk API 可以显著提升数据读取速度,特别适合处理数百万条记录的场景。


二. 使用 Bulk API 查询 Salesforce 数据的先决条件

在操作前,请确保满足以下条件:

  1. 已安装 SSIS 设计器(SQL Server Data Tools,可从微软官网下载)。
  2. 熟悉 Microsoft SQL Server Integration Services(SSIS)并具备开发基础知识。
  3. 已安装 ZappySys SSIS PowerPack
  4. (可选)计划在服务器上部署 SSIS 包时,请参考相关文档。

三. 新版特性(v5.5+)

ZappySys SSIS PowerPack v5.5+ 支持批量查询模式,相比旧版本每次仅能读取 2000 条数据的限制,新版本通过 Bulk API 支持大规模数据处理,性能显著提升。

在 SELECT 查询中启用 Salesforce Bulk API 模式

  1. 确保安装 v5.5 或更高版本的 SSIS PowerPack。
  2. 在查询任务中选择 Bulk API 模式。

四. 旧版本操作指南(v5.4.0 或更早版本)

若使用旧版本,可按以下流程操作:

  1. 调用 Bulk API:提交 SOQL 查询并获取 JobId。
  2. 检查作业状态:监测作业是否完成。
  3. 读取数据:从完成的作业中提取结果。

1. 获取 Salesforce 凭证

调用 Salesforce API 首步是获取安全凭证:

  • 使用用户名、密码和安全令牌
  • 或者使用 OAuth ClientId 和 Secret

2. 创建 Salesforce 连接

获取凭证后,可通过 SSIS UI 或组件创建 Salesforce 连接。


3. 调用创建作业接口 – 获取 JobId

建立连接后,创建批量读取作业。例如,SOQL 查询示例:

{
  "query": "SELECT Id, Name FROM Account"
}

4. 执行状态检查 – 监测 JobComplete 状态

提交作业并获取 JobId 后,需要定期检查作业状态直到完成。

  1. 在 SSIS 设计界面拖放 ZS Salesforce API Task 组件。
  2. 双击组件并配置参数(URL 中可使用变量替换实例 ID)。
  3. ZappySys 已简化此流程,无需手动循环或计时器。

5. 读取数据(压缩 CSV 格式)

作业完成后,可从 Salesforce 获取结果(CSV 格式)。建议使用支持 Salesforce API 的 SSIS 高级 CSV 源组件:

  1. 拖放 数据流任务
  2. 双击进入设计界面。
  3. 拖放 ZS CSV Source 组件并配置参数。

五. 总结

通过使用 ZappySys SSIS PowerPack 的 Bulk API 模式,可高效处理大规模 Salesforce 数据查询任务。

  • 新版批量查询功能显著提升性能
  • 适用于数百万条记录场景
  • 操作简单,集成到现有 SSIS 包中

希望本文操作指南能帮助您顺利完成 Salesforce 数据集成与优化。

原文链接: https://zappysys.com/blog/query-salesforce-data-using-bulk-api-ssis/