![]() |
阿里云云原生数据仓库
专用API
【更新时间: 2024.08.12】
云原生数据仓库AnalyticDB PostgreSQL版(原HybridDB for PostgreSQL)提供简单、快速、经济高效的PB级云端数据仓库解决方案。
1756.3元/月
去服务商官网采购>
|
浏览次数
21
采购人数
0
试用次数
0
收藏
×
完成
取消
×
书签名称
确定
|

- API详情
- 定价
- 使用指南
- 常见 FAQ
- 关于我们
- 相关推荐


什么是阿里云云原生数据仓库?
云原生数据仓库AnalyticDB PostgreSQL版(原HybridDB for PostgreSQL)提供简单、快速、经济高效的PB级云端数据仓库解决方案。兼容Greenplum开源数据仓库,MPP全并行架构,广泛兼容PostgreSQL/Oracle的语法生态,新一代向量引擎性能超越传统数据库引擎10倍以上,分布式SQL优化器实现复杂查询语句免调优。实现了对海量数据的即席查询分析、ETL 处理及可视化探索,是各行业有竞争力的云上数据仓库解决方案。
什么是阿里云云原生数据仓库接口?
阿里云云原生数据仓库有哪些核心功能?
1. 易适配,免调优
支持SQL 2003,部分兼容Oracle语法,支持PL/SQL存储过程。新一代SQL优化器,实现复杂分析语句免调优。
2. PB级数据秒级分析
MPP水平扩展架构,支持PB级数据查询秒级响应。向量化计算及列存储智能索引,相比较传统数据库引擎在性能方面约有十倍的提升。
3. 高可用,服务永远在线
支持分布式事务,数据ACID一致性支持,所有节点和数据跨机器冗余部署,具备自动化监控和故障切换机制,确保在任何硬件故障情况下服务能持续在线。
4. 广泛生态兼容
支持主流BI、ETL工具。通过PostGIS插件支持地理信息数据分析,MADlib库内置超过300个机器学习算法库。
5. 数据互联互通
支持通过DTS、DataWorks等工具,实现多种数据源的实时同步与批量导入;支持高并发访问OSS,构建数据湖分析。
阿里云云原生数据仓库的技术原理是什么?
AnalyticDB for PostgreSQL分为存储弹性模式和Serverless两种产品形态。存储弹性模式是基于ECS+ESSD云盘的Shared-Nothing架构采用MPP架构,Serverless是基于ECS+本地缓存+OSS远端存储的存储计算分离的Shared-Storage架构。
AnalyticDB for PostgreSQL实例包含一个协调节点(又称Master节点)和多个工作节点(又称Segment节点)。协调节点负责集群的元数据管理、负载均衡等。工作节点负责数据处理,工作节点内部包含Orca优化器、自研的Laser执行引擎和Beam存储引擎,实现查询的高性能,同时结合IMV实时物化视图组件,打造实时数仓。工作节点挂载的ESSD云盘负责热数据存储,而冷数据则存储在OSS中,通过冷热数据分层存储,兼顾查询性能和存储成本。工作节点的计算资源和存储资源,可独立扩缩容。
阿里云云原生数据仓库的核心优势是什么?
1. ETL离线数据处理
面对复杂SQL优化和海量数据大规模聚合分析等挑战,云原生数据仓库AnalyticDB PostgreSQL版具有如下技术优势:
-
- 支持标准SQL、OLAP窗口函数和存储过程。
- ORCA分布式SQL优化器,复杂查询免调优。
- MPP多节点全并行计算,PB级数据秒级响应。
- 基于列存储的高性能大表扫描,极高压缩比。
2. 在线高性能查询
面对任意维度数据即时探索和数据实时入库更新等挑战,云原生数据仓库AnalyticDB PostgreSQL版具有如下技术优势:
-
- 高吞吐数据写入及更新(如INSERT、UPDATE、DELETE)。
- 行存储及多种索引(如B-tree、Bitmap),点查询毫秒级返回。
- 支持分布式事务,标准数据库隔离级别,支持HTAP混合负载。
3. 多模数据分析
面对多种非结构化数据源的挑战,云原生数据仓库AnalyticDB PostgreSQL版具有如下技术优势:
-
- 支持PostGIS插件扩展,实现地理数据分析处理。
- 通过MADlib插件扩展,内置多种机器学习算法,实现AI Native DB。
- 支持通过向量检索,实现非结构化数据(如图片、语音、文本)的高性能检索分析。
- 支持JSON等格式,支持日志等半结构化数据处理分析。
在哪些场景会用到阿里云云原生数据仓库?
1. 数据仓库服务
您可以通过数据传输服务(DTS)或数据集成服务(DataX),将云数据库(例如RDS、PolarDB)或自建数据库批量同步到云原生数据仓库AnalyticDB PostgreSQL版。云原生数据仓库PostgreSQL版支持对海量数据的复杂ETL进行处理,这些操作任务也可以被DataWorks调度。同时它还支持高性能的在线分析能力,可以通过Quick BI、DataV、Tableau、帆软等即时查询数据,并将数据以报表形式展现。
2. 大数据分析平台
对于MaxCompute、Hadoop和Spark中保存的海量数据,可通过采用数据集成服务(DataX)或通过对象存储服务(OSS),快速批量导入到云原生数据仓库AnalyticDB PostgreSQL版,帮助您实现高性能分析处理和在线数据探索。
3. 数据湖分析
云原生数据仓库AnalyticDB PostgreSQL版可以通过外部表机制,高并行直接访问海量云存储OSS上的数据,构筑阿里云统一数据湖分析平台。

