所有文章 > 当前标签:Gateway API
使用Kubernetes网关API将您的自动化推向高速。..
2025/10/31
Kubernetes Gateway API 的全面可用性标志着云原生生态系统的重要里程碑,通过 Gloo Gateway 与 ExternalDNS、Cert Manager 和 Argo Rollouts 等工具集成,实现应用程序部署和流量管理的全自动化,包括 DNS 设置、TLS 证书管理和金丝雀部署,提升操作效率和社区协同效应。
从Ingress Controller迁移到Gateway API
【API开发工具】
本文探讨从Ingress Controller迁移到Gateway API的演变过程,分析Ingress的局限性如缺乏高级流量管理功能,并介绍Gateway API的模块化设计、协议无关性和内置支持蓝绿部署等优势。重点讨论NGINX Gateway Fabric如何结合NGINX性能与Gateway API功能,帮助用户评估迁移决策,适用于复杂Kubernetes网络场景。
2025/10/28
Kubernetes Gateway API 正式稳定:服务网格流量路由全解析(2025)
【API开发工具】
Gateway API的稳定版发布为Kubernetes流量管理带来了重要里程碑,支持服务网格用例,提供更强大的流量管理能力。本文详细介绍了Gateway API的功能、使用方法及如何选择合适的API,帮助用户简化流量管理,提升服务网格的灵活性和可扩展性。
2025/09/21
深入了解 Gateway API 的推理扩展
【学习各类API】
本文深入探讨了 Gateway API 推理扩展在 Kubernetes 上运行 AI 推理工作负载时的应用。该项目引入了两个新的自定义资源定义(CRD):InferenceModel 和 InferencePool,以及端点选择器概念,旨在通过智能路由和负载均衡优化 GPU 和 LLM 的利用率。这些功能显著提高了请求处理效率,为组织节省成本。推理扩展项目的设计使得能够以‘模型即服务’的方式自托管 GenAI/LLM,提高 AI 推理的灵活性和性能。
2025/06/19
更智能的Kubernetes AI推理路由:Gateway API推理扩展
【日积月累】
本文介绍了如何通过 Kubernetes Gateway API 推理扩展优化 AI 工作负载路由。传统的负载均衡策略难以处理 AI 推理请求,导致 GPU 使用率低和延迟增加。Gateway API 推理扩展引入了 InferenceModel 和 InferencePool 两个 CRD,以实现推理感知的路由决策,从而提高资源利用率和性能。通过智能流量管理,确保请求分配到最佳的 GPU 实例,实现更高效的 AI 模型服务。
2025/04/08
搜索文章