v2.1
v2.0
v1.0
  1. Release Notes
    1. Release Notes - 2.1.1最新
    1. Release Notes - 2.1.0
    1. Release Notes - 2.0.2
    1. Release Notes - 2.0.1
    1. Release Notes - 2.0.0
  1. 产品介绍
    1. 什么是 KubeSphere
    1. 平台功能
    1. 为什么选择 KubeSphere
    1. 架构说明
    1. 应用场景
    1. 名词解释
  1. 安装指南
    1. 安装说明
      1. 概览
      2. 网络防火墙配置
      3. 集群其它参数配置
    1. 在 Linux 快速安装 KubeSphere
      1. All-in-One 模式
      2. Multi-Node 模式
      3. 完整安装(开启所有功能组件)
    1. 在 Kubernetes 安装 KubeSphere
      1. 准备工作
      2. 在 Kubernetes 安装 KubeSphere
    1. 安装可插拔的功能组件
      1. 可插拔功能组件概览
      2. 安装应用商店
      3. 安装内置的 DevOps 系统
      4. 安装内置的日志系统
      5. 安装微服务治理组件(Service Mesh)
      6. 安装告警通知系统
      7. 安装 Metrics-server 开启 HPA
      8. 验证可插拔功能组件的安装
    1. 集群高可用配置安装
      1. 在青云安装 HA 集群
      2. 在华为云安装 HA 集群
      3. 持久化存储配置说明
    1. 相关工具与插件
      1. 安装内置 Grafana
      2. 访问 SonarQube 和 Jenkins 服务端
      3. 安装 Porter 负载均衡器插件
      4. 安装 QingCloud 负载均衡器插件
    1. 认证配置
      1. 接入 LDAP / AD 域账号(Beta)
    1. 集群运维
      1. 安装后添加新的存储类型
      2. 集群节点扩容
      3. 卸载
  1. 升级指南
    1. 升级必读
    1. All-in-One 升级
    1. Multi-node 升级
  1. 快速入门
    1. 入门必读
    1. 1. 多租户管理快速入门
    1. 2. 应用路由与服务示例
    1. 3. 创建 Wordpress 应用并发布至 K8s
    1. 4. 一键部署应用
    1. 5. 创建简单任务
    1. 6. 设置弹性伸缩 (HPA)
    1. 7. Source-to-Image
    1. 8. Binary-to-Image
    1. 9. 基于Spring Boot项目构建流水线
    1. 10. 图形化构建流水线
    1. 11. Bookinfo 微服务的灰度发布
    1. 12. 使用 Ingress-Nginx 进行灰度发布
    1. 13. 应用商店
  1. 管理员指南
    1. 多租户管理
      1. 多租户管理概述
      2. 角色权限概览
    1. 平台管理
      1. 企业空间管理
      2. 账号管理
      3. 平台角色
    1. 基础设施
      1. 服务组件
      2. 主机管理
      3. 存储类型
    1. 监控中心
      1. 监控概述
      2. 如何利用监控定位问题
      3. 集群状态监控
      4. 应用资源监控
      5. 监控策略 - 节点级别
      6. 监控消息 - 节点级别
    1. 平台设置
      1. 应用仓库
      2. 基于本地仓库搭建应用仓库部署Redis
      3. 上传应用到 KubeSphere 官方仓库
      4. 基于 GitHub 搭建自有应用仓库
      5. 邮件服务器
      6. 日志收集
      7. 添加 Fluentd 作为日志接收者
      8. 添加 Kafka 作为日志接收者
    1. 工具箱
      1. Web Kubectl
      2. 日志收集
    1. DevOps 配置
      1. 系统配置修改
      2. 上传镜像至 Harbor
      3. 流水线配置邮件服务器
      4. Jenkins 系统设置
    1. FAQ
      1. DevOps 运维FAQ
  1. 用户指南
    1. 应用
      1. 应用模板
      2. 自制应用
      3. 流量治理
      4. 熔断
    1. 工作负载
      1. 工作负载概述
      2. 部署
      3. 有状态副本集
      4. 守护进程集
      5. 任务
      6. 定时任务
      7. 设置健康检查器
      8. 工作负载管理
      9. 落盘日志收集
    1. 存储
      1. 存储概述
      2. 存储卷
      3. Local Volume 使用方法
    1. 网络与服务
      1. 服务管理
      2. 灰度发布
      3. 应用路由
    1. 监控告警
      1. 告警策略 - 工作负载级别
      2. 告警消息 - 工作负载级别
    1. 配置中心
      1. 密钥
      2. 配置
      3. 镜像仓库
    1. 项目设置
      1. 基本信息
      2. 成员角色
      3. 项目成员
      4. 外网访问
    1. DevOps 工程
      1. DevOps 工程概述
      2. 管理 DevOps 工程
      3. 流水线
      4. 凭证管理
      5. 添加代码仓库
      6. 访问 SonarQube 并创建 Token
      7. 设置自动触发扫描
      8. Jenkins Agent 说明
      9. 流水线常见问题
  1. 开发者指南
    1. Helm 应用开发
      1. 开发模板规范
      2. Helm 应用开发入门
    1. Source to Image(S2I) 自定义模版开发
      1. S2I 原理及流程介绍
      2. 自定义 S2I 模版
  1. API 文档
    1. API 文档
    1. 如何调用 API
    1. API 常用术语对照
    1. 监控指标说明
  1. 常见问题
    1. 安装常见问题
    1. 存储常见问题
    1. 控制台使用常见问题
    1. DevOps 常见问题
  1. 附录
    1. 部署 Ceph 存储服务端
    1. 部署 GlusterFS 存储服务端
    1. 安装 OpenEBS 创建 LocalPV 存储类型
    1. 云平台配置端口转发和防火墙
KubeSphere®️ 2020 All Rights Reserved.

设置弹性伸缩

编辑

Pod 弹性伸缩 (HPA) 是 v2.0 新增的功能,应用的资源使用率通常都有高峰和低谷的时候,如何动态地根据资源使用率来削峰填谷,提高集群的平台和集群资源利用率,让 Pod 副本数自动调整呢?这就有赖于 Horizontal Pod Autoscaling 了,顾名思义,能够使 Pod 水平自动伸缩,也是最能体现 KubeSphere 之于传统运维价值的地方,用户无需对 Pod 手动地水平扩缩容 (Scale out/in)。HPA 仅适用于创建部署 (Deployment) 时或创建部署后设置,支持根据集群的监控指标如 CPU 使用率和内存使用量来设置弹性伸缩,当业务需求增加时,KubeSphere 能够无缝地自动水平增加 Pod 数量,提高系统的稳定性。

弹性伸缩工作原理

HPA 在 Kubernetes 中被设计为一个 Controller,可以在 KubeSphere 中通过简单的设置或通过 UI 的 kubectl autoscale 命令来创建。HPA Controller 默认每 30 秒 轮询一次,检查工作负载中指定的部署 (Deployment) 的资源使用率,如 CPU 使用率或内存使用量,同时与创建部署时设定的值和指标做比较,从而实现 Pod 副本数自动伸缩的功能。

在部署中创建了 HPA 后,Controller Manager 将会访问 Metrics-server,获取用户定义的资源中每一个容器组的利用率或原始值 (取决于指定的目标类型) 的平均值,然后,与 HPA 中设置的指标进行对比,同时计算部署中的 Pod 需要弹性伸缩的具体值并实现操作。在底层 Kubernetes 中的 Pod 的 CPU 和内存资源,实际上还分为 limits 和 requests 两种情况,在调度的时候,kube-scheduler 将会根据 requests 的值进行计算。因此,当 Pod 没有设置资源请求值 (request) 时,弹性伸缩功能将不会工作。

弹性伸缩工作原理

目的

本示例演示创建一个设置了弹性伸缩的应用,通过另外创建的多个 Pod 循环向该应用发送无限的查询请求访问应用的服务,相当于手动增加 CPU 负载,即模拟多个用户同时访问该服务,演示其弹性伸缩的功能,详细说明 HPA 的工作原理以及如何在部署中设置 Pod 水平自动伸缩。

视频教程

预估时间

约 25 分钟。

前提条件

创建无状态服务

  1. 以项目普通用户 project-regular 登录 KubeSphere,进入项目,选择 应用负载服务

  1. 选择 无状态服务,服务名称设置为 hpa

  2. 点击 添加容器镜像,然后在镜像一栏输入 mirrorgooglecontainers/hpa-example,然后按回车键或点击 DockerHub,待镜像信息加载后,点击 使用默认端口

  1. 点击 ,然后选择下一步。本示例无需挂载存储和高级设置,因此跳过这两步设置,点击 创建,hpa 无状态服务创建成功,此时将一并创建一个 hpa-v1 的部署(Deployment)。

添加弹性伸缩(HPA)

  1. 选择 工作负载部署,然后进入 hpa-v1 查看部署详情。

  1. 在左侧点击 更多操作弹性伸缩

  1. 本示例对一个部署的 CPU 使用率设置弹性伸缩,参考如下填写 HPA 参数:
  • CPU Request Target(%) (CPU 目标值):当 CPU 使用率超过或低于此目标值时,将相应地添加或删除副本,此处设置为 50%
  • Memory Request Target(Mi) (内存目标值):当内存使用量超过或低于此目标值时,将添加或删除副本,本示例以增加 CPU 负载作为测试,内存暂不作限定
  • 最小副本数:弹性伸缩的容器组数量下限,此处设置 1
  • 最大副本数:弹性伸缩的容器组数量上限,此处设置 10

注:当为部署添加 HPA 后,实际上会为部署创建一个 Horizontal Pod Autoscaler 来调度其弹性伸缩。

创建 Load-generator

另外创建一个部署 (Deployment) 用于向上一步创建的服务不断发送查询请求,模拟增加 CPU 负载。

  1. 在左侧菜单栏选择 工作负载 → 部署,点击 创建,填写部署的基本信息,例如名称定义为 load-generator,完成后点击 下一步

  1. 点击 添加容器,镜像填写 busybox

  1. 然后下滑至 启动命令,勾选 启动命令,在展开的运行命令和参数中填写用于对 hpa 服务增加 CPU 负载的命令和参数,其它设置暂无需配置。设置运行命令参数如下:

注意:参数中服务的 http 地址应替换为您实际的服务和项目名称。例如,我们在创建 HPA 的服务时,服务名称为 hpa,当前的项目名称为 demo-namespace,那么该服务在内部的 http 地址为 http://hpa.demo-namespace.svc.cluster.local

# 运行命令
sh,-c

# 参数 (http 地址参考:http://{$服务名称}.{$项目名称}.svc.cluster.local)
while true; do wget -q -O- http://hpa.demo-project.svc.cluster.local; done

4、完成填写后,点击 保存;点击 下一步;本示例暂未用到存储,点击 下一步 跳过存储卷设置;点击 创建

至此,以上一共创建了两个部署 (分别是 hpa 和 load-generator ) 和一个服务 (hpa)。

验证弹性伸缩

第一步:查看部署状态

在部署列表中,点击之前创建的部署 hpa-v1,进入资源详情页,请重点关注此时容器组的弹性伸缩状态和当前的 CPU 使用率以及它的监控情况。

第二步:查看弹性伸缩情况

load-generator 的所有副本的容器都创建成功并开始访问 hpa 服务时,如下图所示,刷新页面后可见 CPU 使用率明显升高,先快速上升至 5020 %,并且期望副本和实际运行副本数变成了 4/4,这是由于我们之前设置的 Horizontal Pod Autoscaler 开始工作了,load-generator 循环地请求该 hpa 服务使得 CPU 使用率迅速升高,HPA 开始工作后使得该服务的后端 Pod 副本数迅速增加共同处理大量的请求,hpa 的副本数会随 CPU 的使用率升高而继续增加。

一分钟左右 CPU 使用率降低至 510 %,副本数增加至所设置 HPA 的最大值 10,正好也证明了弹性伸缩的工作原理。

查看监控

理论上,从容器组的 CPU 监控曲线中可以看到最初创建的 1 个容器组的 CPU 使用量有一个明显的升高趋势,待 HPA 开始工作时可以发现 CPU 使用量有明显降低的趋势,最终趋于平稳,而此时新增的 Pod 上可以看到 CPU 使用量在增加。

说明:HPA 工作后,Deployment 最终的副本数量可能需要几分钟才能稳定下来,删除负载后 Pod 数量回缩至正常状态也需要几分钟。 由于环境的差异,不同环境中最终的副本数量可能与本示例中的数量不同。

查看工作负载监控

查看部署的所有副本监控

停止负载

1、在左侧菜单栏选择 工作负载 → 部署,在部署列表中选择 load-generator,点击界面上方的 删除 (或将该部署的副本数设置为 0),停止负载;

2、再次查看 hpa 的运行状况,可以发现几分钟后它的 CPU 利用率已缓慢降到 10 %,并且 HPA 将其副本数量最终减少至最小副本数 1,最终恢复了正常状态。

注意:在完成本示例后,请将工作负载 load-generator 删除,防止其一直访问该应用而造成 CPU 资源的不必要的消耗或集群因资源不足而出现问题。

从 CPU 使用量监控曲线反映的趋势也可以帮助我们进一步理解弹性伸缩的工作原理;

3、在部署的详情页面,可以下钻到每个 Pod 的 单个容器 的监控详情,点击最初创建的容器组进入容器组详情页,选择 「监控」,查看该容器组的 CPU 使用量和网络流入、出速率监控曲线,与本示例的操作流程和 HPA 原理正好相符。

修改弹性伸缩

创建后若需要修改弹性伸缩的参数,可以在部署详情页,点击 更多操作 → 弹性伸缩

取消弹性伸缩

若该部署无需设置 HPA,则可以在当前的部署详情页中,点击弹性伸缩右侧的 ···,然后选择 取消

至此,您已经熟悉了如何在创建部署时设置弹性伸缩的基本操作。