v2.1
v2.0
v1.0
  1. Release Notes
    1. Release Notes - 2.1.1最新
    1. Release Notes - 2.1.0
    1. Release Notes - 2.0.2
    1. Release Notes - 2.0.1
    1. Release Notes - 2.0.0
  1. 产品介绍
    1. 什么是 KubeSphere
    1. 平台功能
    1. 为什么选择 KubeSphere
    1. 架构说明
    1. 应用场景
    1. 名词解释
  1. 安装指南
    1. 安装说明
      1. 概览
      2. 网络防火墙配置
      3. 集群其它参数配置
    1. 在 Linux 快速安装 KubeSphere
      1. All-in-One 模式
      2. Multi-Node 模式
      3. 完整安装(开启所有功能组件)
    1. 在 Kubernetes 安装 KubeSphere
      1. 准备工作
      2. 在 Kubernetes 安装 KubeSphere
    1. 安装可插拔的功能组件
      1. 可插拔功能组件概览
      2. 安装应用商店
      3. 安装内置的 DevOps 系统
      4. 安装内置的日志系统
      5. 安装微服务治理组件(Service Mesh)
      6. 安装告警通知系统
      7. 安装 Metrics-server 开启 HPA
      8. 验证可插拔功能组件的安装
    1. 集群高可用配置安装
      1. 在青云安装 HA 集群
      2. 在华为云安装 HA 集群
      3. 持久化存储配置说明
    1. 相关工具与插件
      1. 安装内置 Grafana
      2. 访问 SonarQube 和 Jenkins 服务端
      3. 安装 Porter 负载均衡器插件
      4. 安装 QingCloud 负载均衡器插件
    1. 认证配置
      1. 接入 LDAP / AD 域账号(Beta)
    1. 集群运维
      1. 安装后添加新的存储类型
      2. 集群节点扩容
      3. 卸载
  1. 升级指南
    1. 升级必读
    1. All-in-One 升级
    1. Multi-node 升级
  1. 快速入门
    1. 入门必读
    1. 1. 多租户管理快速入门
    1. 2. 应用路由与服务示例
    1. 3. 创建 Wordpress 应用并发布至 K8s
    1. 4. 一键部署应用
    1. 5. 创建简单任务
    1. 6. 设置弹性伸缩 (HPA)
    1. 7. Source-to-Image
    1. 8. Binary-to-Image
    1. 9. 基于Spring Boot项目构建流水线
    1. 10. 图形化构建流水线
    1. 11. Bookinfo 微服务的灰度发布
    1. 12. 使用 Ingress-Nginx 进行灰度发布
    1. 13. 应用商店
  1. 管理员指南
    1. 多租户管理
      1. 多租户管理概述
      2. 角色权限概览
    1. 平台管理
      1. 企业空间管理
      2. 账号管理
      3. 平台角色
    1. 基础设施
      1. 服务组件
      2. 主机管理
      3. 存储类型
    1. 监控中心
      1. 监控概述
      2. 如何利用监控定位问题
      3. 集群状态监控
      4. 应用资源监控
      5. 监控策略 - 节点级别
      6. 监控消息 - 节点级别
    1. 平台设置
      1. 应用仓库
      2. 基于本地仓库搭建应用仓库部署Redis
      3. 上传应用到 KubeSphere 官方仓库
      4. 基于 GitHub 搭建自有应用仓库
      5. 邮件服务器
      6. 日志收集
      7. 添加 Fluentd 作为日志接收者
      8. 添加 Kafka 作为日志接收者
    1. 工具箱
      1. Web Kubectl
      2. 日志收集
    1. DevOps 配置
      1. 系统配置修改
      2. 上传镜像至 Harbor
      3. 流水线配置邮件服务器
      4. Jenkins 系统设置
    1. FAQ
      1. DevOps 运维FAQ
  1. 用户指南
    1. 应用
      1. 应用模板
      2. 自制应用
      3. 流量治理
      4. 熔断
    1. 工作负载
      1. 工作负载概述
      2. 部署
      3. 有状态副本集
      4. 守护进程集
      5. 任务
      6. 定时任务
      7. 设置健康检查器
      8. 工作负载管理
      9. 落盘日志收集
    1. 存储
      1. 存储概述
      2. 存储卷
      3. Local Volume 使用方法
    1. 网络与服务
      1. 服务管理
      2. 灰度发布
      3. 应用路由
    1. 监控告警
      1. 告警策略 - 工作负载级别
      2. 告警消息 - 工作负载级别
    1. 配置中心
      1. 密钥
      2. 配置
      3. 镜像仓库
    1. 项目设置
      1. 基本信息
      2. 成员角色
      3. 项目成员
      4. 外网访问
    1. DevOps 工程
      1. DevOps 工程概述
      2. 管理 DevOps 工程
      3. 流水线
      4. 凭证管理
      5. 添加代码仓库
      6. 访问 SonarQube 并创建 Token
      7. 设置自动触发扫描
      8. Jenkins Agent 说明
      9. 流水线常见问题
  1. 开发者指南
    1. Helm 应用开发
      1. 开发模板规范
      2. Helm 应用开发入门
    1. Source to Image(S2I) 自定义模版开发
      1. S2I 原理及流程介绍
      2. 自定义 S2I 模版
  1. API 文档
    1. API 文档
    1. 如何调用 API
    1. API 常用术语对照
    1. 监控指标说明
  1. 常见问题
    1. 安装常见问题
    1. 存储常见问题
    1. 控制台使用常见问题
    1. DevOps 常见问题
  1. 附录
    1. 部署 Ceph 存储服务端
    1. 部署 GlusterFS 存储服务端
    1. 安装 OpenEBS 创建 LocalPV 存储类型
    1. 云平台配置端口转发和防火墙
KubeSphere®️ 2020 All Rights Reserved.

告警策略 —— 节点级别

编辑

告警是 KubeSphere Advanced 2.0.0 的新功能,自研的多租户告警系统支持灵活的告警策略和告警规则,目前 KubeSphere 告警系统具备以下特性:

  • 支持基于多租户、多维度的监控指标告警,目前告警策略支持集群管理员对节点级别和租户对工作负载级别等两个层级;
  • 灵活的告警策略:可自定义包含多个告警规则的告警策略,并且可以指定通知规则和重复告警的规则;
  • 丰富的监控告警指标:提供节点级别和工作负载级别的监控告警指标,包括容器组、CPU、内存、磁盘、网络等多个监控告警指标;
  • 灵活的告警规则:可自定义某监控指标的检测周期长度、周期次数、告警等级等;
  • 灵活的通知发送规则:可自定义发送通知时间段及通知列表,目前支持邮件通知;
  • 灵活的重复告警规则:可自定义重复告警周期、最大重复次数并和告警级别挂钩。

目的

本篇文档以创建一个节点级别的告警策略并发送邮件通知作为示例,引导集群管理员如何设置节点级别的告警策略。

操作示例

前提条件

管理员需预先配置邮件服务器,若还未配置可参考 邮件服务器

演示视频

第一步:添加告警策略

  1. cluster-admin 登录 KubeSphere,点击 「平台管理」,选择 「监控中心」。

  1. 选择 「告警策略」,点击 「添加策略」。

第二步:填写基本信息

在弹窗中,参考如下提示填写基本信息,完成后点击 「下一步」。

  • 名称:为告警策略起一个简洁明了的名称,便于用户浏览和搜索,比如 alert-demo
  • 别名:帮助您更好的区分资源,并支持中文名称,比如 示例告警
  • 描述信息:简单介绍该告警策略。

第三步:选择监控目标

监控目标支持按三种指标进行排行,这里选择 按内存使用率排行,选择排行前三的三台主机,注意这三台主机的内存利用率都超过了 50%,为了演示方便,下一步告警规则中可以设置内存使用率的阈值为 > 50%。完成后点击 「下一步」。

监控目标支持按如下三种指标排行:

  • 按内存使用率排行
  • 按 CPU 使用率排行
  • 按容器组用量排行

第四步:添加告警规则

告警规则支持的指标、扫描周期、连续次数、告警等级非常丰富,本示例以设置内存利用率作为告警指标,内存使用率的阈值为 > 50%,级别为重要告警,设置的规则如截图所示:

说明: 节点支持的告警指标如下:

  • CPU:节点 CPU 利用率、节点 CPU 1 分钟平均负载、节点 CPU 5 分钟平均负载、节点 CPU 15 分钟平均负载;
  • 内存:节点可用内存、节点内存利用率;
  • 磁盘:节点本地磁盘可用空间、节点本地磁盘空间利用率、节点本地磁盘读取 IOPS、节点本地磁盘写入 IOPS、本地磁盘读取吞吐量、本地磁盘写入吞吐量、inode 利用率;
  • 网络:网络发送数据速率、网络接收数据速率;
  • 容器组:容器组异常率、容器组利用率。

完成后点击 「保存」,然后选择 「下一步」。

第五步:设置通知规则

  1. 通知有效时间可以设置发送通知邮件的时间范围,例如 09:00 ~ 19:00,通知渠道目前仅支持邮箱,在通知列表中输入需要通知的成员邮箱。

  2. 重复规则设置的是告警通知的发送周期和重发频度,如果告警一直未解决,相隔一定的时间将会重复发送告警。针对不同级别的告警也可以设置不同的重复规则,由于上一步设置的告警级别是重要告警,因此选择重要告警的规则为 每 5 分钟警告一次,最多重发 3 次。参考如下截图设置通知规则:

  1. 点击 「创建」,可以看到示例告警策略创建成功。

说明:告警的等待时间 = 检测周期 x 连续次数。例如检测周期为 1 分钟/周期,连续次数为 2 次,那么需要等待 2 分钟。

第六步:查看告警策略

告警策略创建成功后,点击进入 alert-demo 告警策略的详情页,查看告警规则当前的状态和详细信息,包括监控目标、通知规则和告警历史等。

左侧点击 「更多操作」 → 「更改状态」,支持启用或停用告警策略。