.. _glossary:

======
术语表
======

.. glossary::

   APDEX
      Application Performance Index，应用性能指数。
      一个衡量用户满意度的标准指标，基于响应时间计算。

   AIOps
      Artificial Intelligence for IT Operations，智能运维。
      利用 AI/ML 技术自动化 IT 运维流程。

   APM
      Application Performance Management，应用性能管理。
      监控和管理应用程序性能和可用性的实践。

   CI/CD
      Continuous Integration / Continuous Delivery，持续集成/持续交付。
      自动化的软件构建、测试和部署流水线。

   Circuit Breaker
      断路器模式。当下游服务故障时快速失败，防止级联故障。

   CLS
      Cumulative Layout Shift，累积布局偏移。
      Core Web Vitals 之一，衡量页面视觉稳定性。

   Counter
      计数器。一种单调递增的度量类型，用于记录累计值。

   DAU
      Daily Active Users，日活跃用户数。

   DORA
      DevOps Research and Assessment。
      Google 提出的四个关键指标: 部署频率、变更前置时间、变更失败率、服务恢复时间。

   eBPF
      Extended Berkeley Packet Filter。
      Linux 内核技术，允许在内核中运行沙盒程序进行无侵入式监控。

   EWMA
      Exponentially Weighted Moving Average，指数加权移动平均。

   Gauge
      测量值/仪表。一种可增可减的度量类型，表示某个瞬时值。

   Golden Signals
      黄金信号。Google SRE 提出的四大关键指标: 延迟、流量、错误、饱和度。

   Histogram
      直方图。一种度量类型，用于统计数据的分布情况。

   HPA
      Horizontal Pod Autoscaler。
      Kubernetes 中基于度量的自动水平伸缩机制。

   INP
      Interaction to Next Paint，交互到下一次绘制。
      Core Web Vitals 之一，衡量页面交互响应性。

   JMT
      Join Meeting Time，参会时间。
      网络会议系统中用户加入会议所需的时间。

   LCP
      Largest Contentful Paint，最大内容绘制时间。
      Core Web Vitals 之一，衡量页面加载性能。

   MDD
      Metrics Driven Development，度量驱动开发。
      以度量为核心的软件开发方法论。

   Meter
      速率计。一种度量类型，用于记录事件的平均速率。

   MTTR
      Mean Time To Recovery，平均恢复时间。
      从故障发生到服务恢复所需的平均时间。

   NPS
      Net Promoter Score，净推荐值。
      衡量客户忠诚度的指标。

   OpenTelemetry
      CNCF 的统一可观测性框架，将 Metrics、Traces、Logs 三大信号标准化。

   OTLP
      OpenTelemetry Protocol，OpenTelemetry 协议。
      用于传输遥测数据的标准协议。

   P50/P90/P95/P99
      百分位数。P99 = 99th percentile，表示 99% 的请求的延迟低于该值。

   PDCA
      Plan-Do-Check-Act，戴明循环。
      质量管理和持续改进的方法论。

   PromQL
      Prometheus Query Language，Prometheus 查询语言。

   QPS
      Queries Per Second，每秒查询数。

   RED
      Rate-Errors-Duration。Tom Wilkie 提出的微服务度量方法。

   RUM
      Real User Monitoring，真实用户监控。
      采集真实用户的体验数据进行分析。

   SLA
      Service Level Agreement，服务级别协议。
      服务提供者与客户之间关于服务质量的约定。

   SLI
      Service Level Indicator，服务级别指标。
      衡量服务质量的具体指标。

   SLO
      Service Level Objective，服务级别目标。
      服务提供者对 SLI 设定的目标值。

   SRE
      Site Reliability Engineering，站点可靠性工程。
      Google 提出的运维方法论。

   Timer
      计时器。一种度量类型，结合了直方图和速率计。

   TPS
      Transactions Per Second，每秒事务数。

   USE
      Utilization-Saturation-Errors。
      Brendan Gregg 提出的系统资源分析方法。