术语表

Abstract

音视频实时通信术语速查

Authors

Walter Fan

Status

v1.0

Updated

2026-03-20

本术语表汇总了全书涉及的核心术语,按英文字母排序,可用浏览器搜索(Ctrl+F)快速定位。

AEC

Acoustic Echo Cancellation,声学回声消除。消除扬声器播放的声音被麦克风重新采集后产生的回声。 参见 Acoustic Echo Canceller

AGC

Automatic Gain Control,自动增益控制。自动调整音频信号的增益,使输出音量保持稳定。 参见 Automatic Gain Control

AIMD

Additive Increase Multiplicative Decrease,加性增乘性减。拥塞控制的经典策略,WebRTC GCC 中用于调整估计比特率。 参见 Remote Bitrate Estimator

ANS

Automatic Noise Suppression,自动噪声抑制。降低背景噪音,提升语音清晰度。 参见 Automatic Noise Suppression

AV1

AOMedia Video 1,开放媒体联盟的下一代视频编解码器,压缩效率优于 H.264 和 VP8。 参见 视频编码 AV1

BFCP

Binary Floor Control Protocol,二进制发言控制协议。用于多方会议中的发言权管理。 参见 BFCP 协议

BUNDLE

一种 SDP 机制(RFC 8843),将多路媒体流复用到单个传输通道上,减少端口和 ICE 协商开销。 参见 WebRTC Bundle

CELT

Constrained Energy Lapped Transform,一种低延迟音频编码技术,是 Opus 编解码器的高频编码核心。 参见 Audio Opus Codec

CNAME

Canonical Name,规范名称。RTCP SDES 中的标识符,用于跨 SSRC 关联同一参与者的多条流,是音视频同步的基础。

DataChannel

WebRTC 的数据通道,基于 SCTP over DTLS,支持可靠/不可靠的任意数据传输。 参见 WebRTC Data Channel

DRED

Deep Redundancy,深度冗余。Opus 1.5+ 引入的基于深度学习的冗余编码,提升丢包下的音质。 参见 Audio Opus Codec

DTLS

Datagram Transport Layer Security,基于 UDP 的传输层安全协议。WebRTC 用它协商 SRTP 密钥。 参见 DTLS 协议

DTX

Discontinuous Transmission,不连续传输。静音时停止发送音频包以节省带宽。

FEC

Forward Error Correction,前向纠错。发送端附加冗余数据,接收端无需重传即可恢复丢失的包。 参见 WebRTC FEC

FIR

Full Intra Request,完整帧内请求。接收端请求发送端发送完整关键帧。

GCC

Google Congestion Control,Google 拥塞控制算法。WebRTC 的默认拥塞控制,结合延迟和丢包估计。 参见 Google Congestion Control v1

H.264

ITU-T 和 ISO/IEC 联合制定的视频编解码标准,WebRTC 支持的视频编解码器之一。 参见 H.264 编码

ICE

Interactive Connectivity Establishment,交互式连接建立。综合 STUN/TURN 实现 NAT 穿透。 参见 Interactive Connectivity Establishment

Jitter Buffer

抖动缓冲区。接收端缓存收到的包,重新排序并平滑网络抖动带来的时间波动。 参见 Jitter Buffer

MCU

Multipoint Control Unit,多点控制单元。服务端混合所有参与者的媒体流后统一分发。

MID

Media Identification,媒体标识。BUNDLE 模式下通过 RTP 扩展头标识所属的 SDP m= 行。

NACK

Negative Acknowledgement,否定确认。接收端通知发送端某包丢失,请求重传。 参见 WebRTC NACK 实现

NetEQ

WebRTC 的音频网络均衡器,集成了 Jitter Buffer、PLC、加减速播放等功能。

Opus

IETF 标准化的音频编解码器(RFC 6716),WebRTC 的强制实现编解码器,支持 6 kbps – 510 kbps。 参见 Audio Opus Codec

Pacer

发送节奏控制器。将编码器突发输出的包平滑分散到时间轴上发送,避免瞬时拥塞。 参见 WebRTC Pacer

PLC

Packet Loss Concealment,丢包隐藏。当音频包丢失时,解码器合成替代音频以掩盖间断。

PLI

Picture Loss Indication,图片丢失指示。接收端通知发送端丢失了视频参考帧,请求关键帧。

QP

Quantization Parameter,量化参数。视频编码中控制压缩程度的参数,QP 越大画质越差。

REMB

Receiver Estimated Maximum Bitrate,接收端估计最大比特率。旧版 GCC 的带宽反馈机制。 参见 Google REMB

RTCP

RTP Control Protocol,RTP 控制协议。提供传输质量反馈、同步和参与者信息。 参见 WebRTC RTCP Usage

RTP

Real-time Transport Protocol,实时传输协议(RFC 3550)。音视频数据的载体。 参见 WebRTC RTP Usage

RTX

Retransmission,重传流。使用独立 SSRC 发送 NACK 请求的重传包。 参见 WebRTC RTX

SCTP

Stream Control Transmission Protocol,流控制传输协议。WebRTC DataChannel 的底层传输。 参见 SCTP 协议

SDP

Session Description Protocol,会话描述协议。描述媒体会话的编解码器、地址、安全等参数。 参见 WebRTC SDP

SFU

Selective Forwarding Unit,选择性转发单元。服务端按需转发(不混合)参与者的媒体流。 参见 SFU

SILK

Skype 开发的语音编码技术,是 Opus 的低频编码核心,擅长窄带/宽带语音。 参见 Audio Opus Codec

Simulcast

同时发送同一视频源的多个质量层(不同分辨率/帧率),由 SFU 按接收端能力选择转发。 参见 WebRTC Simulcast

SRTP

Secure Real-time Transport Protocol,安全 RTP(RFC 3711)。对 RTP 载荷加密并认证。 参见 SRTP 协议

SSRC

Synchronization Source,同步源标识符。32 位随机数,唯一标识 RTP 会话中的一条流。

STUN

Session Traversal Utilities for NAT,NAT 会话穿透工具(RFC 8489)。用于发现公网地址。 参见 STUN

SVC

Scalable Video Coding,可伸缩视频编码。单流编码多个质量层,由 SFU 按需裁剪。 参见 WebRTC SVC

TURN

Traversal Using Relays around NAT,使用中继穿越 NAT(RFC 5766)。当直连和 STUN 均失败时通过服务器中继。 参见 TURN

TWCC

Transport-Wide Congestion Control,传输层拥塞控制。接收端反馈每包到达时间,发送端估算带宽。 参见 Transport-wide Congestion Control

VAD

Voice Activity Detection,语音活动检测。区分语音和静默段,常用于 DTX 和噪声抑制。 参见 Voice Activity Detector

VP8

Google 开源的视频编解码器,WebRTC 早期默认视频编解码器。

WebSocket

全双工通信协议,常用于 WebRTC 的信令通道。 参见 WebSocket

YUV

一种颜色空间,分离亮度(Y)和色度(U/V)。视频编码前的标准像素格式。 参见 YUV 图像格式