摘要

音频DSP（数字信号处理器）是现代音频设备的核心，从TWS耳机的主动降噪（ANC）到便携解码耳放的EQ调音，都依赖DSP算法进行处理。本文综述音频DSP的基础概念、核心算法（参数EQ、DRC动态范围控制、ANC主动降噪、ENC环境降噪）和调音实践，为音频工程师和产品经理提供完整的DSP知识参考。数据参考音频DSP厂商技术文档，不确定处另行注明。

一、音频DSP基础概念

1.1 什么是音频DSP

音频DSP是专门处理音频信号的数字信号处理器，相比通用CPU，音频DSP针对音频算法优化（乘加运算、循环控制、低延迟），广泛用于耳机、音箱、音频Codec和汽车音响系统。

1.2 音频DSP vs 普通MCU的区别

特性	音频DSP	普通MCU
指令优化	MAC（乘加）单周期	通用算术
实时性	低延迟（亚毫秒级）	中等延迟
数据格式	定点/浮点24bit	定点16/32bit
功耗	较高（专用）	较低（通用）
典型应用	耳机、音箱Codec	显示控制、连接管理

1.3 音频采样率与处理帧长

参数	数值	说明
采样率	48kHz/96kHz/192kHz	专业音频可达384kHz
位深	24bit	高精度音频
帧长（Block Size）	256/512/1024样本	影响延迟和频率分辨率
延迟计算	延迟=帧长/采样率	256样本@48kHz=5.3ms

二、参数EQ（Parametric EQ）

2.1 EQ的基本类型

EQ类型	特点	应用场景
搁架式EQ（Shelf）	高频或低频整体提升/衰减	音调调整
峰值EQ（Peak）	指定频率正负12dB	精确频段调整
低通/高通滤波器	低于或高于截止频率衰减	抗混叠、噪声抑制
陷波滤波器（Notch）	极窄带深度衰减	消除特定干扰

2.2 峰值EQ的参数

参数	说明	范围
中心频率（f）	EQ作用的频率点	20Hz-20kHz
增益（G）	提升或衰减量	正负12dB
品质因数（Q）	频带宽度	Q=0.5（宽）到Q=10（窄）
带宽（BW）	频带宽度（octaves）	BW=0.1到4 octaves

2.3 音乐风格EQ预设

风格	低频	中频	高频
流行	+3dB@100Hz	+2dB@1kHz	+2dB@10kHz
摇滚	+4dB@80Hz	-2dB@500Hz	+3dB@8kHz
古典	+1dB@200Hz	平	+2dB@12kHz
电子	+5dB@60Hz	凹陷	+4dB@15kHz

三、动态范围控制（DRC/压缩器）

3.1 DRC的工作原理

DRC（动态范围控制）用于控制音频信号的动态范围，防止失真并提升响度：

参数	说明	典型值
阈值（Threshold）	触发压缩的电平	-20dB到-10dB
比率（Ratio）	压缩比例	2:1到10:1
启动时间（Attack）	压缩开始的速度	0.1ms到10ms
释放时间（Release）	压缩恢复的速度	10ms到300ms
拐点（Knee）	软拐点/硬拐点	影响声音自然度

3.2 DRC的应用场景

场景	目的	参数
听音乐	提升响度，压缩动态	Ratio 3:1，Threshold -15dB
语音通话	提升语音清晰度	Ratio 5:1，Threshold -18dB
广播	统一响度	Ratio 4:1，Threshold -12dB
爆破音保护	防止扬声器损坏	Ratio 10:1，Threshold -8dB

3.3 自动增益控制（AGC）

AGC用于自动调整输入信号的增益，确保输出电平恒定：

类型	特点	应用
峰值AGC	响应峰值电平	录音设备
RMS AGC	响应平均功率	语音通话
智能AGC	多频段动态调整	手机直播

四、主动降噪（ANC）算法

4.1 ANC的基本原理

ANC（Active Noise Cancellation）通过产生与噪声反相的信号来消除噪声：

类型	原理	适用场景
前馈式（FF）	麦克风检测噪声，DSP产生反相信号	中高频降噪
反馈式（FB）	扬声器后检测残余噪声，闭环控制	中低频降噪
混合式（Hybrid）	前馈+反馈结合	宽频降噪（旗舰TWS耳机）

4.2 ANC的关键参数

参数	说明	设计考量
采样率	通常48kHz，部分96kHz	高采样率利于宽频降噪
帧长	128/256样本	短帧长=低延迟，但计算量大
收敛速度	LMS/NLMS算法步长	决定跟踪噪声变化的速度
降噪深度	最大衰减量（dB）	通常20-35dB
频响平坦度	降噪后音频保真度	ANC开启不应影响音质

4.3 ANC算法类型

算法	原理	优缺点
FXLMS（自适应滤波）	使用参考麦克风估计噪声，自适应滤波	收敛慢，计算量中等
NLMS（归一化LMS）	FXLMS的归一化版本，收敛更稳定	计算量低，效果好
ANC on relay	传统固定滤波器加次级路径建模	实现简单，但适应性差

4.4 各频段降噪能力

频段	适用ANC类型	典型衰减
100-500Hz（低频）	反馈式（FB）	20-30dB
500Hz-2kHz（中频）	前馈式（FF）	15-25dB
2kHz-5kHz（中高频）	前馈式（FF）	10-20dB
大于5kHz（高频）	被动降噪（耳塞物理隔音）	主导

五、环境降噪（ENC）算法

5.1 ENC vs ANC的区别

维度	ANC（主动降噪）	ENC（环境降噪）
目标	消除用户听到的噪声	消除麦克风采集的噪声
处理位置	扬声器输出之前	麦克风输入之后
麦克风位置	耳道内或耳道外	耳机外侧（双麦或三麦）
受益者	用户	电话另一端

5.2 ENC的典型算法

算法	原理	效果
维纳滤波	统计方法估计噪声频谱	中等
谱减法	从含噪语音中减去噪声估计	一般，可能有音乐噪声
神经网络（深度学习）	AI模型识别语音和噪声	好（深度学习降噪）
beamforming（波束成形）	双麦克风形成指向性	优秀（双麦降噪20dB）

5.3 双麦克风波束成形

双麦克风ENC是TWS耳机通话降噪的主流方案：

参数	说明
主麦克风	朝向嘴部，采集语音
副麦克风	朝向外部，采集环境噪声
空间滤波	通过延迟对齐和相位抵消消除噪声
典型降噪	15-25dB环境噪声抑制

六、调音实践

6.1 调音的基本流程

步骤	内容	说明
1. 目标曲线设定	参考目标曲线（哈曼或自有）	根据产品定位选择
2. 粗调	大范围调整（搁架EQ）	快速接近目标
3. 精调	精细调整（峰值EQ）	微调频响
4. 动态调整	DRC参数设置	保护音质保真
5. ANC调优	前馈/反馈滤波器设计	降噪与音质平衡
6. 主观验证	真人听感测试	最终确认

6.2 调音设备

设备	用途
人工耳（IEC 60318）	测试耳机的频响和ANC
声学测试架	固定耳机进行测量
Audio Precision	专业音频分析仪
消音室	消除环境干扰

七、供货与选型支持

我司备有主流音频DSP芯片和模组，可提供完整方案和技术支持：骅讯CM7104/CM7089系列、瑞昱ALC5686、高通QCC3083系列参考交期6到12周。批量采购可申请样品和开发板，提供DSP算法库和调音工具培训。

八、总结

音频DSP是现代音频设备的核心，从参数EQ的音色调音，到DRC的动态控制，再到ANC和ENC的降噪处理，每一环节都需要精准的算法设计和调优。随着TWS耳机和智能音箱市场增长，ANC和ENC算法成为差异化竞争的关键。了解DSP算法的基本原理和设计方法，是音频工程师的必备技能。

常见问题（FAQ）

Q1：ANC耳机为什么对低频噪声效果好，对高频效果差？ ANC基于相位抵消原理，在低频（100Hz-1kHz）噪声波长较长，相位控制更精确。高频噪声波长短，相位误差导致降噪效果下降，且麦克风和扬声器本身的延迟限制了高频降噪。2kHz以上主要依靠物理隔音（被动降噪）。

Q2：混合ANC为什么比单一前馈或反馈ANC好？ 前馈ANC在高频降噪有优势（麦克风在扰动源之前），但抗风噪差；反馈ANC在中低频降噪好，但对稳定性要求高。混合ANC结合两者，在整个频段都能提供良好降噪，但算法复杂度高，成本也更高。

Q3：EQ调音应该先粗调还是先精调？ 应该先粗调再精调。先使用搁架式EQ调整整体高低频（正负3dB范围），快速接近目标曲线；再使用峰值EQ对具体频段（2-4个频点）进行精细调整。精调前确保粗调已基本达标。

Q4：DRC的启动时间（Attack）设置多少合适？ 启动时间决定压缩器对瞬态信号（鼓点、爆破音）的响应速度。启动时间太短（小于0.5ms）会导致声音压缩过度，声音变得平板；启动时间太长（大于10ms）则无法有效抑制瞬态失真。语音通话通常0.5-2ms，音乐播放2-5ms。

Q5：ENC的深度学习降噪相比传统算法有什么优势？ 深度学习降噪可以更好地识别复杂噪声场景（如多人同时说话、风噪、混响），降噪效果通常比传统算法高5-10dB。但深度学习需要大量训练数据，算力要求高，延迟也比传统算法大（通常30-50ms）。