摘要
音频DSP(数字信号处理器)是现代音频设备的核心,从TWS耳机的主动降噪(ANC)到便携解码耳放的EQ调音,都依赖DSP算法进行处理。本文综述音频DSP的基础概念、核心算法(参数EQ、DRC动态范围控制、ANC主动降噪、ENC环境降噪)和调音实践,为音频工程师和产品经理提供完整的DSP知识参考。数据参考音频DSP厂商技术文档,不确定处另行注明。
一、音频DSP基础概念
1.1 什么是音频DSP
音频DSP是专门处理音频信号的数字信号处理器,相比通用CPU,音频DSP针对音频算法优化(乘加运算、循环控制、低延迟),广泛用于耳机、音箱、音频Codec和汽车音响系统。
1.2 音频DSP vs 普通MCU的区别
| 特性 | 音频DSP | 普通MCU |
|---|
| 指令优化 | MAC(乘加)单周期 | 通用算术 |
| 实时性 | 低延迟(亚毫秒级) | 中等延迟 |
| 数据格式 | 定点/浮点24bit | 定点16/32bit |
| 功耗 | 较高(专用) | 较低(通用) |
| 典型应用 | 耳机、音箱Codec | 显示控制、连接管理 |
1.3 音频采样率与处理帧长
| 参数 | 数值 | 说明 |
|---|
| 采样率 | 48kHz/96kHz/192kHz | 专业音频可达384kHz |
| 位深 | 24bit | 高精度音频 |
| 帧长(Block Size) | 256/512/1024样本 | 影响延迟和频率分辨率 |
| 延迟计算 | 延迟=帧长/采样率 | 256样本@48kHz=5.3ms |
二、参数EQ(Parametric EQ)
2.1 EQ的基本类型
| EQ类型 | 特点 | 应用场景 |
|---|
| 搁架式EQ(Shelf) | 高频或低频整体提升/衰减 | 音调调整 |
| 峰值EQ(Peak) | 指定频率正负12dB | 精确频段调整 |
| 低通/高通滤波器 | 低于或高于截止频率衰减 | 抗混叠、噪声抑制 |
| 陷波滤波器(Notch) | 极窄带深度衰减 | 消除特定干扰 |
2.2 峰值EQ的参数
| 参数 | 说明 | 范围 |
|---|
| 中心频率(f) | EQ作用的频率点 | 20Hz-20kHz |
| 增益(G) | 提升或衰减量 | 正负12dB |
| 品质因数(Q) | 频带宽度 | Q=0.5(宽)到Q=10(窄) |
| 带宽(BW) | 频带宽度(octaves) | BW=0.1到4 octaves |
2.3 音乐风格EQ预设
| 风格 | 低频 | 中频 | 高频 |
|---|
| 流行 | +3dB@100Hz | +2dB@1kHz | +2dB@10kHz |
| 摇滚 | +4dB@80Hz | -2dB@500Hz | +3dB@8kHz |
| 古典 | +1dB@200Hz | 平 | +2dB@12kHz |
| 电子 | +5dB@60Hz | 凹陷 | +4dB@15kHz |
三、动态范围控制(DRC/压缩器)
3.1 DRC的工作原理
DRC(动态范围控制)用于控制音频信号的动态范围,防止失真并提升响度:
| 参数 | 说明 | 典型值 |
|---|
| 阈值(Threshold) | 触发压缩的电平 | -20dB到-10dB |
| 比率(Ratio) | 压缩比例 | 2:1到10:1 |
| 启动时间(Attack) | 压缩开始的速度 | 0.1ms到10ms |
| 释放时间(Release) | 压缩恢复的速度 | 10ms到300ms |
| 拐点(Knee) | 软拐点/硬拐点 | 影响声音自然度 |
3.2 DRC的应用场景
| 场景 | 目的 | 参数 |
|---|
| 听音乐 | 提升响度,压缩动态 | Ratio 3:1,Threshold -15dB |
| 语音通话 | 提升语音清晰度 | Ratio 5:1,Threshold -18dB |
| 广播 | 统一响度 | Ratio 4:1,Threshold -12dB |
| 爆破音保护 | 防止扬声器损坏 | Ratio 10:1,Threshold -8dB |
3.3 自动增益控制(AGC)
AGC用于自动调整输入信号的增益,确保输出电平恒定:
| 类型 | 特点 | 应用 |
|---|
| 峰值AGC | 响应峰值电平 | 录音设备 |
| RMS AGC | 响应平均功率 | 语音通话 |
| 智能AGC | 多频段动态调整 | 手机直播 |
四、主动降噪(ANC)算法
4.1 ANC的基本原理
ANC(Active Noise Cancellation)通过产生与噪声反相的信号来消除噪声:
| 类型 | 原理 | 适用场景 |
|---|
| 前馈式(FF) | 麦克风检测噪声,DSP产生反相信号 | 中高频降噪 |
| 反馈式(FB) | 扬声器后检测残余噪声,闭环控制 | 中低频降噪 |
| 混合式(Hybrid) | 前馈+反馈结合 | 宽频降噪(旗舰TWS耳机) |
4.2 ANC的关键参数
| 参数 | 说明 | 设计考量 |
|---|
| 采样率 | 通常48kHz,部分96kHz | 高采样率利于宽频降噪 |
| 帧长 | 128/256样本 | 短帧长=低延迟,但计算量大 |
| 收敛速度 | LMS/NLMS算法步长 | 决定跟踪噪声变化的速度 |
| 降噪深度 | 最大衰减量(dB) | 通常20-35dB |
| 频响平坦度 | 降噪后音频保真度 | ANC开启不应影响音质 |
4.3 ANC算法类型
| 算法 | 原理 | 优缺点 |
|---|
| FXLMS(自适应滤波) | 使用参考麦克风估计噪声,自适应滤波 | 收敛慢,计算量中等 |
| NLMS(归一化LMS) | FXLMS的归一化版本,收敛更稳定 | 计算量低,效果好 |
| ANC on relay | 传统固定滤波器加次级路径建模 | 实现简单,但适应性差 |
4.4 各频段降噪能力
| 频段 | 适用ANC类型 | 典型衰减 |
|---|
| 100-500Hz(低频) | 反馈式(FB) | 20-30dB |
| 500Hz-2kHz(中频) | 前馈式(FF) | 15-25dB |
| 2kHz-5kHz(中高频) | 前馈式(FF) | 10-20dB |
| 大于5kHz(高频) | 被动降噪(耳塞物理隔音) | 主导 |
五、环境降噪(ENC)算法
5.1 ENC vs ANC的区别
| 维度 | ANC(主动降噪) | ENC(环境降噪) |
|---|
| 目标 | 消除用户听到的噪声 | 消除麦克风采集的噪声 |
| 处理位置 | 扬声器输出之前 | 麦克风输入之后 |
| 麦克风位置 | 耳道内或耳道外 | 耳机外侧(双麦或三麦) |
| 受益者 | 用户 | 电话另一端 |
5.2 ENC的典型算法
| 算法 | 原理 | 效果 |
|---|
| 维纳滤波 | 统计方法估计噪声频谱 | 中等 |
| 谱减法 | 从含噪语音中减去噪声估计 | 一般,可能有音乐噪声 |
| 神经网络(深度学习) | AI模型识别语音和噪声 | 好(深度学习降噪) |
| beamforming(波束成形) | 双麦克风形成指向性 | 优秀(双麦降噪20dB) |
5.3 双麦克风波束成形
双麦克风ENC是TWS耳机通话降噪的主流方案:
| 参数 | 说明 |
|---|
| 主麦克风 | 朝向嘴部,采集语音 |
| 副麦克风 | 朝向外部,采集环境噪声 |
| 空间滤波 | 通过延迟对齐和相位抵消消除噪声 |
| 典型降噪 | 15-25dB环境噪声抑制 |
六、调音实践
6.1 调音的基本流程
| 步骤 | 内容 | 说明 |
|---|
| 1. 目标曲线设定 | 参考目标曲线(哈曼或自有) | 根据产品定位选择 |
| 2. 粗调 | 大范围调整(搁架EQ) | 快速接近目标 |
| 3. 精调 | 精细调整(峰值EQ) | 微调频响 |
| 4. 动态调整 | DRC参数设置 | 保护音质保真 |
| 5. ANC调优 | 前馈/反馈滤波器设计 | 降噪与音质平衡 |
| 6. 主观验证 | 真人听感测试 | 最终确认 |
6.2 调音设备
| 设备 | 用途 |
|---|
| 人工耳(IEC 60318) | 测试耳机的频响和ANC |
| 声学测试架 | 固定耳机进行测量 |
| Audio Precision | 专业音频分析仪 |
| 消音室 | 消除环境干扰 |
七、供货与选型支持
我司备有主流音频DSP芯片和模组,可提供完整方案和技术支持:骅讯CM7104/CM7089系列、瑞昱ALC5686、高通QCC3083系列参考交期6到12周。批量采购可申请样品和开发板,提供DSP算法库和调音工具培训。
八、总结
音频DSP是现代音频设备的核心,从参数EQ的音色调音,到DRC的动态控制,再到ANC和ENC的降噪处理,每一环节都需要精准的算法设计和调优。随着TWS耳机和智能音箱市场增长,ANC和ENC算法成为差异化竞争的关键。了解DSP算法的基本原理和设计方法,是音频工程师的必备技能。
常见问题(FAQ)
Q1:ANC耳机为什么对低频噪声效果好,对高频效果差?
ANC基于相位抵消原理,在低频(100Hz-1kHz)噪声波长较长,相位控制更精确。高频噪声波长短,相位误差导致降噪效果下降,且麦克风和扬声器本身的延迟限制了高频降噪。2kHz以上主要依靠物理隔音(被动降噪)。
Q2:混合ANC为什么比单一前馈或反馈ANC好?
前馈ANC在高频降噪有优势(麦克风在扰动源之前),但抗风噪差;反馈ANC在中低频降噪好,但对稳定性要求高。混合ANC结合两者,在整个频段都能提供良好降噪,但算法复杂度高,成本也更高。
Q3:EQ调音应该先粗调还是先精调?
应该先粗调再精调。先使用搁架式EQ调整整体高低频(正负3dB范围),快速接近目标曲线;再使用峰值EQ对具体频段(2-4个频点)进行精细调整。精调前确保粗调已基本达标。
Q4:DRC的启动时间(Attack)设置多少合适?
启动时间决定压缩器对瞬态信号(鼓点、爆破音)的响应速度。启动时间太短(小于0.5ms)会导致声音压缩过度,声音变得平板;启动时间太长(大于10ms)则无法有效抑制瞬态失真。语音通话通常0.5-2ms,音乐播放2-5ms。
Q5:ENC的深度学习降噪相比传统算法有什么优势?
深度学习降噪可以更好地识别复杂噪声场景(如多人同时说话、风噪、混响),降噪效果通常比传统算法高5-10dB。但深度学习需要大量训练数据,算力要求高,延迟也比传统算法大(通常30-50ms)。