摘要
PDM(Pulse Density Modulation,脉冲密度调制)是一种广泛应用于数字麦克风的高速数据接口标准,几乎所有MEMS数字麦克风都采用PDM输出。在TWS耳机、智能音箱、笔记本电脑、会议系统和语音识别设备中,PDM接口都是连接麦克风与主控芯片的主流方案。本文系统解析PDM的工作原理、与PCM/I2S的区别、时钟设计要点、滤波器设计,以及主流芯片的集成方案,为工程师提供实战参考。
1. 什么是PDM?
PDM是一种用脉冲密度来表示模拟信号幅值的调制方式。在数字麦克风语境下,麦克风内部的MEMS传感器将声压转换为模拟电信号,ADC将其量化为1位(bit)的高密度脉冲流——脉冲密度高代表正电压,密度低代表负电压。
与传统的PCM(Pulse Code Modulation)不同,PDM在单根数据线上只传输1位数据,但采样率极高(通常为1.0~3.072 MHz),因此被称为「1位编码的高速串行音频接口」。
1.1 基本工作原理
PDM信号本质上是模拟音频信号经过超采样(通常是64倍或更高)后的1位Sigma-Delta调制输出。以典型的数字麦克风为例:
- 物理采样率:通常为32 kHz(人声范围)
- PDM时钟频率:通常为1.0 MHz / 1.2 MHz / 2.4 MHz / 2.8224 MHz / 3.072 MHz
- 超采样倍率:64×或128×(决定滤波后实际音频带宽)
主控芯片在接收PDM数据后,通过低通滤波器(Decimation Filter)将高速1位数据流降采样为标准的PCM/I2S音频数据(如16 kHz、44.1 kHz、48 kHz等)。
2. PDM接口的硬件连接
2.1 典型两线制接口
PDM接口只需两根线:
- DATA(数据线):麦克风输出PDM数据流
- CLK(时钟线):主控提供时钟信号,上升沿采样
当系统中有两个麦克风(通常为左、右声道)时,常见接法是共用一个时钟源,通过**L/R Select(左右声道选择)**引脚区分——一个麦克风在时钟高电平期间输出数据(定义为左声道),另一个在低电平期间输出(定义为右声道)。
2.2 单/双麦克风系统对比
| 配置 | 时钟频率 | 数据线 | L/R选择 | 适用场景 |
|---|---|---|---|---|
| 单麦克风 | 1.0~3.072 MHz | 1根 | 固定接地或VDD | 笔记本电脑、语音助手 |
| 双麦克风(L&R分时) | 2.0~3.072 MHz | 1根 | 两颗芯片分别接VDD/GND | TWS耳机、立体声采集 |
| 双麦克风(并行) | 1.0~3.072 MHz | 2根 | 均接地,各自独立时钟域 | 延迟敏感应用 |
3. PDM vs PCM vs I2S:核心区别
这三种是音频行业内最常见的数字音频接口,理解它们的差异有助于选型决策。
| 特性 | PDM | PCM(I2S/TDM) | 说明 |
|---|---|---|---|
| 数据宽度 | 1位 | 16/24/32位 | PDM始终为1位,超采样实现高动态 |
| 采样率 | 1~3.072 MHz(超采样) | 8 kHz~384 kHz(降采样后) | PDM的MHz级是超采样,不等于音频带宽 |
| 时钟要求 | 主控提供,受时钟抖动影响大 | 主控或从设备提供 | PDM对时钟抖动更敏感 |
| 滤波器 | 需外置或集成Decimation Filter | 无需(已是PCM格式) | PDM数据不能直接使用 |
| 布线复杂度 | 低(仅2根线) | 中等(I2S需3~4根) | PDM适合空间受限的麦克风阵列 |
| 典型应用 | 数字MEMS麦克风 | DAC/ADC、编解码器、SoC内置 | 两者往往级联使用 |
| 抗干扰性 | 较强(单比特对噪声不敏感) | 中等 | PDM的1位编码对模拟干扰有一定抵抗力 |
一个常见误解:认为PDM的高时钟频率代表高音频质量。实际上,PDM的超采样倍率(如64×)使得1.024 MHz的时钟在经过64倍降采样后,对应的是16 kHz的音频带宽——这与人声主要频段(300 Hz~3.4 kHz)相匹配。
4. 时钟设计要点与常见问题
4.1 时钟频率选型
| 时钟频率 | 超采样倍率(以48 kHz输出为例) | 说明 |
|---|---|---|
| 1.024 MHz | 64×(音频带宽~16 kHz) | 适合语音通话、耳机应用 |
| 1.536 MHz | 32× | 部分高带宽方案 |
| 2.048 MHz | 128×(音频带宽~16 kHz,更低噪声) | 高质量语音 |
| 2.8224 MHz | 64×(48 kHz输出) | CD级音质 |
| 3.072 MHz | 64×(48 kHz输出) | 最常见的高质量PDM时钟 |
4.2 时钟抖动(Jitter)的影响
PDM接口对时钟抖动非常敏感。时钟抖动会直接转化为音频噪声,公式近似为:
Noise Level (dBFS) ≈ 20 × log₁₀(2π × f_audio × t_jitter)
例如,在44.1 kHz音频频率下,100 ps的时钟抖动约产生-75 dBFS的噪声基底。因此,在高保真音频应用中,应使用低抖动时钟源(如专用PLL或晶振),而非GPIO翻转时钟。
4.3 常见硬件问题
问题一:时钟串扰到数据线
- 表现:输出音频中有高频杂散
- 解决:DATA线与CLK线保持足够间距;必要时加RC低通滤波
问题二:L/R声道混乱
- 表现:左右声道数据互换或叠加
- 解决:检查L/R Select引脚电平是否正确;确认主控的PDM通道映射
问题三:降采样滤波器群延迟
- 表现:多麦克风系统中各麦克风音频相位不一致
- 解决:选择群延迟一致性好的Decimation Filter;在软件层面做相位校准
5. Decimation Filter(降采样滤波器)
PDM数据流必须经过Decimation Filter才能得到可用的PCM音频数据。Decimation过程包含两个步骤:
- 积分平均(Boxcar Averaging):在每个音频采样周期内,对多个PDM超采样位做平均
- 低通滤波(LPF):滤除超过奈奎斯特频率的镜像噪声
现代SoC(如高通QCC系列、恒玄BES系列、络达AB系列)通常内置硬件Decimation Filter,支持直接连接PDM麦克风,无需外置DSP。以下是典型Decimation Filter规格:
| 参数 | 常见规格 | 说明 |
|---|---|---|
| 输出采样率 | 8/16/32/44.1/48 kHz | 取决于后端音频算法需求 |
| 滤波器类型 | CIC + FIR | 级联梳状滤波器+有限冲击响应滤波器 |
| 群延迟 | 3~20个采样周期 | 与滤波器阶数相关,影响多麦克风时延 |
| 位深 | 16/24 bit | 降采样后通常输出16或24位PCM |
6. 主流PDM麦克风与芯片方案
以下是常见于USB音频模块、TWS耳机和智能音箱中的PDM麦克风及主控SoC搭配方案(注:以下型号参考公开数据手册,实际规格请以原厂为准):
6.1 PDM麦克风选型参考
| 品牌 | 型号 | 灵敏度 | 信噪比(SNR) | 声学过载点 | 封装 |
|---|---|---|---|---|---|
| Knowles | SPH0645LM4H | -26 dBFS | 65 dB | 120 dB SPL | MEMS |
| STMicroelectronics | MP34DT01 | -26 dBFS | 63 dB | 120 dB SPL | MEMS |
| Goertek | S6103 | -26 dBFS | 62 dB | 120 dB SPL | MEMS |
| AAC | DM019 | -26 dBFS | 64 dB | 120 dB SPL | MEMS |
6.2 支持原生PDM输入的主控SoC
| 品牌 | 芯片 | PDM通道数 | 典型应用 |
|---|---|---|---|
| 高通 | QCC5144 | 4 | TWS耳机 |
| 恒玄 | BES2300 | 2 | TWS耳机 |
| 络达 | AB1562 | 2 | TWS耳机 |
| 瑞昱 | RTL8762C | 2 | BLE音频 |
| 乐鑫 | ESP32 | 1 | IoT语音 |
7. 应用场景与设计建议
7.1 TWS耳机
TWS耳机通常采用双麦克风方案(FF麦克风用于通话,FB麦克风用于降噪),通过PDM接口直接连接至蓝牙音频SoC。设计要点:
- 麦克风间距建议≥10 mm,以获得足够的空间角度差用于波束成形
- PDM时钟建议使用SoC内置的低抖动PLL,避免GPIO翻转时钟导致的噪声
- Decimation Filter的群延迟需纳入ANC算法的时延预算
7.2 智能音箱
智能音箱通常采用多麦克风阵列(4~8颗),使用PDM或TDM接口。设计要点:
- 多颗麦克风共用同一PDM时钟源,保证相位一致性
- 麦克风布局需符合阵列几何设计(线性/环形),以优化波束成形效果
- PDM数据进入SoC后,通常由DSP运行关键词检测(KWS)和远场拾音算法
7.3 笔记本电脑与USB麦克风
笔记本电脑内置麦克风通常为双PDM麦克风,通过I2S接口连接到编解码器或USB桥接芯片。设计要点:
- 选择支持硬件PDM Decimation的USB音频芯片,减少CPU开销
- 注意麦克风开孔位置与整机ID设计的配合,避免声学遮挡
8. FAQ
Q1:PDM麦克风可以直接输出I2S吗?
不能。PDM麦克风输出的是1位超采样数据流,不能直接作为I2S数据使用。必须通过Decimation Filter转换为PCM/I2S格式,或者使用内置Decimation功能的SoC(如高通QCC、恒玄BES系列)。
Q2:PDM时钟抖动如何测量?
可以使用示波器或频谱分析仪测量时钟信号的时序噪声。更精确的方法是使用相位噪声分析仪测量时钟源的抖动谱密度。一般而言,对44.1/48 kHz音频,时钟抖动应控制在200 ps rms以下。
Q3:两颗PDM麦克风能否共用一根数据线?
可以,但需要分时复用(L/R Select分别接VDD和GND),在时钟高电平读取一颗麦克风数据,低电平读取另一颗。这种方式节省布线,但要求主控PDM接口支持L/R分时采样。
Q4:PDM麦克风的声学过载点(AOP)是多少?
主流数字MEMS麦克风的AOP通常为120 dB SPL,部分高声压级型号可达130 dB SPL。选型时需根据实际使用场景(近场/远场、大声压环境)选择合适的AOP。
Q5:为什么PDM常用于TWS而不用于扬声器输出?
PDM是输入(麦克风)接口,用于将模拟声音转换为数字信号。扬声器输出需要DAC,将数字信号转换为模拟声音,使用I2S或PCM接口更为合适。部分D类放大器支持PDM输入(如某些智能功放芯片),但这是将PDM解调后直接驱动扬声器,属于特殊设计。
9. 结论
PDM(脉冲密度调制)是数字MEMS麦克风的事实接口标准,在TWS耳机、智能音箱、笔记本电脑和IoT语音设备中无处不在。其1位高速超采样的工作原理虽然看似简单,但在实际设计中涉及时钟抖动控制、Decimation Filter配置、多麦克风相位校准等多个工程难点。
对于音频硬件工程师,理解PDM是连接声学MEMS传感器与数字信号处理链的关键桥梁;对于嵌入式软件工程师,掌握PDM接口调试和Decimation Filter配置是开发语音相关产品的基础技能。随着语音AI和TWS设备的持续增长,PDM接口的设计能力将成为音频硬件工程师的核心竞争力之一。
注:本文参数参考各芯片原厂公开数据手册(2024-2025年版本),实际设计时请以最新版本原厂规格书为准。