摘要

PDM（Pulse Density Modulation，脉冲密度调制）是一种广泛应用于数字麦克风的高速数据接口标准，几乎所有MEMS数字麦克风都采用PDM输出。在TWS耳机、智能音箱、笔记本电脑、会议系统和语音识别设备中，PDM接口都是连接麦克风与主控芯片的主流方案。本文系统解析PDM的工作原理、与PCM/I2S的区别、时钟设计要点、滤波器设计，以及主流芯片的集成方案，为工程师提供实战参考。

1. 什么是PDM？

PDM是一种用脉冲密度来表示模拟信号幅值的调制方式。在数字麦克风语境下，麦克风内部的MEMS传感器将声压转换为模拟电信号，ADC将其量化为1位（bit）的高密度脉冲流——脉冲密度高代表正电压，密度低代表负电压。

与传统的PCM（Pulse Code Modulation）不同，PDM在单根数据线上只传输1位数据，但采样率极高（通常为1.0~3.072 MHz），因此被称为「1位编码的高速串行音频接口」。

1.1 基本工作原理

PDM信号本质上是模拟音频信号经过超采样（通常是64倍或更高）后的1位Sigma-Delta调制输出。以典型的数字麦克风为例：

物理采样率：通常为32 kHz（人声范围）
PDM时钟频率：通常为1.0 MHz / 1.2 MHz / 2.4 MHz / 2.8224 MHz / 3.072 MHz
超采样倍率：64×或128×（决定滤波后实际音频带宽）

主控芯片在接收PDM数据后，通过低通滤波器（Decimation Filter）将高速1位数据流降采样为标准的PCM/I2S音频数据（如16 kHz、44.1 kHz、48 kHz等）。

2. PDM接口的硬件连接

2.1 典型两线制接口

PDM接口只需两根线：

DATA（数据线）：麦克风输出PDM数据流
CLK（时钟线）：主控提供时钟信号，上升沿采样

当系统中有两个麦克风（通常为左、右声道）时，常见接法是共用一个时钟源，通过**L/R Select（左右声道选择）**引脚区分——一个麦克风在时钟高电平期间输出数据（定义为左声道），另一个在低电平期间输出（定义为右声道）。

2.2 单/双麦克风系统对比

配置	时钟频率	数据线	L/R选择	适用场景
单麦克风	1.0~3.072 MHz	1根	固定接地或VDD	笔记本电脑、语音助手
双麦克风（L&R分时）	2.0~3.072 MHz	1根	两颗芯片分别接VDD/GND	TWS耳机、立体声采集
双麦克风（并行）	1.0~3.072 MHz	2根	均接地，各自独立时钟域	延迟敏感应用

3. PDM vs PCM vs I2S：核心区别

这三种是音频行业内最常见的数字音频接口，理解它们的差异有助于选型决策。

特性	PDM	PCM（I2S/TDM）	说明
数据宽度	1位	16/24/32位	PDM始终为1位，超采样实现高动态
采样率	1~3.072 MHz（超采样）	8 kHz~384 kHz（降采样后）	PDM的MHz级是超采样，不等于音频带宽
时钟要求	主控提供，受时钟抖动影响大	主控或从设备提供	PDM对时钟抖动更敏感
滤波器	需外置或集成Decimation Filter	无需（已是PCM格式）	PDM数据不能直接使用
布线复杂度	低（仅2根线）	中等（I2S需3~4根）	PDM适合空间受限的麦克风阵列
典型应用	数字MEMS麦克风	DAC/ADC、编解码器、SoC内置	两者往往级联使用
抗干扰性	较强（单比特对噪声不敏感）	中等	PDM的1位编码对模拟干扰有一定抵抗力

一个常见误解：认为PDM的高时钟频率代表高音频质量。实际上，PDM的超采样倍率（如64×）使得1.024 MHz的时钟在经过64倍降采样后，对应的是16 kHz的音频带宽——这与人声主要频段（300 Hz~3.4 kHz）相匹配。

4. 时钟设计要点与常见问题

4.1 时钟频率选型

时钟频率	超采样倍率（以48 kHz输出为例）	说明
1.024 MHz	64×（音频带宽~16 kHz）	适合语音通话、耳机应用
1.536 MHz	32×	部分高带宽方案
2.048 MHz	128×（音频带宽~16 kHz，更低噪声）	高质量语音
2.8224 MHz	64×（48 kHz输出）	CD级音质
3.072 MHz	64×（48 kHz输出）	最常见的高质量PDM时钟

4.2 时钟抖动（Jitter）的影响

PDM接口对时钟抖动非常敏感。时钟抖动会直接转化为音频噪声，公式近似为：

Noise Level (dBFS) ≈ 20 × log₁₀(2π × f_audio × t_jitter)

例如，在44.1 kHz音频频率下，100 ps的时钟抖动约产生-75 dBFS的噪声基底。因此，在高保真音频应用中，应使用低抖动时钟源（如专用PLL或晶振），而非GPIO翻转时钟。

4.3 常见硬件问题

问题一：时钟串扰到数据线

表现：输出音频中有高频杂散
解决：DATA线与CLK线保持足够间距；必要时加RC低通滤波

问题二：L/R声道混乱

表现：左右声道数据互换或叠加
解决：检查L/R Select引脚电平是否正确；确认主控的PDM通道映射

问题三：降采样滤波器群延迟

表现：多麦克风系统中各麦克风音频相位不一致
解决：选择群延迟一致性好的Decimation Filter；在软件层面做相位校准

5. Decimation Filter（降采样滤波器）

PDM数据流必须经过Decimation Filter才能得到可用的PCM音频数据。Decimation过程包含两个步骤：

积分平均（Boxcar Averaging）：在每个音频采样周期内，对多个PDM超采样位做平均
低通滤波（LPF）：滤除超过奈奎斯特频率的镜像噪声

现代SoC（如高通QCC系列、恒玄BES系列、络达AB系列）通常内置硬件Decimation Filter，支持直接连接PDM麦克风，无需外置DSP。以下是典型Decimation Filter规格：

参数	常见规格	说明
输出采样率	8/16/32/44.1/48 kHz	取决于后端音频算法需求
滤波器类型	CIC + FIR	级联梳状滤波器+有限冲击响应滤波器
群延迟	3~20个采样周期	与滤波器阶数相关，影响多麦克风时延
位深	16/24 bit	降采样后通常输出16或24位PCM

6. 主流PDM麦克风与芯片方案

以下是常见于USB音频模块、TWS耳机和智能音箱中的PDM麦克风及主控SoC搭配方案（注：以下型号参考公开数据手册，实际规格请以原厂为准）：

6.1 PDM麦克风选型参考

品牌	型号	灵敏度	信噪比（SNR）	声学过载点	封装
Knowles	SPH0645LM4H	-26 dBFS	65 dB	120 dB SPL	MEMS
STMicroelectronics	MP34DT01	-26 dBFS	63 dB	120 dB SPL	MEMS
Goertek	S6103	-26 dBFS	62 dB	120 dB SPL	MEMS
AAC	DM019	-26 dBFS	64 dB	120 dB SPL	MEMS

6.2 支持原生PDM输入的主控SoC

品牌	芯片	PDM通道数	典型应用
高通	QCC5144	4	TWS耳机
恒玄	BES2300	2	TWS耳机
络达	AB1562	2	TWS耳机
瑞昱	RTL8762C	2	BLE音频
乐鑫	ESP32	1	IoT语音

7. 应用场景与设计建议

7.1 TWS耳机

TWS耳机通常采用双麦克风方案（FF麦克风用于通话，FB麦克风用于降噪），通过PDM接口直接连接至蓝牙音频SoC。设计要点：

麦克风间距建议≥10 mm，以获得足够的空间角度差用于波束成形
PDM时钟建议使用SoC内置的低抖动PLL，避免GPIO翻转时钟导致的噪声
Decimation Filter的群延迟需纳入ANC算法的时延预算

7.2 智能音箱

智能音箱通常采用多麦克风阵列（4~8颗），使用PDM或TDM接口。设计要点：

多颗麦克风共用同一PDM时钟源，保证相位一致性
麦克风布局需符合阵列几何设计（线性/环形），以优化波束成形效果
PDM数据进入SoC后，通常由DSP运行关键词检测（KWS）和远场拾音算法

7.3 笔记本电脑与USB麦克风

笔记本电脑内置麦克风通常为双PDM麦克风，通过I2S接口连接到编解码器或USB桥接芯片。设计要点：

选择支持硬件PDM Decimation的USB音频芯片，减少CPU开销
注意麦克风开孔位置与整机ID设计的配合，避免声学遮挡

8. FAQ

Q1：PDM麦克风可以直接输出I2S吗？

不能。PDM麦克风输出的是1位超采样数据流，不能直接作为I2S数据使用。必须通过Decimation Filter转换为PCM/I2S格式，或者使用内置Decimation功能的SoC（如高通QCC、恒玄BES系列）。

Q2：PDM时钟抖动如何测量？

可以使用示波器或频谱分析仪测量时钟信号的时序噪声。更精确的方法是使用相位噪声分析仪测量时钟源的抖动谱密度。一般而言，对44.1/48 kHz音频，时钟抖动应控制在200 ps rms以下。

Q3：两颗PDM麦克风能否共用一根数据线？

可以，但需要分时复用（L/R Select分别接VDD和GND），在时钟高电平读取一颗麦克风数据，低电平读取另一颗。这种方式节省布线，但要求主控PDM接口支持L/R分时采样。

Q4：PDM麦克风的声学过载点（AOP）是多少？

主流数字MEMS麦克风的AOP通常为120 dB SPL，部分高声压级型号可达130 dB SPL。选型时需根据实际使用场景（近场/远场、大声压环境）选择合适的AOP。

Q5：为什么PDM常用于TWS而不用于扬声器输出？

PDM是输入（麦克风）接口，用于将模拟声音转换为数字信号。扬声器输出需要DAC，将数字信号转换为模拟声音，使用I2S或PCM接口更为合适。部分D类放大器支持PDM输入（如某些智能功放芯片），但这是将PDM解调后直接驱动扬声器，属于特殊设计。

9. 结论

PDM（脉冲密度调制）是数字MEMS麦克风的事实接口标准，在TWS耳机、智能音箱、笔记本电脑和IoT语音设备中无处不在。其1位高速超采样的工作原理虽然看似简单，但在实际设计中涉及时钟抖动控制、Decimation Filter配置、多麦克风相位校准等多个工程难点。

对于音频硬件工程师，理解PDM是连接声学MEMS传感器与数字信号处理链的关键桥梁；对于嵌入式软件工程师，掌握PDM接口调试和Decimation Filter配置是开发语音相关产品的基础技能。随着语音AI和TWS设备的持续增长，PDM接口的设计能力将成为音频硬件工程师的核心竞争力之一。

注：本文参数参考各芯片原厂公开数据手册（2024-2025年版本），实际设计时请以最新版本原厂规格书为准。