芯声智能XS2001/XS2002:超低功耗AI音频前端芯片,1mA@5MHz唤醒功耗重新定义语音前端

XS2001/XS2002是芯声智能推出的国产超低功耗音频DSP/NPU芯片,集成RISC-V CPU与神经网络单元,1mA@5MHz典型功耗,576kB SRAM,4路低功耗ADC,适用于TWS耳机、智能手表与智能音箱等语音前端场景。

芯声智能XS2001/XS2002:超低功耗AI音频前端芯片,1mA@5MHz唤醒功耗重新定义语音前端

1. 产品定位与市场背景

在TWS耳机、智能手表、智能音箱等便携音频设备中,语音交互已成为核心功能之一。而实现高质量语音交互的第一步,是一颗能够以极低功耗完成声音采集、回声消除(AEC)、AI降噪和语音唤醒的音频前端芯片。

XS2001/XS2002是国产芯片厂商芯声智能(Xinsheng Intelligence)推出的高性能超低功耗音频DSP/NPU芯片系列。该芯片专为AI音频算法处理设计,在1mA@5MHz的极致低功耗与200MHz最高工作频率之间实现了出色的平衡,为便携式语音前端设备提供了差异化的芯片选择。

本文将对XS2001/XS2002的架构设计、核心参数、典型应用及选型要点进行深度解析。

2. 核心架构解析

2.1 三核异构计算架构

XS2001/XS2002采用三核异构计算架构,集成了三类处理单元:

处理单元规格职责
RISC-V CPU32位,最高200MHz系统控制、协议栈、算法调度
DSP内核SIMD指令,支持并行MAC,浮点运算传统音频算法:滤波器、AEC、AGC
NPU(神经网络单元)内置神经网络计算库AI降噪、唤醒词识别、声音事件检测

这种异构设计的核心思路是**"专业工具做专业事"**:传统DSP擅长实时音频滤波和回声消除这类确定性算法,而NPU则专门处理神经网络推理任务,如基于深度学习的降噪模型和关键词检测。两类计算单元共享576kB SRAM,通过DMA实现高效数据交换。

2.2 存储系统

芯片内置576kB SRAM,对于典型的语音前端算法(如AEC + 降噪 + 唤醒级联)来说,这一存储容量足够容纳:

  • 双向语音缓冲(典型16kHz采样,每帧20ms,共约640样本 × 2路 × 4字节 ≈ 20KB)
  • 深度学习模型权重(取决于模型大小,一般100KB~500KB)
  • 运行时中间结果缓存

2.3 低功耗架构设计

XS2001/XS2002的低功耗设计是其最大亮点。官方标称1mA@5MHz典型工作电流,这在AI音频芯片领域处于行业领先水平。其低功耗实现依赖于以下技术:

  1. 多电压域频率调节(DVFS):芯片支持根据算法负载动态调节工作频率和电压。在语音检测(VAD)场景下,可以降至5MHz/0.9V的低功耗状态,电流仅1mA。
  2. 高效唤醒机制:NPU支持即时唤醒功能,从休眠到完成关键词检测的启动时间在亚毫秒级,避免了长时间高频运行。
  3. 单芯片内置LDO:无需外部DCDC或LDO芯片,降低了系统BOM功耗和布板复杂度。

3. 音频子系统详解

3.1 4路低功耗ADC

XS2001/XS2002内置4路12位低功耗ADC,是芯片模拟前端的亮点设计:

  • 分辨率:12位(相对于传统16/24位ADC看似不高,但结合PGA和DSP处理,对语音应用足够)
  • 单路功耗:约60μA(极低)
  • PGA增益范围:-6dB至+30dB,可通过I2C软件配置
  • 输入阻抗:典型值50kΩ
  • 全幅输入电压:1.2Vpp

这4路ADC可以配置为:

  • 4路模拟麦克风输入(通过MEMS麦克风偏置电路)
  • 4路数字麦克风输入(PDM或TDM接口)
  • 混合配置(部分模拟 + 部分数字)

3.2 TDM/I2S音频接口

芯片通过TDM/I2S接口输出处理后的音频:

  • 最高支持8路输入、2路输出
  • 采样率范围:8kHz~192kHz
  • 数据位宽:16/20/24/32位可选
  • I2S主时钟:最高12.288MHz

对于TWS耳机这类双耳方案,8通道输入能力允许芯片同时采集左耳、右耳以及外置麦克风的多路音频信号,进行空间音频处理或双耳同步降噪。

4. 接口与外设

XS2001/XS2002提供丰富的外设接口,可适应多种系统集成场景:

接口XS2001XS2002说明
TDM/I2S最高8入2出
SPI从模式主/从模式最高15MHz
I2C主/从模式用于配置内部寄存器
UART调试或通信
GPIO按键、LED等

封装选择

  • XS2001:WLCSP-25(2.188mm × 2.188mm)—— 超小封装,适合TWS耳机等空间敏感场景
  • XS2002:QFN-32(4mm × 4mm × 0.75mm)—— 更适合智能音箱等对引脚数量有需求的应用

供电设计

  • VDDIO(I/O和模拟电源):1.6V~3.6V(典型1.8V或3.3V)
  • VREG_IN(核心LDO输入):1.09V~3.6V(典型1.2V/1.8V/3.3V)
  • 内置LDO,无需外部稳压器

ESD防护:HBM 2kV(所有引脚),满足消费电子的静电要求。

5. 典型应用场景

5.1 TWS耳机与蓝牙耳机

TWS耳机是XS2001/XS2002最直接的应用场景。在TWS方案中,耳机需要:

  • 单耳独立唤醒:用户说"Hi耳机"即可激活语音助手
  • 通话降噪(ENC):双麦或三麦阵列采集环境噪声,通过AI降噪算法抑制
  • 骨振动融合(部分高端方案):结合VPU骨传导传感器区分人声和环境噪声

XS2001/XS2002可以作为TWS耳机的独立语音前端处理器,通过TDM/I2S接口与蓝牙音频SoC(如恒玄BES、络达AB、瑞昱RTL8763等)连接,承担所有语音信号处理任务,从而降低蓝牙SoC的DSP负载,延长音乐播放续航。

5.2 智能手表与可穿戴设备

智能手表在跑步等运动场景中,用户通常无法便捷地触控屏幕,语音指令成为主要交互方式。XS2001/XS2002的超小封装(WLCSP-25,仅2.188mm × 2.188mm)和1mA低功耗,使其成为智能手表语音前端的理想选择。

5.3 智能音箱与智能屏

智能音箱需要在远场(通常3~5米)采集用户语音,并压制设备自身播放音乐产生的回声。XS2001/XS2002的高性能AEC和NPU降噪能力,可与主控SoC配合实现远场语音增强。

5.4 会议系统与商务麦克风

在在线会议场景中,USB会议麦克风需要同时处理多人发言(动态范围压缩)、回声消除和环境降噪。XS2001/XS2002的4路ADC输入和200MHz处理能力,可支持4麦克风阵列的波束形成算法,实现360°全向拾音和声源定位。

6. 与USB音频芯片的协同设计

需要特别指出的是,XS2001/XS2002并非USB音频SoC,它是一颗纯粹的音频前端处理芯片。这意味着:

  • XS2001/XS2002不直接提供USB接口,需要通过I2S/TDM接口连接到带USB接口的蓝牙SoC或USB桥接芯片
  • 在设计时,通常需要搭配一颗USB音频芯片(如CM108B、CX21988、KT0200等)形成完整方案

典型系统架构如下:

[模拟麦克风 × 2~4] → [XS2001/XS2002] → [TDM/I2S] → [蓝牙SoC或USB音频芯片] → [USB-C接口] → [手机/PC]
                       (AI降噪+AEC+唤醒)

这种专业分工的架构正在成为TWS耳机和高端音频设备的主流方案:专业的语音前端芯片处理唤醒和通话降噪,专业的蓝牙音频SoC处理音乐播放和无线传输。

7. 选型对比:XS2001 vs XS2002

参数XS2001XS2002
封装WLCSP-25(2.188×2.188mm)QFN-32(4×4×0.75mm)
SPI从模式主/从模式
I2C✅ 主/从
UART
外部Flash启动✅(SPI NOR Flash)
适用场景TWS耳机、可穿戴设备智能音箱、会议麦克风

选型建议

  • TWS耳机/可穿戴:选XS2001,WLCSP封装体积最小,适合PCB空间受限的腔体设计
  • 智能音箱/会议系统:选XS2002,QFN封装引脚更多,可外挂SPI Flash实现更灵活的启动方式

8. 设计注意事项

8.1 麦克风选型与布线

XS2001/XS2002的内置ADC为12位,对MEMS麦克风的选型有以下建议:

  • 推荐选用信噪比≥64dB的MEMS麦克风(如楼氏IMI、敏芯微等国产型号)
  • 麦克风偏置电路需靠近芯片放置,以减小RF干扰
  • 麦克风走线应使用差分对称布线,远离电源和高速数字信号

8.2 电源设计

虽然芯片内置LDO,但在低功耗设计时仍需注意:

  • VDDIO建议使用LDO单独供电,避免与数字电源噪声相互干扰
  • 在休眠状态下,可通过GPIO控制麦克风偏置的通断,进一步降低功耗

8.3 时钟设计

  • XS2001支持32.768kHz晶体(用于RTC和低功耗唤醒)
  • XS2002额外支持8MHz、19.2MHz、24MHz晶体
  • 建议使用有源晶振替代晶体,以获得更精确的时钟,降低音频采样偏差

9. 总结

XS2001/XS2002是一款在AI音频前端领域具有鲜明特色的国产芯片。其核心优势在于:

  1. 1mA@5MHz的超低检测功耗,满足可穿戴设备对续航的严苛要求
  2. RISC-V + DSP + NPU三核异构架构,兼顾传统音频算法和神经网络算法的高效运行
  3. WLCSP-25超小封装,为TWS耳机等空间敏感产品提供语音前端解决方案
  4. 4路低功耗ADC,支持模拟/数字麦克风灵活配置

在国内音频芯片行业普遍聚焦于USB音频SoC的情况下,芯声智能选择专注语音前端处理这一细分赛道,为TWS耳机、智能手表和智能音箱厂商提供了差异化的芯片选择。随着AI语音交互应用场景的持续扩展,XS2001/XS2002所代表的低功耗AI音频前端方案,有望在更多便携设备中落地。


规格参数参考芯声智能官方数据手册。设计时应以最新版本数据手册为准。

最后更新: