XMOS-2-MIC

品牌 XMOS
推荐主控 XVF3610-QF60B-C
麦克风数量 2个
麦克风类型 PDM 麦克风
输出接口 USB / I2S
采样率 16 / 48 KHz
DSP 内置固件算法(AEC , NC , BF, AGC)
开源情况 不开源,配置的方式

XMOS 2-MIC 语音接口是XMOS最新发布的XCORE.AI系列的芯片XVF3610实现,木瓜电子推荐使用该方案应用到如下设备:

  • 智能电视
  • 智能机顶盒
  • 智能医疗
  • 智能家居
  • 智能会议

评估板

名称 功能描述 状态 购买
P3610-2MIC 评估板 XMOS USB 语音接口评估板 coming soon 淘宝链接

配套芯片

名称 功能描述 状态 购买
XVF3610-QF60-C XMOS 2-MIC语音接口主控芯片 coming soon 淘宝商城
3SM222KMB1HA-022 底部拾音PDM 麦克风 coming soon 淘宝链接
ES7243 高性价比ADC coming soon 淘宝链接

方案背景

如何在嘈杂的环境中(类如厨房/客厅/健身房的环境中)获取干净的人声,是电视/机顶盒/Sound bar等智能设备做语音交互和语音通话必须要解决的问题。然而在现实生活中,嘈杂的环境中,有多种噪声的存在,也阻碍了智能设备有效获取人声:这些噪声包含了:

除了上述噪声,由于Sound bar/电视自身播放声音过大,会导致难以准确有效地获取有用的发言人声音。

一个高性能的语音接口方案在这种设备中,显得尤为重要。高性能语音接口方案,除了解决干扰的噪声问题,可同时提供远距离拾音和语音打断(Barge-in),这样的前端语音方案便可输出干净且有效的人声进行语音交互(ASR)和会议通话(Communication)。

方案概要

XMOS 2-mic 语音接口解决方案是2麦阵列高性价的方案,其内置了2-Mic阵列算法和复杂的DSP算法处理,能够在远处和嘈杂的环境,清晰地获取到有效的人声语音信号。

XMOS 2-mic 语音接口方案的主控为XVF3610-QF60B-C,且已经过了Amazon的AVS认证,其为单芯片解决方案,外接2个PDM麦克风即可实现2-mic阵列的前端声音信号处理。本方案重点能够同时处理两种方向的前端处理信号,分别为用于语音识别和用于会议通话。是市面上为数不多的语言接口方案。

XMOS 2-mic 语音接口方案能够处理上文所述的3种噪声,和提供2种前端方向声音输出,极大的满足了多种场景和多种设备上的使用

XMOS 2-mic 语音接口的主控芯片XVF3610内部集成了USB 2.0 PHY芯片,可以通过USB(UAC1.0协议)接口将处理后的语言信号传输给给智能设备(Host主机),其USB也完善了众多HID report协议,类如keyboard、 telephone以及consumer。在标准的安卓和Linux设备中,能够很好体现人机接口种的语音接口作用。

XVF3610-application

算法框图

算法模块的描述如下:

XMOS 2-MIC算法框图

如上所述,在XMOS 2-mic 的IC噪声源消除环节中,将有效地去除环境中的点噪声。而在自动延时估算算法环节,则能够更加灵活协助的AEC参考信号的变动,以增大智能设备外置扬声器的可能性。XMOS 2-mic 尤其针对ASR的前端处理进行优化,以极大提高语言识别率和语音打断(barge-in)的成功率,减小了适应各大语言识别引擎的调试工作量。

经过上述的算法流程后,其输出的声音效果示例如下:

xvf3610-record-sample

硬件框图

XMOS 2-mic 的主控芯片XVF3610为QFN-60封装,于2021年发布,其配套提供了2套免开发的标准固件,分别针对使用I2S集成到主板的固件和通过USB插入到主板的固件,其硬件框图如下:

XVF3610-HW-ARCH

其中:

在实际的应用场景中,集成了XVF3610的机顶盒主板部分的应用框图如下,其中XVF3610以I2S方式与机顶盒主控连接:

XVF3610-HW-ARCH

关于AEC参考信号的选取方式,XVF3610灵活提供了非常灵活多种的方式

方案特性

主控芯片

音频接口

16KHZ/48kHz的音频采样率

音频算法

应用场景

XMOS 2-mic作为高性价的语音接口方案,智能设备中,不仅可能需要应用到语音交互(ASR),也有可能需要用来做语音通话(Communication)使用;尤其它专门优化了ASR的前端处理,极大提高了语音打断和语音识别的性能。结合其全部特性,推荐用户应用到如下或者类似的智能设备中;

application

技术文档

软件下载