在 AI 语音产品的 BOM 清单里,主控 SoC 和麦克风阵列往往是讨论的焦点。但有一类角色经常被忽略,却在产品体验中扮演着关键作用——音频 Codec。
TP9311 就是一颗这样的芯片。它不参与 AI 计算,不运行神经网络,但它决定了三件事:设备能不能听清用户的话、能不能让对方听清自己、能不能播好语音应答。
一、AI 语音产品的音频链路中,Codec 承担什么角色?
任何 AI 语音产品的交互都遵循一个基本闭环:听→理解→思考→回应。
其中有两个环节直接依赖 Codec:
听(采集端):麦克风拾取声音,Codec 的 ADC 完成模数转换,把声波变成数字信号交给主控。
回应(回放端):主控生成应答内容,Codec 的 DAC 完成数模转换,驱动扬声器或耳机播放声音。
这两个环节的质量决定了整个交互体验的起点和终点——拾音不好,AI 听不懂;播放不好,用户听不清。
TP9311 就是同时负责这两件事的单声道音频 Codec。一颗芯片,同时处理采集和回放。
二、TP9311 的技术参数说明了什么?
以下数据来自规格书(测试条件:25℃,VDD=3.3V,VDDIO=3.3V,采样率 48kHz):
ADC(采集)
信噪比(SNR):106dB(PGA=0dB)
总谐波失真+噪声(THD+N):-92dB
差分输入,支持可编程 PGA 增益 0~42dB(步进 3dB)
DAC(回放)
信噪比(SNR):110dB(A 计权,自动静音禁用)
总谐波失真+噪声(THD+N):-96dB
耳机驱动:9mW@32Ω(单端模式)
功耗
录音+播放总功耗:2.8mA(PGA=42dB,PLL 关闭,主时钟 6.144MHz)
这些数据的意义:
106dB ADC SNR:远场拾音时,微弱人声不易被底噪淹没。这对语音唤醒率和识别准确率有直接影响。
110dB DAC SNR + -96dB THD+N:播放的应答声音干净、低失真,用户听感自然。
2.8mA 录放总功耗:对于电池供电设备(智能穿戴、便携录音、行车记录仪),这个功耗意味着可以长时间持续工作。
三、TP9311 在 AI 语音产品中的典型应用价值
1. 单芯片同时处理"听"和"说"
很多 AI 语音产品只需要单声道采集和单声道回放(智能穿戴、车载语音、安防对讲、家电语音控制)。这类产品如果用纯 ADC + 独立 DAC + 功放的分离方案,BOM 成本高,PCB 面积大。
TP9311 一颗芯片整合了 ADC、DAC、耳机驱动、麦克风偏置、PLL、LDO,单芯片覆盖采集和回放全链路,系统设计更简洁。
2. 内置 EQ 和 DRC,分担主控处理负载
EQ(均衡器)和 DRC(动态范围压缩)是 AI 语音产品的常见需求:
EQ:针对不同声学环境(音箱腔体、车内空间、会议室)调整频响曲线,让语音更清晰。
DRC:控制播放音量动态范围,避免应答内容音量突变(比如从安静提示到响铃的切换)。
如果主控 SoC 没有 DSP 或者算力紧张,TP9311 内置的可编程 IIR 滤波器和 DRC 可以直接完成这些处理,不占用主控资源。
3. 差分输入适配复杂环境
在车载、机器人、安防等场景,电磁干扰是常态。TP9311 采用差分输入(管脚 MICPA/MICNA),共模抑制能力强,能有效对抗电机、射频等干扰源,直接体现为录音底噪更低、语音更干净。
4. 宽温工作范围覆盖多场景
-40℃~85℃ 的工作温度范围,同时满足消费电子和车载场景的应用要求。
5. ESD 防护
规格书标称 HBM ±8kV、CDM ±500V,符合工业级 ESD 标准。
四、TP9311 在实际产品中解决什么问题?
以下从系统设计角度,拆解几个典型场景中 TP9311 如何发挥作用:
场景 1:行车记录仪
需求:双麦克风降噪、播报语音提示("开始录像""碰撞已保存"),车载环境电磁干扰严重,PCB 空间紧凑。
TP9311 的作用:差分输入有效抑制车载电磁干扰;DAC 播报提示音,EQ 可针对车内声学环境优化语音清晰度;录放总功耗 2.8mA,适合车辆熄火后仍待机的工作模式。
场景 2:AI 陪伴机器人
需求:嘈杂环境中拾取儿童语音、播放故事/音乐、抗电机干扰。
TP9311 的作用:ADC 106dB SNR 保障嘈杂环境拾音;DAC 播放应答和故事内容,DRC 避免音量突变;差分输入抵抗机器人运动电机产生的干扰。
场景 3:智能安防门铃
需求:双向语音对讲、PoE 供电、长期待机。
TP9311 的作用:单芯片同时支持采集和回放,简化方案设计;低功耗适合长期在线;差分输入抗远距离门铃线缆耦合的共模噪声。
场景 4:智能手表/穿戴设备
需求:小尺寸、低功耗、语音交互。
TP9311 的作用:QFN 3×3mm 小封装适合穿戴设备;2.8mA 录放功耗对电池友好;内置麦克风偏置减少外围器件。
场景 5:智能家居/白电
需求:语音控制、抗电机噪声。
TP9311 的作用:差分输入抗压缩机、风扇等电机运行时的电磁干扰;内置 PLL 适配家电主控常用时钟;DAC 播报操作提示音,EQ 可针对家电安装环境(如厨房、客厅)优化频响。
五、系统设计要点
1. 电源方案
支持 1.8V~3.3V 单电源供电,内部集成 LDO。PCB 布局建议:AVDD 和 VDDIO 分开走线,靠近芯片引脚放置去耦电容(10μF + 0.1μF),底部散热焊盘(EPAD)接地。
2. 时钟方案
内置 PLL,支持 0.512MHz~20MHz 输入时钟,可适配主控 SoC 常见输出频率(6.144MHz、12.288MHz、24.576MHz 等)。
3. I²C 配置
需注意的关键寄存器项:
ADC PGA 增益(0~42dB,步进 3dB)
HPF 使能(建议启用,消除直流偏移和低频漂移)
EQ 频段设置(根据产品声学环境调整)
DRC 阈值(根据扬声器/耳机特性设定)
4. I²S 接口
支持标准 I²S 格式,位时钟最高 20MHz,左右声道时钟最高 200kHz,可适配主流 SoC 的音频接口。
六、与 TP9243S 的定位差异
本文聚焦 TP9311 单芯片方案。TP9243S 是纯立体声 ADC,适合多通道麦克风阵列场景;TP9311 是单声道 Codec,适合单麦采集+单声道回放场景。两者定位不同,选型需根据产品需求决定——如果需要多通道采集且有独立的回放链路,可选择 TP9243S;如果只需要单通道采集和回放,TP9311 单芯片即可覆盖。
七、小结
在 AI 语音产品中,算力和算法固然重要,但如果音频信号在物理层面已经受损,算法难以弥补。
TP9311 不参与 AI 计算,不运行模型推理,但它确保了音频信号在"进入 AI 之前"和"离开 AI 之后"这两个环节的质量。
对于硬件工程师,这是一颗可以快速集成、减少外围器件、降低功耗的音频解决方案。对于产品层面,这意味着语音交互的基础体验有可靠的物理层保障。
TP9311方形框图▲
技术数据基于 TP9311_CN_V1.01 规格书,测试条件:25℃,VDD=3.3V,VDDIO=3.3V,采样率 48kHz。