技术与讨论 ICRoute

 

以下是开发者对于语音识别芯片在开发过程中经常讨论的问题:

1. 如何用目前的LD3320实现简单的外文单词识别?
3. 用LD3320语音识别芯片开发产品,需要购买或者使用其他软件或者工具么?
4. 是否有语音识别模块供快速开发验证使用?
5. 该如何在电子产品设计中合理地设计语音声控界面,达到最好的实用性?
6. 调试实现了语音识别功能后,该如何调整语音识别产品来获得更好的识别效果?
7. 接入LD3320芯片的晶振频率不一样,是否会对LD3320芯片的工作性能带来影响?

 

1. 如何用目前的LD3320实现简单的外文单词识别?

目前推出的LD3320支持的是非特定人中文语音识别。
有很多开发者询问是否可以支持简单的外文单词的识别,或者是一些纯方言发音的词汇的识别。
在没有正式推出其他语种的语音识别芯片之前,开发者可以用LD3320来部分满足这一需求:用拼音标注的办法来标出所要识别的外文单词或者是存方言发音的词汇。就如同刚刚学英语时在课本上用拼音来标注英文单词读音一样。
具体的描述可以参考语音识别芯片LD3320高阶秘籍.pdf中第六项”用拼音标注外文或者方言“。

 

3. 用LD3320语音识别芯片开发产品,需要购买或者使用其他软件或者工具么?

开发者不需要其他任何附加的软件或者工具,只需要在自己产品的主控MCU中进行编程,就可以完成对LD3320的开发。 主控MCU对于LD3320的控制,是通过读写LD3320的寄存器来完成。具体的寄存器说明见“LD332X 开发手册.pdf”。
开始时是设置寄存器对LD3320进行初始化。
然后是通过设置寄存器,把要识别的关键词语的拼音串传入LD3320芯片。
再通过设置寄存器控制LD3320开始启动一次识别过程,AD开始工作采集用户声音,在得到识别结果后,以中断的形式通知主控MCU。此时可以从特定寄存器中读取到识别结果。
开发者只需要熟悉自己产品的主控MCU编程,就可以完成语音识别功能的设计和使用。不再需要其他任何的软件,工具,或者是和语音识别算法相关的采集语音数据训练语音数据等工作。
这样,可以协助开发者以最快的速度把语音识别功能集成进产品中,并取得良好的识别效果。

 

4. 是否有语音识别模块供快速开发验证使用?

为了方便开发者快速开发使用LD3320语音识别芯片,ICRoute推出语音识别模块M-LD3320
模块将LD3320芯片与周围必要的容阻件集成在一块PCB上,将LD3320的芯片管脚通过2*20的排针引出。方便用户可以在面包板或者标准DIP40插座等设备上对LD3320芯片进行快速开发。

 

5. 该如何在电子产品设计中合理地设计语音声控界面,达到最好的实用性?

在完成对LD3320芯片的验证开发后,产品设计开发者面临的问题就是如何在自己的电子产品中,最大限度地发挥语音识别芯片的功能,设计出实用,合理的声控智能语音界面。
通过对语音识别技术ASR的分析,结合语音识别芯片LD3320的技术参数特性,声控智能产品语音界面设计指南给出了在电子产品中设计声控语音界面的思路,并结合具体产品的设计,举例说明了具体的应用流程,可以帮助产品定义工作者更好地定义出语音声控产品。

 

6. 调试实现了语音识别功能后,该如何调整语音识别产品来获得更好的识别效果?

开发者实现了语音识别功能后,会需要结合自己的产品对识别效果进行仔细的调整。
1. 周围环境的声音
2. 识别列表的内容设置:是发音响亮的开口音还是不容易发音的闭口音
3. 识别列表各个词语之间的相互差别程度
4. 说话人的发音清晰/大小/快慢/认真程度/口音
5. 用户操作流程的设置
6. 外接麦克风的物理特性
7. 说话人是否放开音量
等等。
所以开发者应该从如下三点入手调整具体产品的实现效果:
1. 规划更符合产品应用环境的语音声控界面。这个问题可以参考声控智能产品语音界面设计指南
2. 选择最适合的麦克风。麦克风的质量决定了送怎样质量的声音给语音识别芯片LD3320,从根本上决定了识别效果的好坏和识别距离的远近。 3. 在以上两步的基础上,调整LD3320芯片自身的一些相关参数,来获得更好的效果。
关于以上的第2和第3两点,请阅读语音识别芯片LD3320高阶秘籍的相关章节:
第9节 麦克风,相关寄存器设置与识别效果和距离。
第8节 调节语音结束后得到识别结果的反应时间。

 

7. 接入LD3320芯片的晶振频率不一样,是否会对LD3320芯片的工作性能带来影响?

LD3320芯片的31管脚CLK是(对应M-LD3320模块的32排针ICR_CLK)是晶振输入管脚。支持的晶振频率范围为4~48MHZ。
这个管脚输入的晶振信号,到LD3320芯片内部,经过PLL模块后,会形成LD芯片需要的晶振信号,提供给内部的硬件模块,以及AD和DA模块使用。
所以,无论外部从CLK管脚输入的晶振信号是高还是低,只要是在LD芯片支持的范围内,都不会对LD芯片的工作性能带来影响。输入频率高也不会让LD芯片工作的更快,输入频率低也不会导致识别速度变慢。
一定需要注意的是:开发者需要根据实际输入的晶振信号的频率,对应修改参考程序:LD332X 芯片参考程序LD_Demo_SourceLDChip.h中的变量:
#define CLK_IN 22.1184 /* user need modify this value according to clock in
由此可以得出另外一个结论:接入主控单片机的晶振频率和接入LD3320芯片的晶振频率,两者之间没有任何关系。两者的频率可以一样,也可以不一样,需要开发者结合自己产品的设计来作具体选择。