一个完整的基于统计的语音识别系统可大致分为三部分:。
(1)语音信号预处理与特征提取,
(2)声学模型与模式匹配,
(3)语言模型与语言处理选择识别单元是语音识别研究的第一步,语音识别单元有单词(句),音节和音素三种,具体选择哪一种,由具体的研究任务决定。
单词(句)单元广泛应用于中小词汇语音识别系统,但不适合大词汇系统,原因在于模型库太庞大,语音识别ic训练模型任务繁重,模型匹配算法复杂,难以满足实时性要求。
音节单元多见于汉语语音识别,主要因为汉语是单音节结构的语言,而英语是多音节,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少,因此,对于中,大词汇量汉语语音识别系统来说,以音节为识别单元基本是可行的。
语言模型对中,大词汇量的语音识别系统特别重要,当分类发生错误语音ic时可以根据语言学模型,语法结构,语义学进行判断纠正,特别是一些同音字则必须通过上下文结构才能确定词义,语言学理论包括语义结构,语法规则,语言的数学描述模型等有关方面,目前比较成功的语言模型通常是采用统计语法的语言模型与基于规则语法结构命令语言模型。
因为这样的芯片必须要量大才便宜,因为量小了,分摊下来,成本其实也不低,语音存储的时间短,播放的音质差语音ic,并且不可重复的更换语音,因为它内部实现的方法是将语音文件压缩成WAV的文件,直接存储在芯片内部,这样就会导致语音被压缩的非常的厉害。
语音识别芯片方案,虽然其语音播报灵活,但是语音识别的高额成本也限制了其的发展。
支持循环播放,随机播放,一对一播放等等,十分灵活,出货为封装片,保证了良率,对数量无任何要求,硬件的外围电路是极其简单的,bom成本低廉。