一个完整的基于统计的语音识别系统可大致分为三部分:。
(1)语音信号预处理与特征提取,(2)声学模型与模式匹配,(3)语言模型与语言处理选择识别单元是语音识别研究的第一步,语音识别单元有单词(句),音节和音素三种,具体选择哪一种,由具体的研究任务决定。
语音芯片单词(句)单元广泛应用于中小词汇语音识别系统,但不适合大词汇系统,原因在于模型库太庞大,训练模型任务繁重,模型匹配算法复杂,难以满足实时性要求。
音节单元多见于汉语语音识别,主要因为汉语是单音节结构的语言,而英语是多音节,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少,因此,语音识别芯片对于中,大词汇量汉语语音识别系统来说,以音节为识别单元基本是可行的。
音素单元以前多见于英语语音识别的研究中,但目前中,大词汇量汉语语音识别系统也在越来越多地采用,原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成,且声韵母声学特性相差很大,实际应用中常把声母依后录音芯片续韵母的不同而构成细化声母,这样虽然增加了模型数目,但提高了易混淆音节的区分能力。
由于协同发音的影响,音素单元不稳定,所以如何获得稳定的音素单元,还有待研究。
如何把语音放入语音芯片中。
1,就是把读取/写入的底层程序写烧入到可编程语音芯片内,当然也可以把声音文件一起烧写进去,如语音模块果程序支持的话,还可以外置存储器,达到声音存储扩展的功能。
2,语音芯片的多种多样,采用的手法也有所区别,比如OTP语音芯片是一次性的和可重复烧写语音芯片都是可编程的,一次性语音芯片写入后不能更改,程序和声音文件一次完成通过,可擦除语音芯片可以多次重复烧写,程序可以后期修改测试等等。
广州市九芯电子科技有限公司专注于语音芯片,语音模块,语音IC,录放音芯片,语音识别芯片,语音识别模块,音乐芯片,MP3解码芯片研发与语音产品方案设计为基础,面向音频播放,识别方向的人工智能以及集成电路电子为中心的高新技术企业。