按照使用者的限制而言,语音识别芯片可以分为特定人语音识别芯片和非特定人语音识别芯片,非特定人语音识别是不用针对指定的人的识别技术,不分年龄,性别,只要说相同语言就可以,应用模式是在产品定型前按照确定的十几个语音交互词条,采集200人左右的声音样本,经过PC算法处理得到交互词条的语音模型和特征数据库,然后烧录到芯片上。
应用这种芯片的机器(智能娃娃,电子宠物,儿童电脑)就具有交互功能了语音ic。
非特定人语音识别应用有的是基于音素的算法,这种模式下不需要采集很多人的声音样本就可以做交互识别,但是缺点是识别率不高,识别性能不稳定。
按照说话方式的连续性,语音识别芯片又可分为非连续语音识别和连续语音识别,连续语音识别可以一般自然流利的说话方式来进行人性化的语音识别,但由于关系到相连音的问题,很难达到好的辨认效果。
就是把读取/写入的底层程序写烧入到可编程语音IC内,当然也语音ic可以把声音文件一起烧写进去,如果程序支持的话,还可以外置存储器,达到声音存储扩展的功能。
语音IC的多种多样,采用的手法也有所区别,比如OTP语音IC是一次性的和可重复烧写语音IC都是可编程的,一次性语音IC写入后不能更改,程序和声音文件一次完成通过,可擦除语音IC可以多次重复烧写,程序可以后期修改测试等等。
也许你有听过“工业级”语音IC,也许你有些客户要求温度工作范围在-40~75度,这个时候你可能一脸懵逼,一个破语音IC哪来那么多要求。
商业级(又称民用级),工业级,汽车级以及军工级,一般我们用到多的就是商业级和工业级的芯片,像语音IC,MP3芯片等一般是应用在消费产品上面,所以都是属于民用级芯片,即使有些商机自称自家的芯片的温度范围可以达到工业级芯片,大多一般也是玩弄文字游戏而已,如果有能达到工业级的芯片,一般不是一颗芯片,一般是采用3颗芯片组合而成。