手机语音识别应用中DSP的选择

上传用户：zhuanjifen
上传日期：2013-09-18
文件类型：DOC
文件大小：52.50K
资料积分：0分积分不够怎么办？

资料介绍

手机语音识别应用中DSP的选择
手机语音识别应用中DSP的选择
随着DSP技术的进步，计算能力更强、功耗更低和体积更小的DSP已经出现，使3G手机上
植入更精确更复杂的自动语音识别(ASR)功能成为可能。目前，基本ASR应用可以分成三
大类：1. 语音-文本转换(语音输入)；2. 讲者识别；3. 语音命令控制(语音控制)。
　　这三类功能包含了3G所需的众多ASR性能。语音-
文本转换的典型实例是语音拨号和电子邮件听写。讲者识别功能可以通过语音识别安全
地读出存储器中的个人数据，从而满足信用卡定购和银行服务等保密性高的应用需要。
语音命令控制功能包括连接语音扩展标记语言(VXML)网站内容的语音接口，它支持财经
服务与目录助理等业务。目前VXML被用于规范网站内容的语音标签。
　　语音识别的两种方法
　　3G手机的ASR应用设计可分为两类，即以终端为中心和以客户/服务器为中心的应用
。如图1所示为以终端为中心的设计方法，3G手机(终端)执行整个语音识别过程并送出识
别结果。在图2所示的客户/服务器方法中，终端只是执行预处理特征提取，然后通过一
个误码受保护的数据信道将这些参数发送给中心服务器，中心服务器最终完成语音识别
。如果采用以客户/服务器为中心的设计方法，3G手机应使用数据信道而非移动信道来将
语音发送给服务器进行识别，因为移动信道所用的低速率语音编码会严重影响语音识别
的性能。
　　各种ASR系统的差异主要体现在词汇量上。一个简单的网络设备可能只需要16字的词
库就能实现所要求的语音识别功能，而3G移动手机则需要更大的专业词库。这些词汇可
以跟讲者相关(训练语音识别设备使之熟悉用户的声音特征)或跟讲者无关(语音识别设备
可以识别任何人的声音)，DSP的计算负荷就随着词汇量和训练数据的增加而增大。
　　例如，根据隐性马尔可夫模型(HMM)可以分析一个典型的跟讲者无关的100条命令识
别的应用实例。

标签：手机，语音，识别，应用，的选

手机语音识别应用中DSP的选择

手机语音识别应用中DSP的选择

相关资源手机，语音，识别

相关新闻手机，语音，识别

相关电路手机，语音，识别

相关视频

评论

手机语音识别应用中DSP的选择

相关资源 手机 ，语音 ，识别

相关新闻 手机 ，语音 ，识别

相关电路 手机 ，语音 ，识别

相关视频

评论

相关资源手机，语音，识别

相关新闻手机，语音，识别

相关电路手机，语音，识别