home




主页
简介
5分钟入门指南


语音分析效果
语音合成效果
语音识别效果


预处理
分析
合成
识别
GUI


预处理
时域分析
频域分析
倒谱分析
WRLS-VFF分析
语音合成
语音识别


关于我们
未来工作
bugs
鸣谢
FAQ

欢迎使用Scilab Speech--Talk With Scilab

主页

　人机界面正成为计算机行业的研究重点。“未来，人们在与电脑交流时，可能根本见不到电脑”，出任英特尔人机界面总框架师的颜永红博士说，无论你是坐在沙发上还是躺在床上，只要通过说话，就可以和电脑无线连接指挥它工作。为了实现计算机的智能功能,实现人与计算机的智能交互,语音是必不可少的.实现完美的人机语音交互，不仅需要计算机能够“听懂”人类自然语言，也就是具备语音识别功能，还必须能够“说出”人类听懂的自然语言，即具备语音合成功能。

　随着蓝牙等无线通讯设备的普及，将语音交互系统合理地应用在智能手机、PDA以及机器人等智能设备中，以简化操作、提高工作效率已经成为可能。正因为如此，语音交互系统的设计成为了微软，摩托罗拉等大公司的研发热点，并已有了一些比较成型的系统。如，微软公司的语音控制pda操作软件“voicecommand"，ibm实现对个人电脑语音操作、听写等功能的ibm viavoice, 科大讯飞的语音合成系统interphonic等。这些在业界颇负盛名的语音交互软件，却因为其高昂的价格和不开放源码等特点，使得很多用户和有志于扩展的研发人员望尘莫及，并且不具有语音分析功能.我们设计了比较完善的语音分析，合成，识别工具包，能提供较为完善的语音分析，并且公开源码，便于进行语音信号分析的开发人员使用和扩展代码。

　我们的工具包能够提供完善的语音分析功能，MATLAB中的voicebox语音包仅提供少数的语音分析的函数，我们提供了较为完善的时域分析，频域分析，倒谱系数分析，自适应加权递归最小二乘分析的函数，便于进行语音信号处理的科学工作者提取语音的各方面特征进行研究。

　我们提供先进的韵律调整功能。我们使用psola算法，在保持原始语音的主要音段特征的前提下，提供能够在音节拼接时灵活的调整语音的基因，能量，音长等韵律特征的功能。公开的源代码，方便读者将其应用在语音合成系统中。

　我们提供实用的语音识别系统，能够在较短的时间内实现对语音命令的识别，并且能达到较好的识别率。我们的系统可以完成语音拨号功能，还可以语音控制电脑关机，重起，注销，打开scilab帮助等功能。用户经过略微修改就能够完成ibm viavoice以及微软的voicecommand的语音命令控制电脑，语音拨号，语音查找姓名等功能，可以很方便的应用在智能手机、pda、声控自动控制等系统上。

　总之，我们能够希望为scilab的语音处理，分析，识别领域做出贡献，现在的版本是v1.0.0 并且适合windows和linux两个平台。

　通过SciSpeech，您可以和Scilab自由地交谈，下面请让我带您进入SciSpeech的绚丽世界。

关于|联系我们|厦门大学|新闻组