欢迎使用Scilab Speech

常见问题解答:

1.为什么SciSpeech不能正确使用?

可能是安装路径有误。
请注意我们的软件必须要安装在scilab-4.0的目录下,比如"C:\Programe Files\Scilab-4.0"。

2.为什么在运行Analysis-->Pre-Emphasis时只能读入"SciSpeech\doc\sample.wav"?

Pre-Emphasis的功能之一是把一段波形当中的噪音滤去,而我们录制的噪音文件"SciSpeech\doc\noise.wav"的频率是8000HZ,所以读入的音频文件的频率也必须是8000HZ,在这里我们只提供了sample.wav这个8000HZ的文件。

3.Synthesis-->Psola method做了什么?

我们这里实现了PSOLA算法,对音频文件进行韵律调整,在界面上我们仅仅用0-9这些数字进行演示。如果要获得更多的信息,请阅读我们的文档和代码。

4.在识别的过程中,为什么会出现识别率低和报错的现象?

首先,我们的系统是特定人语音识别系统,用户必须训练适合自己的模板,系统才能正确地识别您的命令。
其次,报错可能是因为录制音频文件时环境噪音较大,我们推荐您使用较好的麦克风进行录制。
最后,在RecordSetting中我们推荐您使用16000HZ的采样率进行录音,使用更小的采样率可能会影响识别率。

5.点了暂停再点播放为什么是从头开始播放?

点了暂停之后,如果您想从暂停处继续播放,您需要再次点击暂停。

6.点了ZoomIn为什么没有反应?

您需要先选中波形中的一段再点ZoomIn。

7.为什么运行Analysis-->WRLS-VFF很慢?

WRLS-VFF具有较大的计算量,并且需要画三维图,所以需要较长的时间,请您耐心等待。

8.为什么语音识别有些命令会漏掉?

由于我们的系统是孤立词识别系统,所以在录入语音命令时每个孤立词之间需要停顿0.5s左右。请参照我们的demo。

 
 
 
Copyright (C) 2006-2007 Scilab group of Xiamen University, China