FAQ

欢迎使用Scilab Speech

常见问题解答:

1.为什么SciSpeech不能正确使用?

可能是安装路径有误。
请注意我们的软件必须要安装在scilab-4.0的目录下，比如"C:\Programe Files\Scilab-4.0"。

2.为什么在运行Analysis-->Pre-Emphasis时只能读入"SciSpeech\doc\sample.wav"?

Pre-Emphasis的功能之一是把一段波形当中的噪音滤去，而我们录制的噪音文件"SciSpeech\doc\noise.wav"的频率是8000HZ，所以读入的音频文件的频率也必须是8000HZ，在这里我们只提供了sample.wav这个8000HZ的文件。

3.Synthesis-->Psola method做了什么？

我们这里实现了PSOLA算法，对音频文件进行韵律调整，在界面上我们仅仅用0-9这些数字进行演示。如果要获得更多的信息，请阅读我们的文档和代码。

4.在识别的过程中，为什么会出现识别率低和报错的现象？

首先，我们的系统是特定人语音识别系统，用户必须训练适合自己的模板，系统才能正确地识别您的命令。
其次，报错可能是因为录制音频文件时环境噪音较大，我们推荐您使用较好的麦克风进行录制。
最后，在RecordSetting中我们推荐您使用16000HZ的采样率进行录音，使用更小的采样率可能会影响识别率。

5.点了暂停再点播放为什么是从头开始播放？

点了暂停之后，如果您想从暂停处继续播放，您需要再次点击暂停。

6.点了ZoomIn为什么没有反应？

您需要先选中波形中的一段再点ZoomIn。

7.为什么运行Analysis-->WRLS-VFF很慢？

WRLS-VFF具有较大的计算量，并且需要画三维图，所以需要较长的时间，请您耐心等待。

8.为什么语音识别有些命令会漏掉？

由于我们的系统是孤立词识别系统，所以在录入语音命令时每个孤立词之间需要停顿0.5s左右。请参照我们的demo。