最近对Kaldi这个工具箱有了一些粗浅的体验,踩了不少坑。于是就稍微整理了一下。

下载代码

Kaldi托管在GitHub上,首先需要将代码下载到本地。

git clone https://github.com/kaldi-asr/kaldi

然后进入到Kaldi文件夹,可以观察以下Kaldi的目录结构。

其中./tools,./src和./egs三个目录比较重要:

编译安装

检查依赖环境

运行以下命令:

cd tools
extras/check_dependencies.sh

一般会提示需要安装一些依赖的环境,根据提示安装就行。安装完依赖后再运行一次 extras/check_dependencies.sh 出现以下结果就行了。

编译

make -j 20 # 20为并行处理的作业数,可以根据自己的cpu核心数进行修改

然后程序就会自己从网上下载需要的文件进行编译了

然后切换到../src目录运行以下命令:

make depend -j 20
make -j 20 # 这一步花费的时间比较长

kaldi就安装完成了,过程还算比较简单。

验证安装

安装完成了,下面我们验证以下是否安装成功。 进入 kaldi/egs/yesno/s5 目录,运行 ./run.sh。 脚本首先会下载数据,然后等待运行结果就行了。

References