最近对Kaldi这个工具箱有了一些粗浅的体验,踩了不少坑。于是就稍微整理了一下。
下载代码
Kaldi托管在GitHub上,首先需要将代码下载到本地。
git clone https://github.com/kaldi-asr/kaldi
然后进入到Kaldi文件夹,可以观察以下Kaldi的目录结构。
其中./tools,./src和./egs三个目录比较重要:
- ./tools 目录存放Kaldi依赖的包
- ./src 目录存放Kaldi的源代码
- ./egs 目录存放Kaldi官方提供的一些例子
编译安装
检查依赖环境
运行以下命令:
cd tools
extras/check_dependencies.sh
一般会提示需要安装一些依赖的环境,根据提示安装就行。安装完依赖后再运行一次 extras/check_dependencies.sh
出现以下结果就行了。
编译
make -j 20 # 20为并行处理的作业数,可以根据自己的cpu核心数进行修改
然后程序就会自己从网上下载需要的文件进行编译了
然后切换到../src目录运行以下命令:
make depend -j 20
make -j 20 # 这一步花费的时间比较长
kaldi就安装完成了,过程还算比较简单。
验证安装
安装完成了,下面我们验证以下是否安装成功。
进入 kaldi/egs/yesno/s5
目录,运行 ./run.sh
。
脚本首先会下载数据,然后等待运行结果就行了。