SPPAS工具是由Brigitte Bigi(Laboratoire Parole et Langage - Aix-en-Provence - France)开发的。在网上提供免费下载及使用。这是一款目前比较流行的自动标注,音段对齐的工具,目前应用于法语、英语、汉语等都有不错的效果。虽然音段自动对齐的准确率并不完善,但是对于一般的语音研究者来说,能够自动产生出带有音段信息,并且边界相对整齐的Praat标注文件TextGrid已经是大大提升了工作效率。所以推荐给进行语音研究,而且数据量规模很大的朋友。
      有关于这个工具的详细说明,介绍,文档,由此相关的论文等信息请参阅官方网站:
http://www.sppas.org/。在这里只是把使用的时候注意的一些地方写出来,以方便一些可能对插件包安装使用并不熟悉的同学。
       首先是一些使用时的注意事项,请想使用软件的同学务必仔细看一下是否符合。
标注文件,及声音对应的文本文件,都必须是UTF8格式
声音文件必须是单通道文件,16位精度,格式为WAVE或者AU;
所有的文件名称中没有特殊字符,比如中文,空格都不允许,推荐只出现字母,下划线,数字或者横线
声音文件和对应的文本文件名称必须完全一致
 
具体使用步骤应该是
安装工具,在自己的电脑上配置这个工具使用的环境(需要安装三个其它工具)
语音最好是录音条件比较好的数据,即录音环境很安静。发音人语音清晰,这样会明显提升自动标注效果。如果是在嘈杂环境的录音,野外录音,这样的自动标注效果很差。
录音文件每一单位之间,最好有比较清楚的停顿,比如你是录音很多字、词,那么发音人在读字,词之间时,最好有一些停顿;如果是录音很多句子,那么句子之间也要有明显的停顿,这样也可以提高自动标注精度;
然后将这样的文件都添加到SPPAS操作窗口里,选择相应的语言,选择音段对齐选项,点击“执行”就可以产生出来音段对齐的TextGrid了
这其中对于如何把工具环境安装好,对于只有文科基础的同学不太容易操作,但是一旦安装好了,以后就可以直接使用了。