14.5.3 MSLS+$\Delta $MSLS

14.18 に実行例を示す. 実行後,MFBANK26_0.spec というファイルが生成される. このファイルは,リトルエンディアン,32 ビット浮動小数点数形式で表された 26 次元ベクトル列を格納している. うまく特徴抽出できないときは, data ディレクトリに f101b001.wav ファイルがあるかチェックしよう.

> ./demo.sh 2
 UINodeRepository::Scan()
 Scanning def /usr/lib/flowdesigner/toolbox
 done loading def files
 loading XML document from memory
 done!
 Building network :MAIN
Figure 14.18: 実行例

本サンプルに含まれるモジュールは,12 個である. MAIN (subnet) に 3 個 MAIN_LOOP (iterator) に 9 個のモジュールがある. MAIN (subnet) と MAIN_LOOP (iterator) を 図 14.19,14.20 に示す. 処理の概要は,AudioStreamFromWave モジュールで取り込んだ音声波形を MSLSExtraction で音響特徴量を計算し,SaveFeatures でファイルに書き出す 単純なネットワーク構成である. MSLSExtraction は, MSLS の計算に メルフィルタバンクの出力とパワースペクトルを必要とするため, 取り込んだ音声波形は, MultiFFT によって分析され, MatrixToMap と PowerCalcForMap によってデータ型を変換した後に MelFilterBank により メルフィルタバンクの出力を求める処理が入っている. MSLSExtraction は, MSLS 係数の他に $\delta $ MSLS 係数の格納領域をリザーブし,MSLSExtraction の FBANK_COUNT プロパティで指定した値の 2 倍のベクトルを特徴量として 出力する.$\delta $ MSLS 係数の格納領域には 0 が入れられている. Delta により,$\delta $ MSLS 係数が計算され格納される. SaveFeatures は,入力 FEATURE を保存する.入力 SOURCES には ConstantLocalization で生成した正面の定位結果を与える.

\includegraphics{fig/recipes/demo-FeatureExtraction2-MAIN}
Figure 14.19: MAIN (subnet)
\includegraphics[width=\linewidth ]{fig/recipes/demo-FeatureExtraction2-MAIN_LOOP}
Figure 14.20: MAIN_LOOP (iterator)

14.15 に主要なパラメータ表を示す.

Table 14.15: パラメータ表

ノード名

パラメータ名

設定値

MAIN_LOOP

LENGTH

subnet_param 

int :ARG2

 

ADVANCE

subnet_param 

int :ARG3

 

SAMPLING_RATE

subnet_param 

int :ARG4

 

FBANK_COUNT

subnet_param 

int :ARG5

 

DOWHILE

bool 

(empty)

Delta 

FBANK_COUNT

subnet_param 

FBANK_COUNT