音源定位結果が細かく切れてしまう / 全部繋がってしまう

Problem

ときに読む.

Solution

SourceTracker モジュールの PAUSE_LENGTH プロパティの値を適切に設定すればよい.

  1. SourceTracker モジュールを DisplayLocalization モジュールに接続し,定位結果を表示する.

  2. 適当な文章を読み上げて定位結果を見る.

  3. 定位結果が途切れる: PAUSE_LENGTH の値を大きくする.

  4. 定位結果がつながりすぎる: PAUSE_LENGTH の値を小さくする.

Discussion

SourceTracker モジュールの PAUSE_LENGTH プロパティの目的は,発話の息継ぎなどで LocalizeMUSIC モジュールの MUSIC スペクトルのパワーが下がっても, 連続した音声として定位し,適切に音声認識させることである. 人の発話に限らず,実際は途切れている音でも連続した音として定位するために使用することが出来る. 人の発話の定位が目的ならばデフォルトの値を使用すればよい.

PAUSE_LENGTH の単位

このパラメータの単位はミリ秒である. 従って,PAUSE_LENGTH の値が実際に何 msec に対応するかは AudioStreamFromMic や AudioStreamFromWave モジュールで指定される サンプリング周波数 (SAMPLING_RATE),FFTのステップ幅 (ADVANCE) に依存する. すべてデフォルト (サンプリング周波数:16000 Hz,ステップ幅:160 pt) の場合,PAUSE_LENGTH の値を $1$ 変えることは,1 (msec) 変更することに対応する.

See Also