HARK クックブック
Version 1.9.9. (Revision: 5967)
HARK クックブック
Version 1.9.9. (Revision: 5967)
奥乃 博
中臺 一博
高橋 徹
武田 龍
中村 圭佑
水本 武志
吉田 尚水
大塚 琢馬
柳楽 浩平
糸原 達彦
1 はじめに
2 はじめてのHARK
2.1 はじめての録音
2.2 はじめての音源定位
2.2.1 音声ファイルの音源定位
2.2.2 マイクロホンからのリアルタイム音源定位
2.2.3 定常雑音を白色化する機能を用いた音源定位
2.3 はじめての音源分離
2.4 はじめての音声認識
3 よくある問題と解決方法
3.1 うまくインストールできない
3.2 うまく録音できない
3.3 うまく定位できない
3.4 うまく分離できない
3.5 うまく認識できない
3.6 デバッグモジュールを作りたい
3.7 デバッグツールを使いたい
3.8 マイクロホンの接続をチェックしたい
4 マイクロホンアレー
4.1 マイクロホン数はいくつがいい?
4.2 マイクロホン配置はどうしたらよい?
4.3 どんなマイクロホンを使えば良い?
4.4 自分のロボットにマイクロホンを搭載したい
4.5 サンプリングレートはどう設定したらいいい?
4.6 別のA/D変換器を使いたい。
5 入力データの作成
5.1 多チャネル録音したい
5.2 インパルス応答を計測したい
5.3 インパルス応答から音声データを合成したい
5.4 ノイズデータを加えたい
6 音響モデルと言語モデル
6.1 音響モデルを作りたい
6.1.1 マルチコンディション学習
6.1.2 追加学習
6.1.3 MLLR/MAP 適応
6.2 言語モデルを作りたい
7 FlowDesigner
7.1 コマンドラインから引数を与えて起動したい。
7.2 他のネットワークファイルからノードをコピーしたい
7.3 for ループのように指定した回数だけ繰り返し処理をしたい
8 音源定位
8.1 はじめに
8.2 音源定位のパラメータをチューニングしたい
8.3 マイクロホンアレイの一部だけを使いたい
8.4 同時に複数の音を定位したい
8.5 定位できているかどうかを確認したい
8.6 音源定位がまったくでない / 出すぎる
8.7 音源定位結果が細かく切れてしまう / 全部繋がってしまう
8.8 音源分離した音の先頭が切れてしまう
8.9 音源の高さや距離も推定したい
8.10 定位結果をファイルに保存したい
9 音源分離
9.1 はじめに
9.2 分離音をファイルに保存したい
9.3 音源分離のパラメータをチューニングしたい
9.4 マイクロホン配置だけから音源分離したい
9.5 ファンノイズなどの定常ノイズのせいで音源分離がうまくいかない
9.6 分離音に入っている雑音を後処理で減らしたい
9.7 音源やロボットが移動する状況で分離したい
10 特徴量抽出
10.1 はじめに
10.2 ミッシングフィーチャマスク (MFM) の閾値の設定の仕方がわからない
10.3 特徴量をファイルに保存したい
11 音声認識
11.1 設定ファイル(.jconfファイル)を作りたい
12 その他
12.1 窓長とかシフト長の適切な値が知りたい
12.2
MultiFFT
に使う窓関数はどれを使えばよいか知りたい
12.3
PreEmphasis
の使い方は?
13 進んだ使い方
13.1 ノードを作りたい
13.2 システムの処理速度をあげたい
13.3 他のシステムとHARKを接続したい
13.4 モータを制御したい
14 サンプルネットワーク
14.1 はじめに
14.1.1 サンプルネットワークのカテゴリー
14.1.2 ドキュメントの表記とサンプルネットワークの実行方法
14.2 録音ネットワークサンプル
14.2.1 Ubuntu
14.2.2 Windows
14.3 音源定位ネットワークサンプル
14.3.1 オフライン音源定位
14.3.2 オンライン音源定位
14.4 音源分離ネットワークサンプル
14.4.1 オフライン音源分離
14.4.2 オフライン音源分離 (HRLE を使った後処理あり)
14.4.3 オンライン音源分離 (HRLE を使った後処理有り・無し)
14.5 音響特徴量抽出ネットワークサンプル
14.5.1 はじめに
14.5.2 MSLS
14.5.3 MSLS+$\Delta $MSLS
14.5.4 MSLS+Power
14.5.5 MSLS+$\Delta $MSLS+Power+$\Delta $Power
14.5.6 MSLS+$\Delta $MSLS+$\Delta $Power
14.5.7 MSLS+$\Delta $MSLS+$\Delta $Power+前処理
14.6 音声認識ネットワークサンプル
14.6.1 音声認識の実行
14.6.2 音声認識率の評価
HARK クックブック
Version 1.9.9. (Revision: 5967)