音声認識

篠田浩一・著
シリーズ:
機械学習プロフェッショナルシリーズ

音声認識

発行
2017/12/07
サイズ
A5
ページ数
175
ISBN
978-4-06-152927-4
定価
3,080円(税込)
在庫
在庫あり

書籍を購入する

定価
3,080円(税込)

電子書籍

※価格は紙の本と異なります。また、書店によって価格が異なる場合もあります。※配信開始日は各書店により異なります。書店によっては取り扱いのない作品もございます。あらかじめご了承ください。
電子書籍版を見る

内容紹介

音声の信号処理についての知識ゼロでも読めるように、懇切丁寧に解説した。基礎理論はコンパクトにまとめ、「耐雑音」「話者認識」「深層学習」についてたっぷり解説。一気に実用が進んだ音声認識分野がこれ一冊で学べる!

目次

第1章 音声とは
 1.1 音の知覚
 1.2 音声の生成
 1.3 音韻と音素

第2章 音声分析
 2.1 前処理
 2.2 音声特徴量
 2.3 音声特徴量の量子化

第3章 音声認識とは
 3.1 音声認識の分類
 3.2 DPマッチング

第4章 隠れマルコフモデル
 4.1 確率モデルを用いたパターン認識
 4.2 マルコフ過程
 4.3 隠れマルコフモデルとは
 4.4 音声認識のための隠れマルコフモデル
 4.5 HMMを用いたパターン認識

第5章 言語モデル
 5.1 言語の複雑さの尺度
 5.2 確率的言語モデル
 5.3 形態素解析

第6章 大語彙連続音声認識
 6.1 サブワード認識単位を用いた学習・認識
 6.2 音素文脈決定木を用いたクラスタリング
 6.3 発音辞書
 6.4 探索技術
 6.5 識別学習

第7章 耐雑音音声認識
 7.1 雑音とは
 7.2 加算性雑音
 7.3 乗算性雑音
 7.4 非定常雑音への対応

第8章 話者適応と話者認識
 8.1 話者適応とは
 8.2 事後確率最大化法
 8.3 最尤線形回帰法
 8.4 話者正規化
 8.5 話者認識とは
 8.6 i-vectorを用いた話者照合

第9章 深層学習
 9.1 ニューラルネットワーク
 9.2 誤差逆伝播法
 9.3 ニューラルネットワークによる音声認識
 9.4 音声認識のための深層学習
 9.5 音声認識の要素技術における深層学習
 9.6 End-to-End学習
 9.7 今後の展望