オーディオビジュアル音声認識 - 進歩、応用、洞察
Fouad Sabry
Traductor Kei Imano
Editorial: 10億人の知識があります [Japanese]
Sinopsis
オーディオビジュアル音声認識とは オーディオビジュアル音声認識 (avsr) は、読唇術の画像処理機能を使用して、音声認識システムによる不確定な電話の認識を支援する技術です。 どのようなメリットがあるか (i) 次のトピックに関する洞察と検証: 第 1 章: オーディオビジュアル音声認識 第 2 章: データ圧縮 第 3 章: 音声認識 第 4 章: 音声合成 第 5 章: 感情コンピューティング 第 6 章: スペクトログラム 第 7 章: 読唇術 第 8 章: 顔検出 第 9 章: 機能 (機械学習) 第 10 章: 統計的分類 (ii) オーディオビジュアル音声認識に関する一般のよくある質問に答える。 (iii) ) さまざまな分野でのオーディオビジュアル音声認識の使用例の実例。 本書の対象者 専門家、大学生、大学院生、愛好家 、愛好家、およびあらゆる種類のオーディオビジュアル音声認識に関する基本的な知識や情報を超えたいと考えている人。