Обзор методов извлечения акустических признаков речи в задаче распознавания диктора

Выпуск № 3-4 (96) июль - декабрь 2019

Судьенкова Анна Владимировна
DOI: http://dx.doi.org/10.17212/2307-6879-2019-3-4-139-164

Биометрические технологии являются перспективным направлением в области информационной безопасности. Голосовая биометрия на сегодняшний день широко распространена, и работы над повышением качества голосовых систем не теряют своей актуальности. Выбор метода извлечения речевых признаков – один из ключевых этапов проектирования голосовых автоматических систем. В статье рассматриваются акустические параметры, обусловленные физиологическими свойствами речевого тракта человека: частота основного тона, огибающая спектра, форманты и антиформанты. Тема статьи касается методов их извлечения. Большую часть составляют различные варианты кепстрального анализа, поскольку именно они наиболее часто встречаются в современных разработках как в виде использования популярных мел-частотных кепстральных коэффициентов, так и в новых модификациях. Также внимание уделяется алгоритмам линейного предсказания, спектрального центроида и вейвлет-анализа. Параметризация речевых характеристик входит в распознавание речи, эмоций, языка, гендера. Хотя в статье перечислены основные подходы извлечения акустических признаков речи с целью распознавания диктора, материал может быть полезен и в вышеперечисленных задачах обработки речевых сигналов.

Ключевые слова: распознавание диктора, анализ речи, кепстральные коэффициенты, линейное предсказание, перцептивное линейное предсказание, спектральный центроид, вейвлет-анализ

Судьенкова А.В. Обзор методов извлечения акустических признаков речи в задаче распознавания диктора // Сборник научных трудов НГТУ. – 2019. – № 3–4 (96). – С. 139–164. – DOI: 10.17212/2307-6879-2019-3-4-139-164.


Sudjenkova A.V. Obzor metodov izvlecheniya akusticheskikh priznakov rechi v zada-che raspoznavaniya diktora [Overview of methods for extracting acoustic speech features in speaker recognition]. Sbornik nauchnykh trudov Novosibirskogo gosudarstvennogo tekhnicheskogo universitetaTransaction of scientific papers of the Novosibirsk state technical university, 2019, no. 3–4 (96), pp. 139–164. DOI: 10.17212/2307-6879-2019-3-4-139-164.

