|

Определение частоты основного тона методом поиска пиков в амплитудном спектре с добавлением весовых частотных функций

Авторы: Жукова А.Б., Масленников А.Л.
Опубликовано в выпуске: #12(41)/2019
DOI: 10.18698/2541-8009-2019-12-556


Раздел: Информатика, вычислительная техника и управление | Рубрика: Системный анализ, управление и обработка информации, статистика

Ключевые слова: распознавание речи, частота основного тона, формантный анализ, спектр речевого сигнала, сглаживающий фильтр, весовые частотные функции, фильтр Савицкого–Голея, пики амплитудного спектра

Опубликовано: 19.12.2019

В распознавании речи выделяют задачи определения частоты основного тона и так называемых формантных частот. По значениям этих частот можно определять звуки языка — фонемы, произнесенные человеком. Существует несколько методов определения этих частот. В данной работе представлен метод определения частоты основного тона, основанный на известном механизме поиска пиков амплитудного спектра, но с добавлением сглаживающего фильтра и частотных весовых функций. Рассмотрены весовые функции двух видов: экспоненциальная и линейная. Предложенный метод применен для анализа точности определения частоты основного тона для шести испытуемых (трех мужчин и трех женщин). Результаты эксперимента показали, что существует интервал допустимых частот среза сглаживающего фильтра, а введение частотных весовых функций позволяет повысить надежность определения частоты основного тона.


Литература

[1] Бондаренко М.Ф., Работягов А.В., Щепковский С.В. Распознавание речи: этапы развития, современные технологии и перспективы их применения. Бионика интеллекта, 2010, № 2(73), с. 164–168.

[2] Ortega-García J., González-Rodríguez J. Overview of speech enhancement techniques for automatic speaker recognition. Proc. ICSLP’96, 1996, vol. 2, pp. 929–932.

[3] Плотников В.Н., Суханов В.А., Жигулевцев Ю.Н. Речевой диалог в системах управления. М., Машиностроение, 1988.

[4] Деркач М.Ф., ред. Динамические спектры речевых сигналов. Львов, Вища школа, 1983.

[5] Сорокин В.Н. Теория речеобразования. М., Радио и связь, 1985.

[6] Чистович Л.А., Венцов А.В., Гранстрем М.П. и др. Физиология речи. Восприятие речи человеком. Л., Наука, 1976.

[7] Лабутин В.К., Молчанов А.П. Слух и анализ сигналов. М., Энергия, 1967.

[8] Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. Киев, Наукова думка, 1987.

[9] Злоказов В.Б. Метод для автоматического поиска пиков в гамма-спектрах. Дубна, ОИЯИ, 1981.

[10] Маркел Д.Д., Грэй А.Х. Линейное предсказание речи. М., Связь, 1980.

[11] Savitzky A.A., Golay M.J.E. Smoothing and differentiation of data by simplified least squares procedures. Anal. Chem., 1964, vol. 36, no. 8, pp. 1627–1639. DOI: 10.1021/ac60214a047 URL: https://pubs.acs.org/doi/abs/10.1021/ac60214a047

[12] Savitzky A.A. A historic collaboration. Anal. Chem., 1989, vol. 61, no. 15, pp. 921A–923A. DOI: 10.1021/ac00190a003 URL: https://pubs.acs.org/doi/10.1021/ac00190a003