|

Особенности использования стимульного материала для формирования базы данных эмоционально окрашенной речи

Авторы: Хорава А.В.
Опубликовано в выпуске: #6(23)/2018
DOI: 10.18698/2541-8009-2018-6-334


Раздел: Медицинские науки | Рубрика: Медицинское оборудование и приборы

Ключевые слова: базовые эмоции, характеристики сигнала, интенсивность речевого сигнала, частота основного тона, частоты первых формант, темп речи.

Опубликовано: 21.06.2018

Звучащая речь является одним из видов сигналов, используемых человеческим мозгом для анализа эмоционального состояния человека. В настоящее время активно развивается направление распознавания эмоций по речи с помощью компьютерных систем. Результат работы алгоритмов распознавания эмоций по речи во многом определяется базой, которая применяется для обучения алгоритмов. Общедоступная база данных эмоционально окрашенной русской речи в настоящее время отсутствует. В данной работе предпринята попытка устранения указанного недостатка. Описан стимульный материал для индуцирования эмоций говорящего. Приведены параметры отдельных стимулов (текста и видеозаписи), использующихся в процессе формирования базы.


Литература

[1] Бойко А.А., Неверова Е.С., Каранкевич А.И., Спиридонов И.Н. Исследование невербального поведения студентов при сдаче экзаменов. Наука и инженерное образование. SEE-2016. Москва, 2016, с. 162–163.

[2] Пилипенко М.Н., Латышева Е.Ю., Бойко А.А., Спиридонов И.Н. Исследование алгоритмов автоматического обнаружения двигательных единиц по изображению лица. Биотехносфера, 2016, № 6(48), с. 8–12.

[3] Кипяткова И.С., Карпов А.А. Аналитический обзор систем распознавания русской речи с большим словарем. Труды СПИИРАН, 2010, № 1(12), с. 7–20.

[4] Стерлинг Г.Г., Приходько П.В. Глубокое обучение в задаче распознавания эмоций из речи. Сб. тр. 40 междисциплинарной школы-конф. «Информационные технологии и системы 2016». Москва, ИППИ РАН, 2016, с. 451–456.

[5] Центр речевых технологий. URL: http://www.speechpro.ru/ (дата обращения 19.11.2017).

[6] Алешин Т.С., Редько А.Ю. Принципы подготовки баз речевых данных для задачи распознавания эмоционального окраса речи человека по речевому сигналу. Современные наукоемкие технологии, 2016, № 6-2, с. 229–234.

[7] Burkhardt F., Paeschke A., Rolfes M., Sendlmeier W., Weiss B. A database of German emotional speech. Proc. Interspeech, 2005, pp. 1517–1520.

[8] Давыдов А.Г., Киселев В.В., Кочетков Д.С. Классификация эмоционального состояния диктора по голосу: проблемы и решения. Тр. межд. конф. «Диалог – 2011». Москва, РГТУ, 2011, с. 178–185.

[9] Изард К. Психология эмоций. Санкт-Петербург, Питер, 2000, 464 с.