|

Поиск и распознавание заданных ключевых фраз в слитной речи

Авторы: Левинский А.Т., Быковский М.К.
Опубликовано в выпуске: #11(28)/2018
DOI: 10.18698/2541-8009-2018-11-399


Раздел: Информатика, вычислительная техника и управление | Рубрика: Методы и системы защиты информации, информационная безопасность

Ключевые слова: распознавание, погрешность, интерфейс, тестирование, метод Левенштейна, метод шинглов, сравнение, функция

Опубликовано: 12.11.2018

Рассмотрена проблема распознавания русской речи и нехватки программного обеспечения для удовлетворения нужд потребителей. Системы распознавания речи — это вычислительные системы, позволяющие выделять слитную речь говорящего из общего потока звуков и шумов. Эти системы основаны на технологии распознавания речи, которая преобразует произнесенные слова из звуков в цифровые тактовые сигналы с помощью процесса распознавания. В качестве решения предложено программное обеспечение для распознавания речи и поиска требуемой информации в полученном тексте. Проанализирована предметная область, выявлены заинтересованные лица и их цели, на основе которых составлены сценарии использования системы, переработанные в основные функции. Выполнен обзор существующих программных средств и алгоритмов. Проведено сравнение систем распознавания.


Литература

[1] Галунов В.И., Соловьев А.Н. Современные проблемы в области распознавания речи. Информационные технологии и вычислительные системы, 2004, № 2, с. 42–45.

[2] Запрягаев С.А., Коновалов А.Ю. Распознавания речевых сигналов. Вестник воронежского государственного университета. Сер. Системный анализ и информационные технологии, 2009, № 2, с. 39–48.

[3] Центр речевых технологий (ЦРТ). URL: http://www.speechpro.ru/innovation/ (дата обращения 12.05.2017).

[4] Леонтьев А.А. Язык, речь, речевая деятельность. Москва, URSS, 2007, 212 с.

[5] Гусев М.Н. Методы и модели распознавания русской речи в информационных системах. Санкт-Петербург, СПбГУТ им. проф. М.А. Бонч-Бруевича, 2014, 378 с.

[6] Речевые технологии SpeechKit. Cloud. URL: https://tech.yandex.ru/speechkit/cloud/ (дата обращения 24.05.2017).

[7] Пальшина Д.А. Темп речи как одна из причин возникновения аллегровых форм русских слов в повседневной коммуникации. Вестник Пермского университета. Российская и зарубежная филология, 2013, № 2(22), с. 18–24.

[8] Мазуренко И.Л. Компьютерные системы распознавания речи. Москва, URSS, 2017, 56 с.

[9] Задача распознавания речи пока не решена. URL: https://habr.com/post/408017/ (дата обращения 23.03.2018).

[10] “Cloud, распознавание речи, технологии Яндекса” [В Интернете]. URL: https://tech.yandex.ru/speechkit/cloud/doc/guide/ (дата обращения 11.06.2018).