Разработка модели сверточной нейронной сети для классификации российских дорожных знаков

Авторы: Матвеев Д.А., Петруничева А.С.
Опубликовано в выпуске: #9(50)/2020
DOI: 10.18698/2541-8009-2020-9-640
Раздел: Информатика, вычислительная техника и управление \| Рубрика: Системный анализ, управление и обработка информации, статистика
Ключевые слова: компьютерное зрение, сверточная нейронная сеть, обучение нейронной сети, задача классификации изображений, классификация дорожных знаков, Russian Traffic Sign Dataset, Google Colaboratory, Keras
Опубликовано: 19.10.2020

Систему классификации дорожных знаков можно использовать и как самостоятельное решение для задач анализа изображений, и как часть системы компьютерного зрения автомобиля для решения задач помощи водителю и автономного управления. В работе рассмотрены некоторые современные подходы в области классификации изображений с помощью сверточных нейронных сетей, проанализированы их типовые архитектуры и особенности, описаны этапы разработки и обучения модели такой нейросети. Представленные результаты получены на основе использования базы изображений российских дорожных знаков — Russian Traffic Sign Dataset (RTSD). Программная реализация алгоритмов обучения модели нейросети и ее анализа осуществлялась на языке Python с помощью библиотеки Keras на общедоступной платформе Google Colaboratory.

Литература

[1] Shruti J., Sudip P. Recent trends in image and signal processing in computer vision. Springer, 2020.

[2] Kamusoko C. Image classification. In: Remote sensing image classification in R. Springer, 2019, pp. 81–153.

[3] Russakovsky O., Deng J., Su H., et al. ImageNet large scale visual recognition challenge. Int. J. Comput. Vis., 2015, vol. 115, no. 3, pp. 211–252. DOI: https://doi.org/10.1007/s11263-015-0816-y

[4] Shadman S., Nazib A., Kabir J.A., et al. An overview of convolutional neural network. Preprints, 2018, art. 2018110546. DOI: https://doi.org/10.20944/preprints201811.0546.v1

[5] O’Shea K., Nash R. An introduction to convolutional neural networks. arxiv.org: веб-сайт. URL: https://arxiv.org/abs/1511.08458v2 (дата обращения: 20.03.2020).

[6] LeCun Y., Bottou L., Bengio Y., et al. Gradient-based learning applied to document recognition. Proc. IEEE, 1998, vol. 86, no. 11, pp. 2278–2324. DOI: https://doi.org/10.1109/5.726791

[7] Krizhevsky A., Sutskever I., Hinton G.E., et al. Imagenet classification with deep convolutional neural networks. Proc. NIPS, 2012, pp. 1097–1105.

[8] Simonyan K., Zisserman A. Very deep convolutional networks for large-scale image recognition. arxiv.org: веб-сайт. URL: https://arxiv.org/abs/1409.1556 (дата обращения: 20.03.2020).

[9] Szegedy Ch., Liu W., Jia Ya., et al. Going deeper with convolutions. IEEE CVPR, 2015. DOI: https://doi.org/10.1109/CVPR.2015.7298594

[10] He K., Zhang X., Ren Sh., et al. Deep residual learning for image recognition. IEEE CVPR, 2016, pp. 770–778. DOI: https://doi.org/10.1109/CVPR.2016.90

[11] Шахуро В.И., Конушин А.С. Российская база изображений автодорожных знаков. Компьютерная оптика, 2016, т. 40, № 2, с. 294–300. DOI: https://doi.org/10.18287/2412-6179-2016-40-2-294-300

[12] Kingma D.P., Ba J.L. Adam: a method for stochastic optimization. arxiv.org: веб-сайт. URL: https://arxiv.org/abs/1412.6980 (дата обращения: 20.03.2020).

[13] Ajiboye A., Arshah A., Qin R., et al. Evaluating the effect of dataset size on predictive model using supervised learning technique. IJSECS, 2015, 1. pp. 74–84. DOI: https://doi.org/10.15282/ijsecs.1.2015.6.0006