Применение методов глубокого обучения для оценки степени коммерческой ценности визуальных объектов

Автор: Ефремцев Вадим Григорьевич, Ефремцев Николай Григорьевич, Тетерин Евгений Петрович, Тетерин Петр Евгеньевич, Гансовский Владислав Викторович

Журнал: Компьютерная оптика @computer-optics

Рубрика: Обработка изображений, распознавание образов

Статья в выпуске: 1 т.44, 2020 года.

Бесплатный доступ

Рассмотрена возможность применения сверточной нейронной сети для оценки коммерческой ценности цифровых изображений. Исследовалось влияние на обучение нейронной сети различных условий подготовки образцов, алгоритмов оптимизаторов, количества пикселей в образцах, размеров обучающей выборки, цветовых схем, качества сжатия и других фотометрических параметров. Показано, что благодаря предложенной предварительной подготовке данных, оптимальному выбору архитектуры и гиперпараметров нейросети удалось добиться точности классификации не менее 98 %.

Глубокое обучение, нейросети, анализ изображений

Короткий адрес: https://sciup.org/140247067

IDR: 140247067   |   DOI: 10.18287/2412-6179-CO-515

Список литературы Применение методов глубокого обучения для оценки степени коммерческой ценности визуальных объектов

  • Aloufi, S. On the prediction of Flickr image popularity by analyzing heterogeneous social sensory data / S. Aloufi, S. Zhu, A. El Saddik // Sensors. - 2017. - Vol. 17. - 631.
  • Ellett, J. New AI-based tools are transforming social media marketing [Электронный ресурс] - 2017. - URL: https://www.forbes.com/sites/johnellett/2017/07/27/new-ai-based-tools-are-transforming-social-media-marketing/#7437b17669a2.
  • More, V. Study on aesthetic analysis of photographic images techniques to produce high dynamic range images / V. More, P. Agrawal // International Journal of Computer Applications. - 2017. - Vol. 159, No 8. - P. 34-38.
  • Talebi, H. NIMA: Neural image assessment / H. Talebi, P. Milanfar // IEEE Transactions on Image Processing. -2018. - Vol. 27, Issue 8. - P. 3998-4011.
  • Lu, X. Deep multi-patch aggregation network for image style, aesthetics, and quality estimation / X. Lu, Z. Lin, X. Shen, R. Mech, J.Z. Wang // Proceedings of the IEEE International Conference on Computer Vision. - 2015. - P. 990-998.
  • Kang, L. Convolutional neural networks for no-reference image quality assessment / L. Kang, P. Ye, Y. Li, D. Doermann // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. - 2014. - P. 1733-1740.
  • Xue, W. Learning without human scores for blind image quality assessment / W. Xue, L. Zhang, X. Mou // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. - 2013. - P. 995-1002.
  • Никоноров, А.В. Реконструкция изображений в дифракционно-оптических системах на основе свёрточных нейронных сетей и обратной свёртки / А.В. Никоноров, М.В. Петров, С.А. Бибиков, В.В. Кутикова, А.А. Морозов, Н.Л. Казанский // Компьютерная оптика. - 2017. - Т. 41, № 6. - С. 875-887. -
  • DOI: 10.18287/2412-61792017-41-6-875-887
  • Rubio, F. Drawing a baseline in aesthetic quality assessment / F. Rubio, M.J. Flores, J.M. Puerts // Proceedings of SPIE. - 2017. - Vol. 10696. - 106961M.
  • Li, Y. Image aesthetic quality evaluation using convolution neural network embedded learning / Y. Li [et al.] // Optoelectronics Letters. - 2017. - Vol. 13, Issue 6. - P. 471-475.
  • Murray, N. AVA: A large-scale database for aesthetic visual analysis / N. Murray, L. Marchesotti, F. Perronnin // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. - 2012. - P. 2408-2415.
  • Marchesotti, L. Assessing the aesthetic quality of photographs using generic image descriptors / L. Marchesotti, F. Perronnin, D. Larlus, G. Csurka // 2011 International Conference on Computer Vision. - 2011. - P. 1784-1791.
  • Рыцарев, И. А. Кластеризация медиаконгенга из социальных сетей с использованием технологии BigData / И.А. Рыцарев, Д.В. Кирш, А.В. Куприянов // Компьютерная оптика. - 2018. - Т. 42, № 5. - С. 921-927. - 10.18287/2412-6179-2018-42-5- 921-927.
  • DOI: 10.18287/2412-6179-2018-42-5-921-927
  • Luo, W. Content-based photo quality assessment / W. Luo, X. Wang, X. Tang // 2011 International Conference on Computer Vision. - 2011. - P. 2206-2213. -
  • DOI: 10.1109/ICCV.2011.6126498
  • Luo, Y. Photo and video quality evaluation: Focusing on the subject / Y. Luo, X. Tang // European Conference on Computer Vision. - 2008. - P. 386-399. -
  • DOI: 10.1007/978-3-540-88690-7_29
  • Sharda, R. Predicting box-office success of motion pictures with neural networks / R. Sharda, D. Delen // Expert Systems with Applications. - 2006. - Vol. 30. - P. 243-254.
  • Ning, X. Rating prediction via generative convolutional neural networks-based regression / X. Ning [et al.] // Pattern Recognition Letters. - 2018. - In Press.
  • Loureiro, A.L.D. Exploring the use of deep neural networks for sales forecasting in fashion retail / A.L.D. Loureiro, V.L. Migueis, L.F.M. da Silva // Decision Support Systems. - 2018. - Vol. 114. - P. 81-93.
  • The parallel dots image recognition service [Electronical Resource]. - URL: https://www.paralleldots.com/object-recognizer (request date 5.09.2019).
  • EveryPixel aestetics service [Electronical Resource]. - URL: https://www.everypixel.com/aesthetics (request date 5.09.2019).
  • Kim, P. MATLAB deep learning: With machine learning, neural networks and artificial intelligence / P. Kim. - Apress, 2017.
  • Гудфеллоу, Я. Глубокое обучение / Я. Гудфеллоу, И. Бенджио, А. Курвилль. - пер. с англ. - 2-е изд. - М.: ДМК Пресс, 2018. - 652 с.
  • Рашка, С. Python и машинное обучение / С. Рашка. - пер. с англ. - М.: ДМК Пресс, 2017. - 418 с.
  • Коэльо, Л.П. Построение систем машинного обучения на языке Python / Л.П. Коэльо, В. Ричарт. - 2-е изд. - пер. с англ. - М.: ДМК Пресс, 2016. - 302 с.
  • Шолле, Ф. Глубокое обучение на Python / Ф. Шолле. -СПб: Питер, 2018. - 400 с.
Еще
Статья научная