Безопасность цифровых технологий

БЕЗОПАСНОСТЬ ЦИФРОВЫХ ТЕХНОЛОГИЙ

БЕЗОПАСНОСТЬ
ЦИФРОВЫХ ТЕХНОЛОГИЙ

English | Русский

Последний выпуск
№3(118) Июль - Сентябрь 2025

Нейросетевой перенос произвольного стиля на портретные изображения с использованием нейросетей с механизмом внимания

Выпуск № 3-4 (96) июль - декабрь 2019
Авторы:

Березин Сергей Андреевич ,
Волкова Виктория Михайловна ,
DOI: http://dx.doi.org/10.17212/2307-6879-2019-3-4-96-105
Аннотация

Задача переноса произвольного стиля состоит в создании нового, ранее не существующего изображения путем комбинирования двух данных изображений – оригинального и стилевого. Оригинальное изображение формирует структуру, основные геометрические линии и формы результирующего изображения, в то время как стилевое изображение задает цвет и текстуру результата. Слово «произвольный» в данном контексте обозначает отсутствие какого-то одного, заранее выученного стиля. Так, например, сверточные нейронные сети способны переносить новый стиль только после своего переобучения или дообучения на новом объеме данных, не считаются решающими такую задачу, в то время как сети на основе механизма внимания способны производить такую трансформацию без переобучения. Оригинальное изображение может представлять собой, например, фотографию, а стилевое – картину знаменитого художника. Результирующим изображением в таком случае будет сцена, изображенная на исходной фотографии, выполненная в стилистике данной картины.  Современные алгоритмы переноса произвольного стиля позволяют добиться хороших результатов в данной задаче, однако при обработке портретных изображений людей результат работы таких алгоритмов оказывается либо неприемлемым ввиду чрезмерного искажения черт лица, либо слабо выраженным, не носящим характерные черты стилевого изображения. В этой работе рассматривается подход к решению данной проблемы с использованием комбинированной архитектуры глубоких нейронных сетей с механизмом внимания и сверточной сегментационной сети, осуществляющей перенос стиля с учетом содержимого конкретного сегмента изображения: с ярким преобладанием стиля над формой для фоновой части изображения и с преобладанием содержания над формой в портретной части изображения, содержащей непосредственно изображение лица человека и/или его фигуры.


Ключевые слова: машинное обучение, глубокое обучение, нейронные сети, обработка изображений, перенос стиля, сегментация, сверточные нейронные сети, механизм внимания
Березин Сергей Андреевич
630073, РФ, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет, студент кафедры теоретической и прикладной информатики. E-mail:
sergeyberezin123@gmail.com
Orcid: 0000-0002-8487-990X

Волкова Виктория Михайловна
630073, РФ, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет, доцент кафедры теоретической и прикладной информатики. E-mail:
volkova@ami.nstu.ru
Orcid: 0000-0002-4889-4141

Список литературы

1. Park D.Y., Lee K.H. Arbitrary style transfer with style-attentional networks. – URL: https://arxiv.org/abs/1812.02342 (accessed: 18.11.2019).



2. Gatys L.A., . Ecker A.S., Bethge M. A neural algorithm of artistic style. – URL: https://arxiv.org/abs/1508.06576 (accessed: 18.11.2019).



3. Cui B., Qi C., Wang A. Multi-style transfer: generalizing fast style transfer to several genres // Stanford University. – 2017. – URL: http://cs231n.stanford.edu/reports/2017/pdfs/401.pdf (accessed: 18.11.2019).



4. Huang X., Belongie S. Arbitrary style transfer in real-time with adaptive instance normalization. – URL: https://arxiv.org/abs/1703.06868 (accessed: 18.11.2019).



5. Badrinarayanan V., Kendall A., Cipolla R. SegNet: a deep convolutional encoder-decoder architecture for image segmentation. – URL: https://arxiv.org/abs/1511.00561 (accessed: 18.11.2019).



6. Avatar-Net: multi-scale zero-shot style transfer by feature decoration / L. Sheng, Z. Lin, J. Shao, X. Wang. // 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. – Salt Lake City, UT, 2018. – P. 8242–8250.



7. Microsoft COCO: Common objects in context / T.-Y. Lin, M. Maire, S. Belongie, J. Hays, P. Perona, D. Ramanan, P. Doll´ar, C.L. Zitnick // Computer Vision – ECCV 2014. – Cham: Springer, 2014. – P. 740–755.



8. Phillips F., Mackintosh B. Wiki Art Gallery, Inc.: a case for critical thinking // Issues in Accounting Education. – 2011. – Vol. 26 (3). – P. 593–608.



9. Kingma D.P., Ba J.L. Adam: a method for stochastic optimization. – URL: https://arxiv.org/abs/1412.6980v9 (accessed: 18.11.2019).



10. Хомутов С.О., Серебряков Н.А. Повышение качества краткосрочного прогнозирования электропотребления группы точек поставки электроэнергии сельхозпроизводителей с помощью инструментов машинного обучения // Научный вестник НГТУ. – 2019. – № 3 (76). – С. 149–168. – DOI: 10.17212/1814-1196-2019-3-149-168.



11. Гергет О.М., Мещеряков Р.В. Применение информационных методов, нейронных сетей и генетического алгоритма для решения задачи выбора схемы лечения // Научный вестник НГТУ. – 2018. – № 3 (72). – С. 7–20. – DOI: 10.17212/1814-1196-2018-3-7-20.



12. Воевода А.А., Романников Д.О. Синтез нейронной сети для решения логико-арифметических задач // Труды СПИИРАН. – 2017. – Вып. 5 (54). – C. 205–223.



13. Романников Д.О. О преобразовании сети Петри в нейронную сеть // Сборник научных трудов НГТУ. – 2016. – № 4 (86). – С. 98–103.



14. Дубенко Ю.В., Дышкант Е.Е. Нейросетевой алгоритм выбора методов для прогнозирования временных рядов // Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. – 2019. – № 1. – С. 51–60. – DOI: 10.24143/2072-9502-2019-1-51-60.



15. Тимофеев А.В., Дерин О.А. Принципы построения иерархических нейронных сетей для анализа мультиизображений // Труды СПИИРАН. – 2009. – Вып. 10. – С. 160–166.

Просмотров аннотации: 1237
Скачиваний полного текста: 882
Просмотров интерактивной версии: 0
Для цитирования:

Березин С.А., Волкова В.М. Нейросетевой перенос произвольного стиля на портретные изображения с использованием нейросетей с механизмом внимания // Сборник научных трудов НГТУ. – 2019. – № 3–4 (96). – С. 96–105. – DOI: 10.17212/2307-6879-2019-3-4-96-105.

 

For citation:

Berezin S.A., Volkova V.M. Neirosetevoi perenos proizvol'nogo stilya na portretnye izobrazheniya s ispol'zovaniem neirosetei s mekhanizmom vnimaniya [Neural arbitrary style transfer for portrait images using the attention mechanism]. Sbornik nauchnykh trudov Novosibirskogo gosudarstvennogo tekhnicheskogo universitetaTransaction of scientific papers of the Novosibirsk state technical university, 2019, no. 3–4 (96), pp. 96–105. DOI: 10.17212/2307-6879-2019-3-4-96-105.