В настоящей статье рассматривается возможность обработки звука от шума при помощи нейронной сети, которая работает с распознаванием изображений. Чтобы в этом убедиться, были рассмотрены спектрограммы записанного голоса диктора длительностью 10 секунд и спектрограммы с наложением белого шума на записанную аудиодорожку. После анализа зашумленной аудиодорожки субъективным методом (прослушивание аудиодорожки) и анализа спектрограмм зашумленной аудиодорожки было выявлено, что нейронная сеть сможет распознать отличия изображений, на которых видна зашумленность. Это необходимо для того, чтобы в дальнейшем обучить нейронную сеть распознавать интенсивность зашумленности аудиодорожки.
1. Волков Н.А., Иванов А.В. Анализ существующих средств разработки для решения задачи распознавания речи в области оценки защищенности речевой информации // XXI Всероссийский конкурс-конференция студентов и аспирантов по информационной безопасности «SIBINFO-2021» / Томский государственный университет систем управления и радиоэлектроники. – Томск, 2021. – С. 22–25.
2. Adobe Audition. Профессиональная студия звукозаписи: web-сайт. – URL: https://www.adobe.com/ru/products/audition.html (дата обращения: 01.06.2022).
3. Beginner's Guide to Python // Python: web-сайт. – URL: https://wiki.python.org/moin/BeginnersGuide (accessed: 01.06.2022).
4. MatPlotlib Tutorials: web-сайт. – URL: https://matplotlib.org/stable/tutorials/index (accessed: 01.06.2022).
5. SciPy. About us. – URL: https://scipy.org/about.html (accessed: 01.06.2022).
6. Read and write WAV files // Python: web-сайт. – URL: https://docs.python.org/3/library/wave.html (accessed: 01.06.2022).
Исследование зашумленной аудиозаписи речи для обработки в автоматизированной системе / Н.А. Волков, А.В. Иванов, Н.Е. Карпова, А.В. Чуваков // Безопасность цифровых технологий. – 2022. – № 2 (105). – С. 9–20. – DOI: 10.17212/2782-2230-2022-2-9-20.
Volkov N.A., Ivanov A.V., Karpova N.E., Chuvakov A.V. Issledovanie zashumlennoi audiozapisi rechi dlya obrabotki v avtomatizirovannoi sisteme [Investigation of noisy audio recordings of speech for processing in an automated system]. Bezopasnost' tsifrovykh tekhnologii = Digital Technology Security, 2022, no. 2 (105), pp. 9–20. DOI: 10.17212/
2782-2230-2022-2-9-20.