Системы анализа и обработки данных

Исследование проблематики методик определения типа контента во входящем трафике

Выпуск № 4 (92) Октябрь - Декабрь 2023

Авторы:

Рева Иван Леонидович,

Медведев Михаил Александрович,

Воронцова Инна Владимировна

DOI: http://dx.doi.org/10.17212/2782-2001-2023-4-69-84

Аннотация
Авторы
Список литературы

Аннотация

Фильтрация контента в контексте кибербезопасности и доверенной среды является важной тактикой, используемой для обеспечения безопасности и функциональности сети. Он действует путем ограничения доступа к определенным веб-сайтам, электронным письмам, файлам или другому контенту, который может содержать вредоносные элементы или представлять существенный риск заражения. Фильтрация контента обеспечивает безопасность не только данных отдельного пользователя, но и всей сети организаций, учреждений, помогая минимизировать риск злонамеренных нарушений безопасности.

Исследование проблематики методик определения типа контента во входящем трафике является актуальным и важным направлением в области информационной безопасности и сетевой аналитики. В современном интернет-пространстве значительное количество данных передается через сети, и одной из ключевых задач является классификация этого трафика для обеспечения безопасности и эффективного управления сетью. Методики определения типа контента во входящем трафике представляют собой набор алгоритмов и подходов, которые позволяют автоматически определить, какой тип данных передается по сети. В ходе исследования проблематики методик определения типа контента во входящем трафике осуществляется сбор данных о сетевом трафике, выбирается набор данных для обучения модели, рассматриваются алгоритмы-классификаторы и акцентируется внимание на метриках оценки эффективности классификации.

Результаты исследования могут быть использованы для создания эффективных систем обнаружения вредоносного или нежелательного контента, фильтрации данных или оптимизации работы сетевых ресурсов. Исследование проблематики методик определения типа контента во входящем трафике имеет практическую значимость и может применяться в различных областях, включая информационную безопасность, сетевую аналитику, мониторинг сетевых ресурсов и оптимизацию сетевых процессов.

Ключевые слова: искусственный интеллект, компьютерные сети, семантическая контент-фильтрация, сетевой трафик, датасет, кибербезопасность, true-трафик, false-трафик, true positive, true negative, false positive, false negative, точность, полнота, F-мера

Авторы:

Рева Иван Леонидович
630073, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет, reva@corp.nstu.ru

Медведев Михаил Александрович
630073, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет, m.medvedev@corp.nstu.ru

Воронцова Инна Владимировна
630073, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет, c i.vorontcova@corp.nstu.ru

Список литературы

1. Skurichina M., Duin R.P.W. Limited bagging, boosting and the random subspace method for linear classifiers // Pattern Analysis and Applications. – 2002. – Vol. 5 (2). – P. 121–135.

2. Сравнительный анализ современных трендов в области моделей трафика сетей передачи данных / И.Л. Рева, А.В. Иванов, М.А. Медведев, И.А. Огнев // Системы анализа и обработки данных. – 2022. – № 2 (86). – С. 55–68.

3. Pustejovsky J., Stubbs A. Natural language annotation for machine learning. – Sebastopol, CA: O'Reilly Media, 2013. – 326 p.

4. Медведев М.А., Рева И.Л. Анализ подходов к фильтрации трафика и эффективность применения черных и белых списков // Вестник СибГУТИ. – 2023. – Т. 17, № 1. – С. 107–116.

5. UserGate Web Filter. Руководство администратора. – URL: https://www.rosnovotech.ru/files/UGWF-administrator-manual-ru.pdf (дата обращения: 30.11.2023).

6. Abe N. Recent developments in the theory and applications of machine learning // Journal Japanese Society for Artificial Intelligence. – 1999. – Vol. 14 (5). – P. 762. – URL: https://www.ai-gakkai.or.jp/en/published_books/journals_of_jsai/past_journals/in1999/vol14_no5/ (accessed: 30.11.2023).

7. Архипова А.Б., Медведев М.А., Реутов В.В. Перспективность использования машинного обучения для классификации сетевого трафика в технологиях доверенного взаимодействия // Безопасность цифровых технологий. – 2022. – № 3 (106). – С. 49–61.

8. A distance-based method for building an encrypted malware traffic identification framework / J. Liu, Z. Tian, R. Zheng, L. Liu // IEEE Access. – 2019. – Vol. 7. – P. 100014–100028. – DOI: 10.1109/ACCESS.2019.2930717.

9. Data mining and knowledge discovery handbook / ed. by L. Rokach, O. Maimon. – 2nd ed. – Springer, 2005. – URL: https://tanthiamhuat.files.wordpress.com/2015/04/data_mining_and_knowledge_discovery_handbook.pdf (accessed: 30.11.2023).

10. Стрекалов И.Э., Новиков А.А., Лопатин Д.В. Методы динамической фильтрации веб-контента // Вестник российских университетов. Математика. – 2014. – Т. 19, № 2. – С. 668–669. – URL: https://cyberleninka.ru/article/n/metody-dinamicheskoy-filtratsii-veb-kontenta\ (дата обращения 30.11.2023).

11. Bruch J., Hinz O., Reinking J. A process model for requirements engineering of digital ecosystems // Empirical Validation in the Industrial Context. Requirements Engineering. – 2018. – Vol. 23 (1). – P. 49–66.

12. Бабенко А.А., Бахрачева Ю.С., Алеева А.Р. Система фильтрации нежелательных приложений интернет-ресурсов // НБИ технологии. – 2020. – Т. 14, № 4. – URL: https://cyberleninka.ru/article/n/sistema-filtratsii-nezhelatelnyh-prilozheniy-internet-resursov (дата обращения 30.11.2023).

13. Breiman L. Bagging predictors // Machine Leaning. – 1996. – Vol. 24 (2). – P. 123–140.

14. Performance evaluation of secured network traffic classification using a machine learning approach / A.A. Afuwape, Y. Xu, J.H. Anajemba, G. Srivastava // Computer Standards and Interfaces. – 2021. – Vol. 78. – DOI: 10.1016/j.csi.2021.103545.

15. Friedman J.H. Stochastic gradient boosting // Computational Statistics and Data Analysis. – 2002. – Vol. 38 (4). – P. 367–378. – DOI: 10.1016/S0167-9473(01)00065-2.

Для цитирования:

Рева И.Л., Медведев М.А., Воронцова И.В. Исследование проблематики методик определения типа контента во входящем трафике // Системы анализа и обработки данных. – 2022. – № 4 (92). – С. 69-84. – DOI: 10.17212/2782-2001-2023-4-69-84.

For citation:

Reva I.L., Medvedev M.A., Vorontsova I.V. Issledovanie problematiki metodik opredeleniya tipa kontenta vo vkhodyashchem trafike [Study of the issues of methods for determining the type of content in incoming traffic]. Sistemy analiza i obrabotki dannykh = Analysis and Data Processing Systems, 2022, no. 4 (92), pp. 69-84. DOI: 10.17212/2782-2001-2023-4-69-84.

Просмотров: 166

СИСТЕМЫ АНАЛИЗА И ОБРАБОТКИ ДАННЫХ

Исследование проблематики методик определения типа контента во входящем трафике