В настоящей статье рассматривается проектирование системы сбора и предиктивного анализа социальных медиа. По мере развития сети Интернет и социальных медиа более простым стал доступ к информации и ее распространение, ведь сами пользователи сети являются одновременно создателями и получателями различной информации. Основная разновидность социальных медиа – социальные сети. Из наиболее известных можно выделить следующие: Facebook, VK, Instagram, YouTube, Twitter, «Одноклассники», а также мессенджеры WhatsApp, Telegram. Важнейшие функции социальных медиа – влияние на восприятие, отношение и конечное поведение потребителей.В основе предиктивной аналитики лежит автоматический поиск связей, аномалий и закономерностей между различными факторами. Для формирования прогнозной модели используется большой набор статистических методов моделирования, интеллектуальный анализ данных, машинное обучение, нейронные сети и другие механизмы. В совокупности с различными методами сбора информации с интернет-ресурсов, таких как парсинг и API социальных сетей, предиктивная аналитика может предлагать наиболее интересные для пользователя источники информации. Для того чтобы объединить методы предиктивного анализа и методы сбора данных, требуется подробно отнестись к процессу проектирования системы.В работе особое внимание обращено на подробное описание второй из основных частей системы (подсистемы анализа). Помимо этого, выделены полная архитектура и алгоритм функционирования. Полученные результаты будут в полном объеме использоваться при дальнейшей разработке. Работа над данной темой позволит облегчить процесс последующего тестирования и исследования системы.
1. Калытюк И.С. Разработка и исследование алгоритма извлечения данных геолокации в социальных сетях // Научное сообщество студентов XXI столетия. Технические науки. – СибАК, 2018. – № 11 (70). – C. 39–44.
2. Калытюк И.С., Французова Г.А., Гунько А.В. К вопросу выбора методов предиктивного анализа данных социальных медиа // Автоматика и программная инженерия. – 2019. – № 4 (30). – C. 9–17.
3. Калытюк И.С., Французова Г.А., Гунько А.В. Начальные этапы проектирования системы сбора и предиктивного анализа данных социальных медиа // Системы анализа и обработки данных. – 2021. – № 1 (81). – С. 73–84. – DOI: 10.17212/2782-2001-2021-1-73-84.
4. Фролов В.В., Слипченко С.Е., Приходько О.Ю. Метод расчета числа кластеров для алгоритма k-means // Экономика. Информатика. – 2020. – № 47 (1). – C. 213–225. – DOI: 10.18413/2687-0932-2020-47-1-213-225.
5. Яндекс.Метрика: web-сайт. – URL: https://metrika.yandex.ru/list? (дата обращения: 11.02.2022).
6. Google Аналитика: web-сайт. – URL: https://analytics.google.com/analytics/web/provision/#/provision (дата обращения: 11.02.2022).
7. Молодецкая С.Ф., Шитова Т.Ф. Оценка эффективности сайта на основе технологии нечеткого управления // Вопросы управления. – 2020. – № 2 (63). – С. 39–49.
8. Кошик А. Веб-аналитика 2.0 на практике: тонкости и лучшие методики. – М.: Диалектика, 2019. – 528 с.
9. Ahrefs – это инструменты и ресурсы SEO для роста вашего поискового трафика. – URL: https://ahrefs.com/ru/ (дата обращения: 11.02.2022).
10. 2ip: web-сайт. – URL: https://2ip.ru/analizator/ (дата обращения: 11.02.2022).
11. RDS Bar – расширение для сео анализа сайта и страниц: web-сайт. – URL: https://www.recipdonor.com/bar (дата обращения: 11.02.2022).
12. PR-CY. Сервис самостоятельного продвижения сайта – Онлайн инструменты для вебмастеров, оптимизаторов и копирайтеров: web-сайт. – URL: https://pr-cy.ru/ (дата обращения: 11.02.2022).
13. Бабичев С. Оптимизация процесса предобработки информации в системах кластеризации высокоразмерных данных // Радиоэлектроника, информатика, управление. – 2014. – № 2. – С. 135–142. – DOI: 10.15588/1607-3274-2014-2-19.
14. Статистические алгоритмы кластеризации данных в адаптивных обучающих системах / С.А. Батуркин, Е.Ю. Батуркина, В.А. Зименко, И.В. Сигинов // Вестник РГРТУ. 2010. – № 1 (31). – С. 82–85.
15. Hartigan J.A., Wong M.A. Algorithm AS136: a K-means clustering algorithm // Applied Statistics. – 1979. – Vol. 28 (1). – P. 100–108.
Калытюк И.С., Французова Г.А., Гунько А.В. Заключительные этапы проектирования системы сбора и предиктивного анализа данных социальных медиа // Системы анализа и обработки данных. – 2022. – № 1 (85). – С. 59–72. – DOI: 10.17212/2782-2001-2022-1-59-72.
Kalytyuk I.S., Frantsuzova G.A., Gunko A.V. Zaklyuchitel'nye etapy proektirovaniya sistemy sbora i prediktivnogo analiza dannykh sotsial'nykh media [Final stages of designing a system for collecting and predictive analysis of social media data]. Sistemy analiza i obrabotki dannykh = Analysis and Data Processing Systems, 2022, no. 1 (85), pp. 59–72. DOI: 10.17212/2782-2001-2022-1-59-72.