Системы анализа и обработки данных

СИСТЕМЫ АНАЛИЗА И ОБРАБОТКИ ДАННЫХ

ISSN (печатн.): 2782-2001          ISSN (онлайн): 2782-215X
English | Русский

Последний выпуск
№2(94) Апрель - Июнь 2024

Автоматический подбор опережающих индикаторов для прогнозирования состояния регионального рынка труда

Выпуск № 4 (77) Октябрь - Декабрь 2019
Авторы:

Тимофеева Анастасия Юрьевна
Аннотация

При построении прогнозных моделей на основе опережающих индикаторов возникает проблема отбора наиболее информативных переменных из множества всех потенциальных предикторов. Эта проблема может быть решена встроенными методами, такими как регрессия LASSO, или методами фильтрации, например, с помощью подхода на основе корреляций. В работе ставится задача сравнения эффективности этих методов с альтернативными подходами к анализу временных рядов (модель ARIMA, Хольта–Уинтерса, экспоненциального сглаживания). Для этого предложен алгоритм построения прогнозных моделей, включающий автоматический подбор опережающих индикаторов. Для проведения эмпирического исследования из официальных статистических данных отобраны показатели, пригодные для прогнозирования состояния регионального рынка труда. Они описывают такие индикаторы, как денежная масса, структура баланса кредитных организаций и индекс цен. Производилось псевдовневыборочное прогнозирование ряда показателей, характеризующих ситуацию на регистрируемом рынке труда Новосибирской области за период с 2015 по 2018 г. Использовались прямые многошаговые прогнозы на 6 месяцев вперед. Оказалось, что устойчивая модификация percentile-lasso не дает никаких преимуществ с точки зрения средних абсолютных прогнозных ошибок. В большинстве случаев лучшие результаты получены с помощью регрессии LASSO с выбором параметра регуляризации по правилу одной стандартной ошибки на основе 10-блочной кросс-валидации со случайным формированием блоков. За счет автоматического подбора опережающих индикаторов удалось уменьшить ошибки прогнозирования по сравнению с альтернативными методами. Тем самым предложенный алгоритм признан пригодным к использованию для прогнозирования состояния регионального рынка труда.


Ключевые слова: отбор предикторов, регрессия LASSO, percentile-lasso, отбор признаков на основе корреляций, опережающие индикаторы, рынок труда, прогнозирование, ARIMA, модель Хольта–Уинтерса, алгоритм STL

Список литературы

1. Stock J., Watson M. Forecasting using principal components from a large number of predictors // Journal of the American Statistical Association. – 2002. – Vol. 297. – P. 1167–1179. – DOI: 10.1198/016214502388618960.



2. Boivin J., Ng S. Are more data always better for factor analysis? // Journal of Econometrics. – 2006. – Vol. 132, N 1. – P. 169–194. – DOI: 10.1016/j.jeconom.2005.01.027.



3. Tibshirani R. Regression shrinkage and selection via the lasso: a retrospective // Journal of the Royal Statistical Society: Series B (Statistical Methodology). – 2011. – Vol. 73, N 3. – P. 273–282. – DOI: 10.1111/j.1467-9868.2011.00771.x.



4. Tactical sales forecasting using a very large set of macroeconomic indicators / Y.R. Sagaert, E.H. Aghezzaf, N. Kourentzes, B. Desmet // European Journal of Operational Research. – 2018. – Vol. 264, N 2. – P. 558–569. – DOI: 10.1016/j.ejor.2017.06.054.



5. Bulligan G., Marcellino M., Venditti F. Forecasting economic activity with targeted predictors // International Journal of Forecasting. – 2015. – Vol. 31, N 1. – P. 188–206. – DOI: 10.1016/j.ijforecast.2014.03.004.



6. Ma S., Fildes R., Huang T. Demand forecasting with high dimensional data: the case of SKU retail sales forecasting with intra-and inter-category promotional information // European Journal of Operational Research. – 2016. – Vol. 249, N 1. – P. 245–257. – DOI: 10.1016/j.ejor.2015.08.029.



7. Hall M.A. Correlation-based feature selection for machine learning: PhD thesis. – Hamilton: University of Waikato, 1999.



8. Timofeeva A.Y., Mezentsev Y.A. Forecasting using predictor selection from a large set of highly correlated variables // CEUR Workshop Proceedings. – 2019. – Vol. 2416: Information Technology and Nanotechnology: Data Science. – P. 10–18.



9. Lund K.V. The Instability of cross-validated LASSO: Master’s thesis / Faculty of Mathematics and Natural Sciences, University of Oslo. – Oslo, 2013.



10. Roberts S., Nowak G. Stabilizing the lasso against cross-validation variability // Computational Statistics and Data Analysis. – 2014. – Vol. 70. – P. 198–211. – DOI: 10.1016/j.csda.2013.09.008.



11. STL: a seasonal-trend decomposition procedure based on loess / R.B. Cleveland, W.S. Cleveland, J.E. McRae, I. Terpenning // Journal of Official Statistics. – 1990. – Vol. 6. – P. 3–73.



12. Brockwell P.J., Davis R.A., Calder M.V. Introduction to time series and forecasting. – New York: Springer, 2002. – 425 p.



13. Open source and enterprise-ready professional software for data science [Electronic resource]. – URL: https://rstudio.com/ (accessed: 12.12.2019).



14. Статистическая информация о ситуации на регистрируемом рынке труда [Электронный ресурс] // Роструд: web-сайт. – URL: https://www.rostrud.ru/rostrud/deyatelnost/?CAT_ID=6293 (accessed: 12.12.2019).



15. ЕМИСС – Единая межведомственная информационно-статистическая система [Электронный ресурс]: web-сайт. – URL: https://fedstat.ru/ (accessed: 12.12.2019).

Благодарности. Финансирование

Исследование выполнено при финансовой поддержке РФФИ/РГНФ, грант № 17-32-01087 а2.

Для цитирования:

Тимофеева А.Ю. Автоматический подбор опережающих индикаторов для прогнозирования состояния регионального рынка труда // Научный вестник НГТУ. – 2019. – № 4 (77). – С. 85–98. – DOI: 10.17212/1814-1196-2019-4-85-98.

 

For citation:

Timofeeva A.Yu. Avtomaticheskii podbor operezhayushchikh indikatorov dlya prognozirova-niya sostoyaniya regional'nogo rynka truda [Automatic selection of leading indicators for regional labor market forecasting]. Nauchnyi vestnik Novosibirskogo gosudarstvennogo tekhnicheskogo universitetaScience bulletin of the Novosibirsk state technical university, 2019, no. 4 (77), pp. 85–98. DOI: 10.17212/1814-1196-2019-4-85-98.

Просмотров: 1680