Для проверки адекватности построенных моделей законов распределения случайных величин, как правило, применяются различные непараметрические критерии согласия, в част-
ности критерии Колмогорова, Крамèра?–?Мизеса?–?Смирнова, Андерсона?–?Дарлинга, Купера, Ватсона.
При справедливости простой проверяемой гипотезы непараметрические критерии согласия являются «свободными от распределения»: асимптотические распределения статистик не зависят от вида закона, относительно которого проверяется гипотеза. При проверке сложных гипотез, когда по выборке оцениваются параметры предполагаемого закона, свойство «свободы от распределения» теряется и распределения статистик становятся зависящими от целого ряда факторов. В таких ситуациях применение непараметрических критериев согласия возможно только при поддержке соответствующего программного обеспечения, позволяющего с использованием имитационного моделирования оценивать достигаемый уровень значимости Pv.
Распределения статистик критериев Жанга, представляющих собой развитие критериев Колмогорова, Крамèра?–?Мизеса?–?Смирнова, Андерсона?–?Дарлинга, зависят от объемов выборок, поэтому их широкое применение при проверке простых и сложных гипотез возможно только с опорой на метод Монте?–?Карло.
Распределения статистик критериев согласия (при проверке простых и сложных гипотез) могут существенно изменяться вследствие естественного присутствия ошибок округления.
Сигналом о возможности такой ситуации является наличие в анализируемых выборках значительного числа повторяющихся значений. В подобных ситуациях принятие решения о результатах проверки также невозможно без использования имитационного моделирования.
В последние годы предложено несколько критериев, ориентированных, например, на проверку принадлежности выборок нормальному или равномерному закону, статистики которых опираются на различные оценки энтропии. Как показывает опыт, относительно некоторых
конкурирующих гипотез такие критерии демонстрируют более высокие оценки мощности по сравнению с классическими непараметрическими критериями согласия.
При построении статистики критерия Нугаби для различения двух гипотез использована дивергенция Кульбака?–?Лейблера, а в качестве оценки энтропии взята оценка, предложенная Васичеком. В настоящей работе показано, как распределения статистики критерия Нугаби зависят от объема выборок n и размера «окна» m, как меняются распределения статистик критерия при проверке различных сложных гипотез. Исследована мощность критерия при проверке нормальности относительно различных конкурирующих гипотез. Показано, как при данных n мощность зависит от размера «окна» m. Показано существование оптимального m, при котором мощность максимальна относительно рассматриваемой конкурирующей гипотезы. Показано, что при данном n оптимальные значения m, как правило, не совпадают для различных конкурирующих гипотез. Очевидно, что применение подобных критериев на практике также подразумевает использование соответствующего программного обеспечения и имитационного моделирования.
1. Kolmogoroff A.N. Sulla determinazione empirica di una legge di distribuzione // Giornale del Istituto Italiano degli Attuari. – 1933. – Vol. 4, N 1. – P. 83–91.
2. Крамер Г. Математические методы статистики. – М.: Мир, 1975. – 648 с.
3. Mises R. von. Wahrscheinlichkeitsrechnung und ihre Anwendung in der Statistik und teoretischen Physik. – Leipzig; Wien: Deuticke, 1931. – 574 S.
4. Smirnoff N. Sur la distribution de w2 // Comptes Rendus de l'Academie des Sciences. – Paris, 1936. – Vol. 202. – P. 449–452.
5. Anderson T.W., Darling D.A. Asymptotic theory of certain “Goodness of fit” criteria based on stochastic processes // The Annals of Mathematical Statistics. – 1952. – Vol. 23 (2). – P. 193–212. – DOI: 10.1214/aoms/1177729437.
6. Anderson T.W., Darling D.A. A test of goodness of fit // Journal of the American Statistical Association. – 1954. – Vol. 49 (268). – P. 765–769. – DOI: 10.1080/01621459.1954.10501232.
7. Kuiper N.H. Tests concerning random points on a circle // Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen Proceedings. Series A. – 1960. – Vol. 63. – P. 38–47.
8. Watson G.S. Goodness-of-fit tests on a circle // Biometrika. – 1961. – Vol. 48 (1–2). – P. 109–114.
9. Watson G.S. Goodness-of-fit tests on a circle. II // Biometrika. – 1962. – Vol. 49 (1–2). – P. 57–63.
10. Kac M., Kiefer J., Wolfowitz J. On tests of normality and other tests of goodness of fit based on distance methods // The Annals of Mathematical Statistics. – 1955. – Vol. 26 (2). – P. 189–211. – DOI: 10.1214/aoms/1177728538.
11. Лемешко Б.Ю. Непараметрические критерии согласия. Руководство по применению: монография. – 2-е изд., перераб. и доп. – М.: Инфра-М, 2024. – 201 с. – (Научная мысль). – DOI: 10.12737/2058731.
12. Лемешко Б.Ю., Постовалов С.Н. О зависимости распределений статистик непараметрических критериев и их мощности от метода оценивания параметров // Заводская лаборатория. Диагностика материалов. – 2001. – Т. 67, № 7. – С. 62–71.
13. Лемешко Б.Ю., Маклаков А.А. Непараметрические критерии при проверке сложных гипотез о согласии с распределениями экспоненциального семейства // Автометрия. – 2004. – № 3. – С. 3–20.
14. Мартынов Г.В. Критерии омега-квадрат. – М.: Наука, 1978. – 80 с.
15. Тюрин Ю.Н. О предельном распределении статистик Колмогорова – Смирнова для сложной гипотезы // Известия Академии наук СССР. Серия математическая. – 1984. – Т. 48, № 6. – С. 1314–1343.
16. Тюрин Ю.Н., Саввушкина Н.Е. Критерии согласия для распределения Вейбулла – Гнеденко // Известия Академии наук СССР. Техническая кибернетика. – 1984. – № 3. – С. 109–112.
17. Lilliefors H.W. On the Kolmogorov-Smirnov test for normality with mean and variance unknown // Journal of the American Statistical Association. – 1967. – Vol. 62 (318). – P. 399–402.
18. Lilliefors H.W. On the Kolmogorov-Smirnov test for the exponential distribution with mean unknown // Journal of the American Statistical Association. – 1969. – Vol. 64. – P. 387–389.
19. Лемешко Б.Ю., Постовалов С.Н. Прикладные аспекты использования критериев согласия в случае проверки сложных гипотез // Надежность и контроль качества. – 1997. – № 11. – С. 3–17.
20. Лемешко Б.Ю., Постовалов С.Н. О распределениях статистик непараметрических критериев согласия при оценивании по выборкам параметров наблюдаемых законов // Заводская лаборатория. Диагностика материалов. – 1998. – Т. 64, № 3. – С. 61–72.
21. Лемешко Б.Ю., Постовалов С.Н. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Методические рекомендации. Ч. 2. Непараметрические критерии. – Новосибирск: Изд-во НГТУ, 1999. – 85 с.
22. Р 50.1.037–2002. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Ч. 2. Непараметрические критерии. – М.: Изд-во стандартов, 2002. – 64 с.
23. Лемешко Б.Ю., Лемешко С.Б. Модели распределений статистик непараметрических критериев согласия при проверке сложных гипотез с использованием оценок максимального правдоподобия. Ч. 1 // Измерительная техника. – 2009. – № 6. – С. 3–11.
24. Лемешко Б.Ю., Лемешко С.Б. Модели распределений статистик непараметрических критериев согласия при проверке сложных гипотез с использованием оценок максимального правдоподобия. Ч. 2 // Измерительная техника. – 2009. – № 8. – С. 17–26.
25. Lemeshko B.Yu., Lemeshko S.B., Postovalov S.N. Statistic distribution models for some nonparametric goodness-of-fit tests in testing composite hypotheses // Communications in Statistics – Theory and Methods. – 2010. – Vol. 39 (3). – P. 460–471.
26. Lemeshko B.Yu., Lemeshko S.B. Models of statistic distributions of nonparametric goodness-of-fit tests in composite hypotheses testing for double exponential law cases // Communications in Statistics – Theory and Methods. – 2011. – Vol. 40 (16). – P. 2879–2892.
27. Lemeshko B.Yu., Lemeshko S.B. Construction of statistic distribution models for nonparametric goodness-of-fit tests in testing composite hypotheses: the computer approach // Quality Technology & Quantitative Management. – 2011. – Vol. 8 (4). – P. 359–373.
28. Лемешко Б.Ю., Горбунова А.А. О применении и мощности непараметрических критериев согласия Купера, Ватсона и Жанга // Измерительная техника. – 2013. – № 5. – С. 3–9.
29. Лемешко Б.Ю., Горбунова А.А. Применение непараметрических критериев согласия Купера и Ватсона при проверке сложных гипотез // Измерительная техника. – 2013. – № 9. – С. 14–21.
30. Лемешко Б.Ю. Непараметрические критерии согласия: руководство по применению. – М.: Инфра-М, 2014. – 163 с. – DOI: 10.12737/11873.
31. Статистический анализ интервальных наблюдений одномерных непрерывных случайных величин «Интервальная статистика 5.4»: свидетельство о гос. регистрации программы для ЭВМ № 2018666213 / Лемешко Б.Ю., Лемешко С.Б., Блинов П.Ю., Веретельникова И.В., Новикова А.Ю. – Заявка № 2018663206; заявл. 22.11.2018; зарег. 13.12.2018. – URL: https://ami.nstu.ru/~headrd/ISW.htm (дата обращения: 16.11.2024).
32. Лемешко Б.Ю., Лемешко С.Б. Проблемы применения непараметрических критериев согласия в задачах обработки результатов измерений // Системы анализа и обработки данных. – 2021. – № 2 (82). – С. 47–66. – DOI: 10.17212/2782-2001-2021-2-47-66.
33. Лемешко Б.Ю. О проблемах и ошибках применения критериев согласия // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. – 2023. – № 64. – С. 74–90. – DOI: 10.17223/19988605/64/8.
34. Zhang J. Powerful goodness-of-fit tests based on the likelihood ratio // Journal of the Royal Statistical Society: Series B. – 2002. – Vol. 64 (2). – P. 281–294.
35. Zhang J., Wu Yu. Likelihood-ratio tests for // Computational Statistics & Data Analysis. – 2005. – Vol. 49 (3). – P. 709–721.
36. Лемешко Б.Ю. Лемешко С.Б., Семёнова М.А. К вопросу статистического анализа больших данных // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. – 2018. – № 44. – С. 40–49. – DOI: 10.17223/19988605/44/5.
37. Лемешко Б.Ю., Лемешко С.Б. Влияние округления на свойства критериев проверки статистических гипотез // Автометрия. – 2020. – Т. 56, № 3. – С. 35–45. – DOI: 10.15372/AUT20200305.
38. Лемешко Б.Ю., Лемешко С.Б. О влиянии ошибок округления на распределения статистик критериев согласия // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. – 2020. – № 53. – С. 47–60. – DOI: 10.17223/19988605/53/5.
39. Lemeshko B.Y., Lemeshko S.B. About the effect of rounding on the properties of tests for testing statistical hypotheses // Journal of Physics: Conference Series. – 2021. – Vol. 1715. – P. 012063. – DOI: 10.1088/1742-6596/1715/1/012063.
40. Лемешко Б.Ю., Лемешко С.Б. Непараметрические критерии согласия при проверке нормальности в условиях округления измерений // Системы анализа и обработки данных. – 2022. – № 2 (86). – С. 21–38. – DOI: 10.17212/2782-2001-2022-2-21-38.
41. Vasicek O. A test for normality based on sample entropy // Journal of the Royal Statistical Society. Series B, Methodological. – 1976. – Vol. 38 (1). – P. 54–59. – DOI: 10.1111/j.2517-6161.1976.tb01566.x.
42. Arizono I., Ohta H. A test for normality based on Kullback-Leibler information // The American Statistician. – 1989. – Vol. 43 (1). – P. 20–22.
43. Van Es B. Estimating functionals related to a density by a class of statistics based on spacings // Scandinavian Journal of Statistics. – 1992. – Vol. 19 (1). – P. 61–72.
44. Ebrahimi N., Pflughoeft K., Soofi E.S. Two measures of sample entropy // Statistics & Probability Letters. – 1994. – Vol. 20 (3). – P. 225–234.
45. Correa J.C. A new estimator of entropy // Communication in Statistics – Theory and Methods. – 1995. – Vol. 24 (10). – P. 2439–2449.
46. Zamanzade E., Arghami N.R. Testing normality based on new entropy estimators // Journal of Statistical Computation and Simulation. – 2012. – Vol. 82 (11). – P. 1701–1713. – DOI: 10.1080/00949655.2011.592984.
47. Dudewicz E.J., Van der Meulen E.C. Entropy-based tests of uniformity // Journal of the American Statistical Association. – 1981. – Vol. 76 (376). – P. 967–974.
48. Zamanzade E. Testing uniformity based on new entropy estimators // Journal of Statistical Computation and Simulation. – 2015. – Vol. 85 (16). – DOI: 10.1080/00949655.2014.958085.
49. Лемешко Б.Ю. Критерии проверки отклонения распределения от нормального закона: руководство по применению. – 2-е изд., перераб. и доп. – М.: Инфра-М, 2023. – 353 с. – (Научная мысль). – DOI: 10.12737/1896110.
50. Лемешко Б.Ю., Блинов П.Ю. Критерии проверки отклонения распределения от равномерного закона: руководство по применению. – М.: Инфра-М, 2015. – 183 с. – (Научная мысль). – DOI: 10.12737/11304.
51. Noughabi H.A., Arghami N.R. General treatment of goodness-of-fit tests based on Kullback–Leibler information // Journal of Statistical Computation and Simulation. – 2012. – Vol. 83 (8). – P. 1556–1569. – DOI: 10.1080/00949655.2012.667100.
52. Noughabi H.A. A new estimator of Kullback–Leibler information and its application in goodness of fit tests // Journal of Statistical Computation and Simulation. – 2019. – Vol. 89 (10). – P. 1914–1934. – DOI: 10.1080/00949655.2019.1602870.
53. Alavi S.Q., Noughabi H.A. A novel estimator of Kullback–Leibler information with its application to goodness of fit tests // Statistics, Optimization and Information Computing. – 2025. – Vol. 13 (5). – P. 1800–1818. – DOI: 10.19139/soic-2310-5070-2032.
54. Лемешко Б.Ю., Лемешко С.Б. Сравнительный анализ критериев проверки отклонения распределения от нормального закона // Метрология. – 2005. – № 2. – С. 3–24.
55. Noughabi H.A. A comparative study of goodness-of-fit tests for the Gumbel distribution // Statistica Applicata – Italian Journal of Applied Statistics. – 2024. – P. 1–17. – DOI: 10.26398/IJAS.267.
Лемешко Б.Ю., Лемешко С.Б. О свойствах и проблемах применения критериев согласия, опирающихся на использование оценок энтропии и дивергенции Кульбака?–?Лейблера //
Системы анализа и обработки данных. – 2025. – № 2 (98). – С. 53–80. – DOI: 10.17212/2782-2001-2025-2-53-80.
Lemeshko B.Yu., Lemeshko S.B. O svoistvakh i problemakh primeneniya kriteriev soglasiya, opirayushchikhsya na ispol'zovanie otsenok entropii i divergentsii Kul'baka – Leiblera [On the properties and problems of applying goodness-of-fit tests based on the use of entropy and Kullback?–?Leibler divergence estimates]. Sistemy analiza i obrabotki dannykh = Analysis and Data Processing Systems, 2025, no. 2 (98), pp. 53–80. DOI: 10.17212/2782-2001-2025-2-53-80.