Системы анализа и обработки данных

СИСТЕМЫ АНАЛИЗА И ОБРАБОТКИ ДАННЫХ

ISSN (печатн.): 2782-2001          ISSN (онлайн): 2782-215X
English | Русский

Последний выпуск
№1(97) Январь - Март 2025

Об исследовании свойств оценок и влияния методов оценивания на распределения статистик критериев проверки гипотез

Выпуск № 1 (97) Январь - Март 2025
Авторы:

Лемешко Борис Юрьевич,
Лемешко Станислав Борисович
DOI: http://dx.doi.org/10.17212/2782-2001-2025-1-49-72
Аннотация

Выражения статистик многих критериев проверки статистических гипотез содержат оценки параметров или числовых характеристик, таких как математическое ожидание или дисперсия, предполагаемых законов распределения вероятностей. Оценки можно находить различными методами. Исследование асимптотических свойств некоторой оценки аналитическими методами, как правило, представляет собой нетривиальную задачу. Еще сложнее аналитическими методами исследовать свойства оценок при ограниченных объемах выборок, когда реальные свойства оценок могут существенно отличаться от асимптотических. Компьютерные технологии позволяют исследовать асимптотические свойства оценок и уточнять, при каких объемах выборок можно опираться на асимптотические свойства, а также показывают, как реальные свойства отличаются от асимптотических при ограниченных объемах выборок.



Как следствие, распределения статистик критериев при справедливости проверяемой гипотезы зависят от свойств используемых оценок, то есть от применяемого метода оценивания. Исследование аналитическими методами изменившихся свойств критериев вследствие выбора другого метода оценивания также оказывается нетривиальной задачей. В то же время компьютерные технологии позволяют не только решать такие задачи, но и обеспечивать корректное применение соответствующих критериев в изменившихся условиях.



В рамках развиваемой программной системы продемонстрированы возможности компьютерных технологий моделирования и анализа данных при исследовании свойств различных оценок и влияния вида оценок на распределения статистик критериев. Исследованы свойства

MD-оценок, минимизирующих статистики различных непараметрических критериев согласия. Показано, что эти оценки, в отличие от оценок максимального правдоподобия, не являются асимптотически эффективными, и их асимптотические распределения различаются. Показано, что при проверке сложных гипотез, когда параметры закона находятся по анализируемой выборке, распределения статистик всех непараметрических критериев согласия и критерия  Пирсона, имеющие место при справедливости проверяемой гипотезы Н0, зависят от метода оценивания параметров. При этом распределения статистики одного и того же критерия различаются при разных методах оценивания. Полученные оценки мощности критериев, знание асимптотических свойств оценок и характера влияния этих оценок на распределения статистик критериев позволяют судить о предпочтительности комбинаций применяемых критериев с методами оценивания.



Программная система позволяет проводить аналогичные исследования относительно любых параметров более чем 30 параметрических моделей законов распределения, включенных

в систему, и относительно любых из более чем десятка критериев согласия.


Ключевые слова: программная система, оценки параметров, асимптотически эффективная оценка, непараметриче-ские критерии согласия, распределение статистики, достигнутый уровень значимости, проверка нормальности, ошибка 1-го рода, ошибка 2-го рода, мощность критерия, имитационное моделирование

Список литературы

1. Frosini B.V. A survey of a class of goodness-of-fit statistics // Metron. – 1978. – Vol. 36 (1–2). – P. 3–49.



2. Geary R.C. The ratio of the mean deviation to the standard deviation as a test of normality // Biometrika. – 1935. – Vol. 27. – P. 310–322.



3. Hegazy Y.A.S., Green J.R. Some new goodness-of-fit tests using order statistics // Applied Statistics. – 1975. – Vol. 24 (3). – P. 299–308.



4. Лемешко Б.Ю. Критерии проверки отклонения распределения от нормального закона. Руководство по применению: монография. – 2-е изд., перераб. и доп. – М.: Инфра-М, 2023. – 353 с. – (Научная мысль). – DOI: 10.12737/1896110.



5. Никулин М.С. Критерий хи-квадрат для непрерывных распределений с параметрами сдвига и масштаба // Теория вероятностей и ее применение. – 1973. – Т. 18, № 3. – С. 583–591.



6. Никулин М.С. О критерии хи-квадрат для непрерывных распределений // Теория вероятностей и ее применение. – 1973. – Т. 18, № 3. – С. 675–676.



7. Rao K.C., Robson D.S. A chi-squared statistic for goodness-of-fit tests within the exponential family // Communications in Statistics. – 1974. – Vol. 3 (12). – P. 1139–1153.



8. Vaart A.W. van der. Asymptotic statistics. – Cambridge University Press, 1998. – DOI: 10.1017/CBO9780511802256.



9. Greenwood P.E., Nikulin M.S. A guide to chi-squared testing. – New York: John Wiley & Sons, 1996. – 280 p.



10. Лемешко Б.Ю., Лемешко С.Б. Проблемы применения непараметрических критериев согласия в задачах обработки результатов измерений // Системы анализа и обработки данных. – 2021. – № 2 (82). – С. 47–66. – DOI: 10.17212/2782-2001-2021-2-47-66.



11. Лемешко Б.Ю. О проблемах и ошибках применения критериев согласия // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. – 2023. – № 64. – С. 74–90. – DOI: 10.17223/19988605/64/8.



12. Лемешко Б.Ю. Непараметрические критерии согласия. Руководство по применению: монография. – 2-е изд., перераб. и доп. – М.: Инфра-М, 2024. – 201 с. – (Научная мысль). – DOI: 10.12737/2058731.



13. Лемешко Б.Ю., Постовалов С.Н. О зависимости распределений статистик непараметрических критериев и их мощности от метода оценивания параметров // Заводская лаборатория. Диагностика материалов. – 2001. – Т. 67, № 7. – С. 62–71.



14. Лемешко Б.Ю., Маклаков А.А. Непараметрические критерии при проверке сложных гипотез о согласии с распределениями экспоненциального семейства // Автометрия. – 2004. – № 3. – С. 3–20.



15. Лемешко Б.Ю., Гильдебрант С.Я., Постовалов С.Н. К оцениванию параметров надежности по цензурированным выборкам // Заводская лаборатория. Диагностика материалов. – 2001. – Т. 67, № 1. – С. 52–64.



16. Лемешко Б.Ю. Об оценивании параметров распределений и проверке гипотез по цензурированным выборкам // Методы менеджмента качества. – 2001. – № 4. – С. 32–38.



17. Rao C.R. Criteria of estimation in large samples // Sankhya: The Indian Journal of Statistics, Series A. – 1963. – Vol. 25 (2). – P. 189–206.



18. Рао С.Р. Линейные статистические методы и их применение. – М.: Наука, 1968. – 548 с.



19. Статистический анализ интервальных наблюдений одномерных непрерывных случайных величин «Интервальная статистика 5.4»: свидетельство о гос. регистрации программы для ЭВМ № 2018666213 / Лемешко Б.Ю., Лемешко С.Б., Блинов П.Ю., Веретельникова И.В., Новикова А.Ю. – Заявка № 2018663206; заявл. 22.11.2018; зарег. 13.12.2018. – URL: https://ami.nstu.ru/~headrd/ISW.htm (дата обращения: 25.02.2025).



20. Лемешко Б.Ю., Постовалов С.Н. К вопросу о робастности оценок по группированным данным // Сборник научных трудов НГТУ. – 1996. – № 2 (4). – С. 9–18.



21. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход / Б.Ю. Лемешко, С.Б. Лемешко, С.Н. Постовалов, Е.В. Чимитова. – Новосибирск: Изд-во НГТУ, 2011. – 888 с.



22. Hampel F.R. The influence curve and its role in robust estimation // Journal of the American Statistical Association. – 1974. – Vol. 69 (346). – P. 383–393. – DOI: 10.2307/2285666.



23. Лемешко Б.Ю. Робастные методы оценивания и отбраковка аномальных измерений // Заводская лаборатория. Диагностика материалов. – 1997. – Т. 63, № 5. – С. 43–49.



24. Лемешко Б.Ю. Группирование наблюдений как способ получения робастных оценок // Надежность и контроль качества. – 1997. – № 5. – С. 26–35.



25. Лемешко Б.Ю., Чимитова Е.В. Построение оптимальных L-оценок параметров сдвига и масштаба распределений по выборочным квантилям // Сибирский журнал индустриальной математики. – 2001. – Т. 4, № 2. – С. 166–183.



26. Лемешко Б.Ю., Чимитова Е.В. Оптимальные L-оценки параметров сдвига и масштаба распределений по выборочным квантилям // Заводская лаборатория. Диагностика материалов. – 2004. – Т. 70, № 1. – С. 54–66.



27. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. – М.: Наука, 1983. – 416 с.



28. Anderson T.W., Darling D.A. A test of goodness of fit // Journal of the American Statistical Association. – 1954. – Vol. 49 (268). – P. 765–769. – DOI: 10.1080/01621459.1954.10501232.



29. Anderson T.W., Darling D.A. Asymptotic theory of certain “Goodness of fit” criteria based on stochastic processes // The Annals of Mathematical Statistics. – 1952. – Vol. 23 (2). – P. 193–212. – DOI: 10.1214/aoms/1177729437.



30. Kuiper N.H. Tests concerning random points on a circle // Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen Proceedings. Series A. – 1960. – Vol. 63. – P. 38–47.



31. Watson G.S. Goodness-of-fit tests on a circle // Biometrika. – 1961. – Vol. 48 (1–2). – P. 109–114.



32. Watson G.S. Goodness-of-fit tests on a circle. II // Biometrika. – 1962. – Vol. 49 (1–2). – P. 57–63.



33. Zhang J. Powerful goodness-of-fit and multi-sample tests: PhD Thesis. – Toronto, York University, 2001. – 113 p. – URL: http://www.collectionscanada.gc.ca/obj/s4/f2/dsk3/ftp05/NQ66371.pdf (accessed: 28.01.2013).



34. Лемешко Б.Ю., Чимитова Е.В. Численное сравнение оценок максимального правдоподобия с одношаговыми и влияние точности оценивания на распределения статистик критериев согласия // Заводская лаборатория. Диагностика материалов. – 2003. – Т. 69, № 5. – С. 62–68.



35. Лемешко Б.Ю. Асимптотически оптимальное группирование наблюдений – это обеспечение максимальной мощности критериев // Надежность и контроль качества. – 1997. – № 8. – С. 3–14.



36. Лемешко Б.Ю. Асимптотически оптимальное группирование наблюдений в критериях согласия // Заводская лаборатория. Диагностика материалов. – 1998. – Т. 64, № 1. – С. 56–64.



37. Лемешко Б.Ю. Лемешко С.Б., Семёнова М.А. К вопросу статистического анализа больших данных // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. – 2018. – № 44. – С. 40–49. – DOI: 10.17223/19988605/44/5.



38. Лемешко Б.Ю., Лемешко С.Б. Влияние округления на свойства критериев проверки статистических гипотез // Автометрия. – 2020. – Т. 56, № 3. – С. 35–45. – DOI: 10.15372/AUT20200305.



39. Лемешко Б.Ю., Лемешко С.Б. О влиянии ошибок округления на распределения статистик критериев согласия // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. – 2020. – № 53. – С. 47–60. – DOI: 10.17223/19988605/53/5.



40. Lemeshko B.Y., Lemeshko S.B. About the effect of rounding on the properties of tests for testing statistical hypotheses // Journal of Physics: Conference Series. – 2021. – Vol. 1715. – P. 012063. – DOI: 10.1088/1742-6596/1715/1/012063/.



41. Лемешко Б.Ю., Лемешко С.Б. Непараметрические критерии согласия при проверке нормальности в условиях округления измерений // Системы анализа и обработки данных. – 2022. – № 2 (86). – С. 21–38. – DOI: 10.17212/2782-2001-2022-2-21-38.



42. Лемешко Б.Ю., Лемешко С.Б., Постовалов С.Н. Сравнительный анализ мощности критериев согласия при близких конкурирующих гипотезах. I. Проверка простых гипотез // Сибирский журнал индустриальной математики. – 2008. – Т. 11, № 2 (34). – С. 96–111.



43. Лемешко Б.Ю., Лемешко С.Б., Постовалов С.Н. Сравнительный анализ мощности критериев согласия при близких альтернативах. II. Проверка сложных гипотез // Сибирский журнал индустриальной математики. – 2008. – Т. 11, № 4 (36). – С. 78–93.

Для цитирования:

Лемешко Б.Ю., Лемешко С.Б. Об исследовании свойств оценок и влияния методов оценивания на распределения статистик критериев проверки гипотез // Системы анализа и обработки данных. – 2025. – № 1 (97). – С. 49–72. – DOI: 10.17212/2782-2001-2025-1-49-72.

For citation:

Lemeshko B.Yu., Lemeshko S.B. Ob issledovanii svoistv otsenok i vliyaniya metodov otsenivaniya na raspredeleniya statistik kriteriev proverki gipotez [On the study of the properties of estimates and the influence of estimation methods on the distribution of statistics of hypothesis testing criteria]. Sistemy analiza i obrabotki dannykh = Analysis and Data Processing Systems, 2025, no. 1 (97), pp. 49–72. DOI: 10.17212/2782-2001-2025-1-49-72.

 

Просмотров: 37