Аннотация
Основные результаты прикладной математической статистики, связанные с развитием методов анализа интервальных наблюдений, получены при больших объемах выборок и малых погрешностях измерений. В связи с этим представляется актуальным исследование методами компьютерного моделирования статистических свойств оценок и критериев проверки статистических гипотез по интервальным данным ограниченного объема. Целью данной работы является исследование методами статистического моделированиясвойств непараметрической оценки функции распределения по выборкам интервальных наблюдений, а также сравнение алгоритмов по времени вычисления этой оценки. Основная идея построения непараметрической оценки функции распределения по интервальным данным заключается в нахождении максимума логарифма функции правдоподобия по значениям функции распределения в граничных точках интервалов наблюдений при соблюдении условия монотонности функции распределения. В данной работе для этого используются алгоритмыТёрнбулла и ICM. В результате сравнительного анализа алгоритмов по времени вычисления непараметрической оценки функции распределения при различных объемах выборок и длинах интервалов наблюдений показано, что время вычисления оценки по ICM-алгоритму существенно меньше, чем по алгоритмуТёрнбулла. Методами статистического моделирования проведены исследования свойств непараметрической оценки функции распределения по интервальным данным, а также получены оценки скорости сходимости непараметрической оценки к истинной функции распределения при различных длинах интервалов наблюдений.
В качестве расстояния между непараметрической оценкой и истинной функцией распределения рассмотрены статистики Колмогорова и Крамера–Мизеса–Смирнова. Показано, что с ростом длин интервалов скорость сходимости падает.
Ключевые слова: интервальные данные, непараметрическая оценка функции распределения, алгоритм Тёрнбулла, ICM-алгоритм, миноранта, метод Монте-Карло, расстояние Колмогорова, расстояние Крамера–Мизеса–Смирнова
Список литературы
1. Turnbull B.W. Nonparametric estimation of a survivorship function with doubly-censored data // Journal of the American Statistical Association. – 1974. – Vol. 69, iss. 345. – P. 169–173. – doi: 10.1080/01621459.1974.10480146.
2. Turnbull B.W. The empirical distribution function with arbitrarily grouped, censored and truncated data // Journal of the Royal Statistical Society. Series B. – 1976. – Vol. 38, N 3. – P. 290–295. – doi: 10.2307/2984980.
3. Efron B. The two sample problem with censored data // Procceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probality. – New York: Prentice Hall, 1967. – Vol. 4. – P. 831–853.
4. Groeneboom P.Asymptotics for interval censored observations: technical report 87-18 / University of Amsterdam, Department of Mathematics. – Amsterdam, 1987. – 69 p.
5. Groeneboom P. Nonparametric maximum likelihood estimators for interval censoring and deconvolution: technical report no. 378 / Stanford University, Department of Statistics. – Stanford, California, 1991. – 87 p.
6. Groeneboom P., Wellner J.A. Information bounds and nonparametric maximum likelihood estimation. – Basel: BirkhauserVerlag, 1992. – 126 p. – doi: 10.1007/978-3-0348-8621-5.
7. Wellner J.A., Zhan Y. A hybrid algorithm for computation of the nonparametric maximum likelihood estimator from censored data // Journal of the American Statistical Association. – 1997. – Vol. 92, iss. 439. – P. 945–959.
8. Зенкова Ж.Н., Краковецкая И.В. Непараметрическая оценка Тернбулла для интервально-цензурированных данных в маркетинговом исследовании спроса на биоэнергетические напитки // Вестник Томского государственного университета. Управление, вычислительнаятехникаиинформатика. – 2013. – № 3 (24). – С. 64–69.
9. Chang M.N. Weak convergence of a self-consistent estimator of the survival function with doubly censored data // The Annals of Statistics. – 1990. – Vol. 18,
N 1. – P. 391–404. – doi: 10.1214/aos/1176347506.
10. Chang M.N., Yang G.L. Strong Consistency of a nonparametric estimator of the survival function with doubly censored data // The Annals of Statistics. – 1987. – Vol. 15, N 4. – P. 1536–1547. – doi: 10.1214/aos/1176350608.
11. Samuelsen S.O. Asymptotic theory of nonparametric estimator from doubly-censored data // Scandinavian Journal of Statistics. – 1989. – Vol. 16. – P. 1–21.
12. Лемешко Б.Ю., Чимитова Е.В., Ведерникова М.А. Модифицированные критерии согласия Колмогорова, Крамера-Мизеса-Смирнова и Андерсона-Дарлинга для случайно цензурированных выборок. Ч. 2 // Научный вестник НГТУ. – 2013. – № 1 (50). – С. 3–16.
13. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход: монография / Б.Ю. Ле-мешко, С.Б. Лемешко, С.Н. Постовалов, Е.В. Чимитова. – Новосибирск:
Изд-во НГТУ, 2011. – 888 с. – (Серия «Монографии НГТУ»).
14. Компьютерное моделирование и исследование вероятностных закономерностей / Б.Ю. Лемешко, А.А. Горбунова, С.Б. Лемешко, С.Н. Постовалов, А.П. Рогожников, Е.В. Чимитова // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. – 2013. –
№ 1 (22). – С. 74–85.
15. Демин В.А., Чимитова Е.В. Выбор оптимального параметра сглаживания для непараметрической оценки регрессионной модели надежности // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. – 2013. – № 1 (22). – С. 59–65.
16. Система статистического анализа данных типа времени жизни «LiTiS 1.2»: [свидетельство о государственной регистрации программы для ЭВМ]
№ 2015610901 / Е.В. Чимитова, А.В. Румянцев, М.А. Семенова, Н.С. Галанова, В.А. Демин; правообладатель: Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Новосибирский государственный технический университет». – Заявка
№ 2014661905; заявл. 24.11.2014; опубл. 20.01.2015. – 1 с.