Obrabotka Metallov 2026 Vol. 28 No. 1

ОБРАБОТКА МЕТАЛЛОВ Том 28 № 1 2026 66 ТЕХНОЛОГИЯ Для достижения цели необходимо решить следующие задачи: – разработать методический подход к определению минимально необходимого объема выборки, обеспечивающего статистическую надежность получаемых результатов; – проанализировать влияние числа наблюдений на устойчивость коэффициентов регрессии, точность аппроксимации и величину ошибок предсказания; – сформулировать практические рекомендации по выбору достаточного объема выборки для решения прикладных задач анализа технологических процессов. Методика исследований Методика статистической оценки данных. В исследовании нормальность проверяется с использованием нескольких взаимодополняющих критериев. ● Критерий Шапиро – Уилка позволяет установить, насколько выборка соответствует нормальному распределению через линейную комбинацию порядковых статистик: ( ) 2 =1 2 =1 ( ) , = ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ − ∑ ∑ n i i i n i i i a y W y y где y(i) – упорядоченные значения выборки, yi – наблюдаемые и y – среднее значения; ai – коэффициенты, зависящие от ковариационной матрицы нормального распределения. ● Критерий Андерсона – Дарлинга, который представляет собой модификацию критерия Колмогорова – Смирнова, придающую больший вес хвостам распределения: ( ) ( ) ( ) 2 =1 1 2 1 1 ( ) ( 1 ) ( ) ln ln , = − − − − × ⎡ ⎤ × + − ⎣ ⎦ ∑ n i i n+ i A n i n F x F x где F(x) – функция распределения нормали. ● Критерий согласия Пирсона основан на сравнении наблюдаемых и ожидаемых частот в интервалах 2 2 =1 ( ) = − χ ∑ k i i i i O E E , где Oi – наблюдаемая частота в i-м интервале; Ei – ожидаемая частота в i-м интервале; k – число интервалов. Важным фактором, способным исказить результаты анализа, остается мультиколлинеарность предикторов. Для ее выявления и количественной оценки применяется 2 VIF 1 1 = − i i R , где R2 – коэффициент детерминации, который показывает, какая доля вариации зависимой переменной объясняется моделью на основе независимых переменных [21]. Если обозначить резидуалы как y − i i i e = y  , где yi  – прогнозируемые значения, тогда 2 2 =1 2 =1 ( ) = . − ∑ ∑ n i i n i i i e R y y Чтобы одновременно оценить качество объяснения и точность прогноза, для проверки адекватности модели используют метрики ошибок [22]: – среднюю абсолютную ошибку (MAE): =1 1 MAE= ∑ n i i e n ; – квадратный корень из средней квадратичной ошибки (RMSE) [23]: =1 1 . RMSE= ∑ n i i e n Благодаря тому, что функция RMSE гладкая и дифференцируемая, можно аналитически вывести оптимальные коэффициенты регрессии. Для простой линейной модели yi = β0 + β1xi + εi, где xi – предиктор; β0, β1 – параметры модели; εi – случайная ошибка. Резидуалы определяются как − i i e = y 0 1 + . ( ) − β β i x Функция RMSE записывается в виде 0 1 =1 1 , . RMSE ( )= β β ∑ n i i e n Обозначим 2 0 1 =1 1 , . ( ) RMSE = β β ⇒ ∑ n i i S e S n Тогда градиент RMSE по параметрам модели через правило цепи имеет вид

RkJQdWJsaXNoZXIy MTk0ODM1