К формальным тестам проверки нормальности распределения относятся такие статистические тесты, которые позволяют оценить, насколько полученная выборка соответствует нормальному распределению. Внимание к проверке нормальности объясняется тем, что многие статистические методы базируются на предположении о нормальном распределении данных. Если данные не соответствуют нормальному распределению, то применение этих методов будет недопустимо.
Одним из наиболее популярных формальных тестов проверки нормальности является тест Шапиро-Уилка. Данный тест основан на сравнении экспериментальной функции распределения с ожидаемой нормальной функцией распределения. Гипотеза нулевая состоит в том, что выборка была взята из нормального распределения. Если p-значение (вероятность получить такие или еще более экстремальные значения, при условии истинности нулевой гипотезы) меньше заданного уровня значимости, то нулевая гипотеза отвергается в пользу альтернативной, и делается вывод о том, что данные не имеют нормального распределения.
Другим известным тестом проверки нормальности является тест Колмогорова-Смирнова. В результате применения данного теста вычисляется максимальное расхождение между эмпирической функцией распределения и теоретической функцией распределения (в данном случае - нормальной). Гипотеза о нормальности данных отвергается, если данное расхождение превышает заданное критическое значение, которое зависит от размера выборки и уровня значимости.
Аналогом теста Колмогорова-Смирнова является тест Лиллиефорса. Он используется для проверки нормальности данных исключительно на основе экспериментальной функции распределения без предварительной спецификации параметров (не равна нулю и дисперсия).
Тест Шапиро-Уилка, тест Колмогорова-Смирнова и тест Лиллиефорса являются формальными, так как позволяют вычислить статистику и сопоставить ее с соответствующими критическими значениями. Они являются непараметрическими тестами, так как не требуют предварительных предположений о параметрах нормального распределения.
Тестируются гипотезы о нормальности для возможности применять классические статистические методы, которые предполагают нормальность данных или для оценки типичного характера выборки для дальнейшей интерпретации полученных результатов. Например, выборка измерений может быть обработана с использованием тестов нормальности для определения, могут ли эти данные быть представлены в качестве среднего значения и дисперсии, или необходимо использовать непараметрические методы.
Кроме тестов Шапиро-Уилка, Колмогорова-Смирнова и Лиллиефорса, есть и другие формальные тесты проверки нормальности распределения. Некоторые из них: тест Андерсона-Дарлинга, тест Розенбаума и тест Жарка-Бера. Каждый из этих тестов обладает своими особенностями и предназначен для решения конкретных задач. Выбор конкретного теста зависит от многих факторов, включая характер данных, доступные ресурсы и специфику исследования или задачи.