Изучение критерия Колмогорова–Смирнова и сравнение его с другими критериями согласия

Необходимо помнить, что теоретическая функция распределения должна быть известна с точностью до параметров. Распространенная ошибка - использование в качестве функции

Изучение критерия Колмогорова–Смирнова и сравнение его с другими критериями согласия

Курсовой проект

Математика и статистика

Другие курсовые по предмету

Математика и статистика

Сдать работу со 100% гаранией

Введение

 

Критерий согласия - это критерий проверки гипотезы о предполагаемом законе распределения генеральной совокупности.

 

 

где - эмпирическая функция распределения вероятностей; - гипотетическая функция распределения вероятностей [1].

В статистике критерий согласия Колмогорова - Смирнова используется для того, чтобы определить, подчиняются ли два эмпирических распределения одному закону, либо определить, подчиняется ли полученное распределение предполагаемой модели [2].

Модифицированные статистики критерия Колмогорова-Смирнова позволяют применять их в некоторых частных случаях и для ситуации с неизвестными параметрами гипотетических распределений [3].

Критерий Колмогорова - Смирнова является одним из основных и наиболее широко используемых непараметрических методов, так как достаточно чувствителен к различиям в исследуемых выборках[4].

Целью данной курсовой работы является изучение критерия согласия типа Колмогорова-Смирнова, сравнение с другими критериями согласия: Пирсона и ; и исследование его асимптотических свойств.

 

1.Критерии согласия

 

1.1Критерий Колмогорова-Смирнова

 

Пусть -эмпирическая функция распределения случайной величины , представленной выборкой:

 

 

Для проверки нулевой гипотезы , где -полностью определенная (с точностью до параметров) теоретическая функция распределения, рассматривается расстояние между эмпирической и теоретической функциями распределения

 

 

Здесь -точные верхняя и нижняя границы соответствующих разностей.

 

Для практического применения используются формулы

 

 

Колмогорованашел предельное распределение статистики (при )[3]. Если верна гипотеза , то независимо от функции , случайная величина имеет распределение Колмогорова [5]:

 

 

Смирнов развил результаты Колмогорова на случай статистик .

Между критическими значениями существует соотношение .

В качестве первого приближения можно использовать соотношение

 

 

Если , гипотеза согласия () отклоняется на уровне значимости .

При полезна аппроксимация

 

 

распределениекоторой удовлетворительно описывается распределением хи-квадрат с степенями свободы.

При необходимо использовать более точное приближение

 

 

где для , при и . Наиболее просты в приложениях результаты Стефенса, который предложил преобразования статистик устанавливающие зависимость их процентных точек от объема выборки :

 

 

Первые две аппроксимации используются соответственно для нижних и верхних процентных точек. Критические значения статистик Стефенса приведены в таблице 1.1[3].

 

Таблица 1.1 - Процентные точки статистик

0,1500,1000,0500,0250,0100,9731,0731,2241,3581,5181,1381,2241,3581,4801,628

.2Критерий Пирсона

 

Критерий основан на сравнении эмпирической гистограммы распределения случайной величины с ее теоретической плотностью. Диапазон изменения экспериментальных данных разбивается наинтервалов, и подсчитывается статистика

 

 

где - количество значений случайной величины, попавших в -й интервал; - объем выборки; - гипотетический теоретический закон распределения вероятностей случайной величины; - теоретическая вероятность попадания случайной величины в -й интервал.

Дисперсия статистики критерия равна

 

 

Если , т.е. совпадает с дисперсией случайной величины, имеющей -распределение. На этом основании принято считать, что статистика имеет распределение, близкое к распределению хи-квадрат.

На мощность статистического критерия сильное влияние оказывает число интервалов разбиения гистограммыи порядок ее разбиения (т.е. выбор длин интервалов внутри диапазона изменения значений случайной величины). На практике принято считать, что статистику можно использовать, когда

Так или иначе, статистика имеет распределение хи-квадрат с степенями свободы в том случае, когда проверяется простая гипотеза , т.е., когда гипотетическое распределение, на соответствие которому проверяется эмпирический ряд данных, известно с точностью до значения своих параметров. Если гипотеза сложная и параметры гипотетического распределения оцениваются по самой выборке, то число степеней свободы уменьшается на число оцениваемых параметров .

Правило проверки гипотезы просто: если

 

 

то на уровне значимости , т.е. с достоверностью гипотеза отклоняется [3].

 

1.3Критерий Смирнова-Крамера-фон Мизеса

 

Статистика критерия имеет вид

 

 

где- теоретическая функция распределения.

Необходимо помнить, что теоретическая функция распределения должна быть известна с точностью до параметров. Распространенная ошибка - использование в качестве функции распределения с параметрами, оцениваемыми по выборке - приводит к уменьшению величины критического значения статистики, т.е. к увеличению количества ошибок второго рода[6]. При объеме выборки можно использовать приведенные в таблице 1.2 квантили распределения , которые следуют из его предельного распределения ( - уровень значимости, принятый для проверки ).

 

Таблица 1.2 - Квантили распределения

0,1000,0500,0100,0050,0010,34730,46140,74350,86941,1679

При таблицей можно пользоваться с заменой на

 

 

Небходимо отметить, что и критерий и критерий Колмогорова-Смирнова подсчитывается по негруппированным выборкам (в отличие от критерия ) [3].

 

2.Проверка гипотез о виде распределения

 

Для проверки гипотезы о виде распределения смоделированы выборки из генеральных совокупностей, имеющих следующие законы распределения: экспоненциальное, степенное и распределение Парето.

 

2.1Экспоненциальное распределение

 

Случайная величина имеет экспоненциальное (показательное) распределение с параметром, если функция распределения имеет вид:

 

 

а плотность распределения:

 

 

Математическое ожидание равно .

Дисперсия случайной величины равна .

Плотность и функция показательного распределения случайной величины с параметром представлены на рисунках 2.1 и 2.2 [7].

 

Рисунок 2.1 - График плотности экспоненциального распределения с параметром

 

Рисунок 2.2 - График функции экспоненциального распределения с параметром

 

2.2Степенное распределение

 

Случайная величина имеет степенное распределение с параметром , если функция распределения имеет вид:

 

 

а плотность распределения[8]:

 

 

Область значения

Математическое ожидание равно

Дисперсия случайной величины равна [9].

Плотность и функция степенного распределения случайной величины с параметром представлены на рисунках 2.3 и 2.4.

 

Рисунок 2.3 - График плотности степенного распределения с параметром

 

Рисунок 2.4 - График функции степенного распределения с параметром

 

2.3Распределение Парето

 

Случайная величина имеет распределение Парето с параметром , если функция распределения имеет вид:

 

 

а плотность распределения [8]:

 

критерий согласие колмогоров смирнов

Область значения

Математическое ожидание равно

 

 

Дисперсия случайной величины равна

 

[10].

 

Плотность и функция степенного распределения случайной величины с параметром представлены на рисунках 2.5 и 2.6.

 

Рисунок 2.5 - График плотности распределения Парето с параметром

 

Рисунок 2.6 - График функции распределения Парето с параметром

 

2.4Результаты проверки гипотезы о виде распределения

 

Смоделировав выборки объемом из генеральных совокупностей, имеющих вышеуказанные законы распределения с известными параметрами, проведена проверка гипотезы о виде распределения методами типа Колмогорова-Смирнова и Пирсонанауровне значимости . Результаты проверки представлены в виде таблицы 2.1.

 

Таблица 2.1 - Результаты проверки гипотез о виде распределения двумя методами

Критерии согласиизаконы распределенияэкспоненциальное степенное Парето Колмогорова-СмирноваПирсона

Из полученной таблицы следует, что критерии согласия Колмогорова-Смирнова и Пирсона не противоречат друг другу.

Для сравнения критерий Колмогорова-Смирнова и на чувствительность к объему выборки и степени различия параметров распределения рассмотрена выборка, имеющая экспоненциальное распределение.Графики зависимости статистик критерий от объема выборки представлены на рисунках 2.7-2.8.Графики изменения статистик критерий при изменении параметра экспоненциального распределения представлены на рисунках 2.9-2.10.

 

Рисунок 2.7 - График изм

Похожие работы

1 2 >