Главная » Статьи » Математика » Математика

Критерии согласия: критерий χ² Пирсона

Критерии согласия: критерий  χ² Пирсона

Критерий  χ² (K.Pearson, 1900) основывается на группированных данных. Область значений предполагаемого распределения  делят на некоторое число интервалов. После чего строят функцию отклонения ρ по разностям теоретических вероятностей   попадания в интервалы группировки и   эмпирических частот.

Имеется выборка χ =( χ1,...,χn)  из распределения F . Проверяется простая гипотеза  против сложной альтернативы H1=(F = F1).

Пусть,A1,..., Ak  , ,  — интервалы группировки в области значений случайной величины с распределением . Обозначим для j = l,...,k через vj  число элементов выборки, попавших в интервал Aj


и через ρ > 0 — теоретическую вероятность PH (χi ε Aj попадания в интервал Aj  случайной величины с распределением
 F1. С необходимостью,ρ1+...+ρk = 1  . Как правило,
длины интервалов выбирают так, чтобы  ρ1=...=ρk = 1/k.    .

Пусть




(23)



Замечание 18.
Свойство K1(б) выполнено далеко не для всех альтернатив. Если распределение выборки F2 ≠ Fимеет такие же, как у F1 , вероятности ρj попадания в каждый из интервалов Aj , то по данной функции  эти распределения различить невозможно.

Поэтому на самом деле критерий, который мыпостроим  по функции  ρ из(23),решает совсем иную задачу. А именно, пусть задан набор вероятностей ρ1,... ρk такой, что ρ1+...+ρk = 1. Критерий  χ² предназначен для проверки сложной гипотезы   


против сложной альтернативы  , т.е.


Покажем, что ρ⒳удовлетворяет условию K1(a).

Теорема Пирсона.

Если верна гипотеза  H’1,
то при фиксированном k и при n → ∞ 

где, напомним, Hk-1  есть χ²   - распределение с k-1 степенью свободы.

Стоит остановиться и задать себе вопрос. Величина ρ есть сумма k слагаемых. Слагаемые, если вы не забыли ЦПТ или теорему Муавра — Лапласа, имеют распределения, близкие к квадратам каких-то нормальных. Куда потерялась одна степень свободы? 

Причина кроется, конечно, в зависимости слагаемых:  vk = n - v1-...-vk-1.




Докажем теорему Пирсона при  k = 2 .

В этом случае  v2 = n - v1ρ 2 = 1, . Посмотрим на ρ  и
вспомним ЦПТ:



.

Но величина v1  есть сумма n  независимых случайных величин
с распределением Бернулли Bρ1 , и по ЦПТ


где ξ имеет стандартное нормальное распределение. Поэтому


Величина  ξ²  имеет χ²  -распределение H1  с одной степенью свободы.

Q.D.E.




Функция  ρ⒳удовлетворяет условиюK1(б) Действительно,

Упражнение.    Вспомнить закон больших чисел и доказать,
что если H’1  неверна,
то найдется 
jε{1,...,k}.   такое, что


Осталось построить критерий в соответствии с K2.


Пусть случайная величина χ²k-1  имеет распределение Hk-1 . По таблице распределения  Hk-1  найдем  равное квантили
уровня 1- ε этого распределения.
Тогда  и
критерий согласия χ² выглядит как все критерии согласия:


Замечание 19.

На самом деле критерий χ²  применяют и для решения первоначальной
задачи о проверке гипотезы .H1={F = F1}  Необходимо только помнить,
что этот критерий не состоятелен для альтернатив с теми же вероятностями
попадания в интервалы разбиения, что и у F1 . Поэтому берут большое
число интервалов разбиения — чем больше, тем лучше, чтобы «уменьшить»
число альтернатив, неразличимых с  


Замечание 20.

Сходимость по распределению ρ⒳ Hk-1 обеспечивается ЦПТ, поэтому разница допредельной и предельной вероятностей
имеет тот же порядок, что и погрешность нормального приближения




 где b  — некоторая постоянная. Маленькие значения j  в знаменателе
приведут к тому, что распределение  ρ⒳будет существенно
отличаться от Hk-1 . Тогда и реальная вероятность P(ρ ≥ C ) —
точный размер полученного критерия — будет сильно
отличаться от ε  .
Поэтому для выборки объема n число интервалов разбиения выбирают
так, чтобы обеспечить нужную точность при замене распределения ρ⒳ на Hk-1.


Обычно требуют, чтобы nρ1=...=nρk   были не менее 5-6 .

Категория: Математика | Добавил: alexlat (28.06.2012)
Просмотров: 1621 | Рейтинг: 0.0/0
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]