Объясню нестрого (как гуманитариям объясняю. Прошу математиков сильно меня не бить
).
Главное свойство статистической гипотезы -- она говорит о распределении случайной величины (величин). Или о параметрах такого распределения. Например
1) Среднее значение равно 5
2) Дисперсии и совпадают
3) Величина распределена равномерно /нормально /еще как-то
4) Величины и независимы
Гипотеза такого вида называется "нулевой". Обычно нулевая гипотеза как бы говорит, что в данных "ничего интересного нет" -- нет различия, нет зависимости и т.п. Кроме того, в пару к этой, рассматривается альтернативная гипотеза, например:
1) Среднее значение больше 5
2) Дисперсии и не совпадают
3) Величина не распределена равномерно /нормально /еще как-то
4) Величины и зависимы
Так вот, обычно данные не в точности подтверждают нулевую гипотезу, есть отклонения. Например, для (1) выборочное среднее оказалось равным 5,5. Большое это отличие или нет? Методы статистики не позволяют, конечно, сказать "большое" или "маленькое", ведь данные содержат случайность! Но можно проверить вот что. Предположим, что истинное значение все-таки 5. Какова вероятность, что отклонение выборочных данных настолько велико (+0,5)? Эта вероятность называется p-value.
Например, если p-value равно 0,35, мы говорим: "Вероятность довольно большая, это могло произойти чисто случайно. Такое отклонение не противоречит нулевой гипотезе". Если же p-value равно 0,0035, это очень мало. Вряд ли могло произойти такое маловероятное событие! Значит, наше предположение было неверным, и среднее все-таки не равно 5 (больше 5, если такова была альтернативная гипотеза). Границей между "малой вероятностью" и "не малой" берут обычно 5%. Или даже 1%.
Критерий хи-квадрат используется для проверки гипотез типа (3) и (4) из приведенного списка. Впрочем, он довольно грубый.