Статистический тест для серии испытаний по схеме Бернулли

Распределение Бернулли (Я. Бернулли 1654–1705) – одно из базовых распределений теории вероятностей. Оно описывает серию однородных экспериментов, каждый из которых имеет два возможных исхода.  Многократное подбрасывание монеты с возможными исходами выпадения "орла" и "решки"  может рассматриваться в качестве примера распределения Бернулли.

Если положить, для определенности, что элементарный эксперимент, входящий в серию, имеет своими исходами (условно) "успех" – реализуемый с вероятностью \(P\) и "неудачу", реализуемую с вероятностью \(1-P\), то распределение вероятностей k-успехов в серии N испытаний – это распределение Бернулли.

Если обозначить эту вероятность  \(P^k_N\), то

$$P_N^k=C_N^kP^k(1-P)^{N-k},$$

где \(С_N^k=\frac{N!}{k!(N-k)!}\) – биномиальные коэффицинеты, составляющие, например, треугольник Паскаля.

Таким образом, вероятность k-выпадений "решки" (ровно как и "орла") в серии N подбрасываний монеты описывается распределением Бернулли. Если монета симметрична и выпадение "орла" или "решки" можно считать равновероятными событиями, то данная вероятность равна \(C_N^k\frac{1}{2^N}\).

Таким образом, зная вероятность элементарного исхода (например, выпадения "орла" в эксперименте с монетой), легко вычислить вероятности возникновения серии заданных исходов при многократных повторениях эксперимента.

Часто в прикладных исследованиях возникает иная задача, заключающаяся в том, что эксперимент уже проведен и результаты его являются доступными, но требуется ответить на вопрос соответствует ли проведенному эксперименту некая вероятностная модель. Например, в результате 100 кратных подбрасываний монеты 43 раза выпала "решка" и 57 – "орел".  Соответствует ли такой расклад распределению Бернулли с вероятностью выпадения "решки" ("орла") равной 1/2?  Это типичная задача математической статистики, когда по результатам эксперимента требуется  проверить соответствие данных некоторой вероятностной модели. В данном случае в качестве такой вероятностной модели выступает распределение Бернулли.

Проверим для приведенного случая с подбрасыванием монеты соответствие распределению Бернулли с вероятностью исхода  в одном из испытаний 0.5.  С использованием пакета научных вычислений SciPy это можно сделать следующим образом:

1
2
from scipy.stats import binom_test
binom_test([43 57], 0.5)

Результатом выполнения фрагмента кода является значение p-value равное  0.19334790449564238, интерпретируемое как вероятность реализации в условиях схемы Бернулли с вероятностью отдельного исхода 0.5 такой ситуации, когда из 100 повторений эксперимента (подбрасываний монеты) "решка" выпадает 43 и менее раз, либо 57 и более раз (функция binom_test реализует так называемый двусторонний тест). Значение вероятности 0.19 достаточно большое (если сравнивать с 5% (0.05) уровнем значимости), таким образом наблюдаемые в эксперименте значения (43, 57) не противоречат гипотезе о том, что вероятности выпадения "решки" и "орла" равные (т.е. равны 0.5).

blog comments powered by Disqus