"Значимость" в эксперименте с несколькими исходами

В науках, тесно связанных с обработкой результатов экспериментов, – прикладных науках, применение статистических методов является повсеместным. Если получили какую-то выборку, то сразу встает, например, вопрос о размерах доверительного интервала оценки среднего значения, или, если осуществляется сравнение двух выборок – значимости отличий их средних и т.п.  Порой вопрос о значимости ставится прикладниками даже в том случае, когда он тривиален. Приведу следующий пример.

Ко мне обратились с задачей оценить значимость отличия от нуля значений, полученных в ходе эксперимента, результатами которого является набор целочисленных величин \( x_1, x_2,\ldots, x_s \), интерпретируемых как факты регистрации событий \(1,\ldots,s\) при проведении \(N\) испытаний. Более конкретно. Пусть мы ставим эксперимент в определении причин увядания некоторого вида растения, при этом мы способны установить причину увядания; допустим таких причин 3 (т.е. \(s=3\)). Далее, рассматривая \(N\) увядших растений и устанавливая причины их увядания, получаем набор значений \(x_1,x_2,x_3\), где каждое значение отражает количество растений увядших по \(i\)-ой (\(i=1,2,3\))  причине.  Таким образом, \(x_1+x_2+x_3=N\). Задача, которую мне формулируют, следующая. Пусть, для определенности,  \(x_1\) – малое число по сравнению с \(N\). Требуется выяснить значимо ли оно отличается от нуля или нет! Вот такой апофеоз статистического мышления. Впрочем, над этой задачей можно поразмышлять.

Основной задачей математической статистики является выяснение соответствия наблюдаемых данных той или иной вероятностной модели эксперимента. В данном случае – в качестве такой модели может выступать полиномиальная схема (в случае \(s=2\) классическая биномиальная схема), в которой имеется \(s\) исходов, реализуемых с неизвестными вероятностями \(p_1,\ldots,p_s\). Формулируемая выше задача о значимости в этом случае (по-видимому) состоит в том, что если мы  наблюдаем ненулевое число реализаций какого-либо исхода, например исхода 1, то какова вероятность отличия от нуля  \(p_1\)?! Вероятность отличия от нуля \(p_1\) при таких условиях (т.к. если бы оно было равно нулю, то исход бы не реализовался) – единица, и, следовательно, любой, хотя бы единыжды реализуемый исход в условиях эксперимента, следует признать значимо важным.

Впрочем, если имеется огромное желание судить о значимости в таких случаях, пожалуй будет вполне правомочно немного изменить смысл этого понятия.  Будем рассматривать соответствующую эксперименту полиномиальную схему с \(s\) возможными исходами и оценками вероятностей исходов \(\hat p_1=\dfrac{x_1}{N},\ldots,\hat p_s = \dfrac{x_s}{N}\). Таким образом, между оценками вероятностей \(\hat p_i\) и наблюдаемыми количествами реализаций исходов \(x_i\) устанавливается взаимооднозначеное соответствие, которое будет полезным в дальнейшем.

Уточним понятие значимости отличия от нуля. Будем говорить, что наблюдаемое число реализации исхода \(x^{\ast}\) значимо (с 95% уровнем доверия) отлично от нуля, если в условиях соответствующей полиномиальной схемы с оценой вероятности данного исхода \(p^{\ast}\), вероятность наблюдения хотя бы одной реализации в \( N \) экспериментах больше или равна 0.95. Вероятность не осуществления в этих условиях ни одного заданного исхода \((1-p^{\ast})^N\), откуда вероятность реализации хотя бы одного \(1-(1-p^{\ast})^N\), откуда получаем

$$1-(1-p^{\ast})^N\geq0.95$$ или \(p^{\ast}\geq1-0.05^{(1/N)}\), или учитывая взаимооднозначную связь между \(p^{\ast}\) и \(x^{\ast}\) получим \(x^{\ast}\geq N\dot(1-0.05^{1/N})\). Для примера, если \(N=80\), то \(x^{\ast}\approx 2.94\); таким образом, любое число исходов при 80 испытаниях большее  значения 2.94 следует признавать "значимо" отличным от нуля. Рассуждения без труда обобщаются на случай, когда вместо 0.05 рассматривается произвольный уровень значимости \(\alpha\), достаточно заменить 0.05 на \(\alpha\), а 0.95 на \(1-\alpha\).

Что же значит это "значимо"? Если мы реализуем, например,  80 кратное повторение эксперимента и какой-либо исход наблюдается при этом 3 и более раз, то в рамках соответствующей полиномиальной вероятностной модели при 80 кратном повторении модельного эксперимента с вероятностью реализации данного исхода \(3/80\) можно утверждать, что с не меньшим 0.95 значением вероятности в этой модельной серии данный исход будет наблюдаться хотя бы один раз.  Вполне интерпретируемое понятие значимости....

 

 

 

 

 

 

 

blog comments powered by Disqus