Wednesday, November 19, 2008

Парадокс Берксона

Черновик [показать статью] (сравнить)  (+/-)
Последняя досмотренная версия (список всех) была проверена 19 сентября 2008. 2 правки требуют проверки.

Парадокс Берксона или ошибка Берксона — это вывод в условной вероятности и статистике, который является контр-интуитивным для некоторых людей, и таким образом может быть описан, как парадокс. Он является усложняющим фактором, появляющимся в статистических проверках соотношений.

Это результат того, что два независимых события становятся условно зависимыми в условиях того, что по крайней мере одно из них происходит. Формула:

если 0 < P(A) < 1 и 0 < P(B) < 1, и P(A|B) = P(A), т.е. они независимы, тогда P(A|B,C) < P(A|C) где C = A∪B (т.е. A или B).

Он часто описывается в области медицинской статистики или биостатистики, как оригинальное определение проблемы, поставленной Дж. Берксоном.

Например, предположим, что у меня есть 1000 почтовых марок, из которых 300 красивых и 100 редких, причём 30 и красивы, и редки. 10% изо всех марок редки и 10% изо всех красивых марок тоже редки, поэтому красивость ничего мне не говорит об их редкости. Я выбираю все 370 марок, которые красивы или редки для просмотра. Примерно около 27% марок при просмотре редки, но до сих пор только 10% из красивых марок редки. Если я буду рассматривать только те марки, которые я просматриваю, то увижу ложное отрицательное отношение между красивостью и редкостью, как результат моей предвзятости выбора.

Ссылки

  • Berkson, J. (1946) "Limitations of the application of fourfold tables to hospital data". Biometrics Bulletin, 2(3), 47-53.

Замечания по ссылкам

Ссылка Berkson (1946) приводимая выше часто цитируется некорректно в литературе как Berkson, J. (1949) Biological Bulletin 2, 47-53.

Biological Bulletin, основанный в 19 веке, не публикует статистические статьи. Корректная ссылка на биостатистический журнал Biometrics Bulletin, который был основан в 1945 году и переименован в Biometrics в 1947 году.