Что такое p-значение?
p-значение количественно определяет вероятность получения результатов, столь же экстремальных, как и те, что наблюдались в исследовании, при условии, что нулевая гипотеза (H₀) верна. Оно отвечает на вопрос: “Если нулевая гипотеза верна, насколько вероятны мои данные?”
Ключевые определения
- Нулевая гипотеза (H₀): Стандартное предположение (например, “эффект отсутствует”).
- Альтернативная гипотеза (H₁): Утверждение, которое проверяется (например, “эффект существует”).
- Тестовая статистика: Стандартизированное значение (например, Z-оценка, t-оценка), рассчитанное на основе выборки.
Исторический контекст
p-значение было популяризировано Рональдом Фишером в 1920-х годах. Фишер предложил порог 0,05 для статистической значимости, который до сих пор обсуждается.
Формула
p-значение зависит от тестовой статистики и типа проверяемой гипотезы:
Общая формула
где — тестовая статистика, а — её наблюдаемое значение.
Z-тест
Для Z-теста с Z-оценкой :
- Левосторонний:
- Правосторонний:
- Двусторонний:
t-тест
Для t-теста с t-оценкой и :
- Левосторонний:
- Правосторонний:
- Двусторонний:
Критерий хи-квадрат (χ²)
Для χ²-оценки с степенями свободы:
- Левосторонний:
- Правосторонний:
F-тест
Для F-оценки с степенями свободы:
- Левосторонний:
- Правосторонний:
Примеры
Пример 1: Z-тест для среднего значения
Сценарий: Завод утверждает, что лампы служат 1 200 часов. Выборка из 50 ламп имеет , . Проверьте, меньше ли среднее значение заявленного.
Решение:
- Левостороннее p-значение: .
Вывод: Не отклоняем H₀ при .
Пример 2: Критерий хи-квадрат для независимости
Сценарий: Опрос проверяет, связаны ли пол (М/Ж) и предпочтение (Да/Нет). Наблюдаемое χ² = 6,25, .
Решение:
- Правостороннее p-значение: .
Вывод: Отклоняем H₀ при .
Руководство по интерпретации
- p-значение < 0,01: Сильные доказательства против H₀.
- 0,01 ≤ p-значение < 0,05: Умеренные доказательства против H₀.
- p-значение ≥ 0,05: Недостаточно доказательств для отклонения H₀.
Распространённые заблуждения
- Миф: Высокое p-значение “доказывает” H₀.
Истина: Оно лишь указывает на недостаток доказательств против H₀. - Миф: p-значение = Вероятность истинности H₀.
Истина: p-значение предполагает истинность H₀, но не измеряет её вероятность.
Часто задаваемые вопросы
Может ли p-значение быть отрицательным?
Нет. p-значения представляют вероятности и должны быть между 0 и 1.
Как интерпретировать p-значение 0,07?
При не отклоняем H₀. Однако результат погранично значим и требует дальнейшего изучения.
Почему 0,05 — распространённый уровень значимости?
Популяризирован Фишером. 0,05 балансирует ошибку I рода (ложные положительные результаты) и чувствительность. Однако это произвольный выбор и зависит от области (например, физика использует , ).
Как размер выборки влияет на p-значения?
Крупные выборки увеличивают чувствительность, облегчая обнаружение малых эффектов. Всегда указывайте размер эффекта (например, d Коэна) вместе с p-значениями.
В чём разница между односторонними и двусторонними тестами?
- Односторонний: Проверяет эффект в одном направлении (например, “больше чем”).
- Двусторонний: Проверяет эффект в любом направлении. Использует вероятность хвоста.