Статистика

Калькулятор p-значения

Сообщить об ошибке

Поделиться калькулятором

Добавьте наш бесплатный калькулятор на ваш сайт

Пожалуйста, введите действительный URL. Поддерживаются только HTTPS.

Использовать как значения по умолчанию для встроенного калькулятора то, что сейчас в полях ввода калькулятора на странице.
Цвет фокуса рамки ввода, цвет проверенного флажка, цвет наведения на выбранные элементы и т.д.

Пожалуйста, согласитесь с Условиями использования.
Предварительный просмотр

Сохранить калькулятор

Что такое p-значение?

p-значение количественно определяет вероятность получения результатов, столь же экстремальных, как и те, что наблюдались в исследовании, при условии, что нулевая гипотеза (H₀) верна. Оно отвечает на вопрос: “Если нулевая гипотеза верна, насколько вероятны мои данные?”

Ключевые определения

  • Нулевая гипотеза (H₀): Стандартное предположение (например, “эффект отсутствует”).
  • Альтернативная гипотеза (H₁): Утверждение, которое проверяется (например, “эффект существует”).
  • Тестовая статистика: Стандартизированное значение (например, Z-оценка, t-оценка), рассчитанное на основе выборки.

Исторический контекст

p-значение было популяризировано Рональдом Фишером в 1920-х годах. Фишер предложил порог 0,05 для статистической значимости, который до сих пор обсуждается.

Формула

p-значение зависит от тестовой статистики и типа проверяемой гипотезы:

Общая формула

p-значение={P(SxH0)(Левосторонний)P(SxH0)(Правосторонний)2×min{P(SxH0),P(SxH0)}(Двусторонний)\text{p-значение} = \begin{cases} P(S \leq x \mid H₀) & \text{(Левосторонний)} \\ P(S \geq x \mid H₀) & \text{(Правосторонний)} \\ 2 \times \min\left\{P(S \leq x \mid H₀), P(S \geq x \mid H₀)\right\} & \text{(Двусторонний)} \end{cases}

где SS — тестовая статистика, а xx — её наблюдаемое значение.

Z-тест

Для Z-теста с Z-оценкой ZZ:

Z=Xˉμσ/nZ = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}
  • Левосторонний: Φ(Z)\Phi(Z)
  • Правосторонний: 1Φ(Z)1 - \Phi(Z)
  • Двусторонний: 2×Φ(Z)2 \times \Phi(-|Z|)

t-тест

Для t-теста с t-оценкой и df=n1df = n-1:

t=Xˉμs/nt = \frac{\bar{X} - \mu}{s / \sqrt{n}}
  • Левосторонний: T_df(t)T\_{df}(t)
  • Правосторонний: 1T_df(t)1 - T\_{df}(t)
  • Двусторонний: 2×T_df(t)2 \times T\_{df}(-|t|)

Критерий хи-квадрат (χ²)

Для χ²-оценки с kk степенями свободы:

  • Левосторонний: χ2_k(x)\chi²\_{k}(x)
  • Правосторонний: 1χ2_k(x)1 - \chi²\_{k}(x)

F-тест

Для F-оценки с (d1,d2)(d₁, d₂) степенями свободы:

  • Левосторонний: F_d1,d2(x)F\_{d₁,d₂}(x)
  • Правосторонний: 1F_d1,d2(x)1 - F\_{d₁,d₂}(x)

Примеры

Пример 1: Z-тест для среднего значения

Сценарий: Завод утверждает, что лампы служат 1 200 часов. Выборка из 50 ламп имеет Xˉ=1180\bar{X} = 1 180, σ=100\sigma = 100. Проверьте, меньше ли среднее значение заявленного.
Решение:

Z=11801200100/501,414Z = \frac{1 180 - 1 200}{100 / \sqrt{50}} \approx -1,414
  • Левостороннее p-значение: Φ(1,414)0,078\Phi(-1,414) \approx 0,078.
    Вывод: Не отклоняем H₀ при α=0,05\alpha = 0,05.

Пример 2: Критерий хи-квадрат для независимости

Сценарий: Опрос проверяет, связаны ли пол (М/Ж) и предпочтение (Да/Нет). Наблюдаемое χ² = 6,25, df=1df = 1.
Решение:

  • Правостороннее p-значение: 1χ2_1(6,25)0,0121 - \chi²\_{1}(6,25) \approx 0,012.
    Вывод: Отклоняем H₀ при α=0,05\alpha = 0,05.

Руководство по интерпретации

  • p-значение < 0,01: Сильные доказательства против H₀.
  • 0,01 ≤ p-значение < 0,05: Умеренные доказательства против H₀.
  • p-значение ≥ 0,05: Недостаточно доказательств для отклонения H₀.

Распространённые заблуждения

  1. Миф: Высокое p-значение “доказывает” H₀.
    Истина: Оно лишь указывает на недостаток доказательств против H₀.
  2. Миф: p-значение = Вероятность истинности H₀.
    Истина: p-значение предполагает истинность H₀, но не измеряет её вероятность.

Часто задаваемые вопросы

Может ли p-значение быть отрицательным?

Нет. p-значения представляют вероятности и должны быть между 0 и 1.

Как интерпретировать p-значение 0,07?

При α=0,05\alpha = 0,05 не отклоняем H₀. Однако результат погранично значим и требует дальнейшего изучения.

Почему 0,05 — распространённый уровень значимости?

Популяризирован Фишером. 0,05 балансирует ошибку I рода (ложные положительные результаты) и чувствительность. Однако это произвольный выбор и зависит от области (например, физика использует 5σ5\sigma, p3×107p \approx 3 \times 10^{-7}).

Как размер выборки влияет на p-значения?

Крупные выборки увеличивают чувствительность, облегчая обнаружение малых эффектов. Всегда указывайте размер эффекта (например, d Коэна) вместе с p-значениями.

В чём разница между односторонними и двусторонними тестами?

  • Односторонний: Проверяет эффект в одном направлении (например, “больше чем”).
  • Двусторонний: Проверяет эффект в любом направлении. Использует 2×2 \times вероятность хвоста.