统计学

P值计算器

报告错误

分享计算器

将我们的免费计算器添加到您的网站

请输入有效的 URL。仅支持 HTTPS URLs。

将页面上计算器输入字段中的当前值用作嵌入计算器的默认值。
输入框边框聚焦颜色,开关框选中颜色,选择项悬停颜色等。

请同意使用条款。
预览

保存计算器

什么是 p 值?

p 值量化了在假设**零假设(H₀)**为真的情况下,观察到与研究结果同样极端的结果的概率。它回答的问题是:“如果零假设为真,我的数据出现的可能性有多大?”

关键定义

  • 零假设(H₀):默认假设(例如“无效应”)。
  • 备择假设(H₁):被检验的假设(例如“存在效应”)。
  • 检验统计量:根据样本数据计算的标准值(如 Z 分数、t 分数)。

历史背景

p 值在 20 世纪 20 年代由罗纳德·费舍尔(Ronald Fisher)推广。他提出将0.05作为统计显著性的阈值,这一惯例至今仍有争议。

公式

p 值取决于检验统计量和假设检验的类型:

通用公式

p值={P(SxH0)(左尾)P(SxH0)(右尾)2×min{P(SxH0),P(SxH0)}(双尾)\text{p值} = \begin{cases} P(S \leq x \mid H₀) & \text{(左尾)} \\ P(S \geq x \mid H₀) & \text{(右尾)} \\ 2 \times \min\left\{P(S \leq x \mid H₀), P(S \geq x \mid H₀)\right\} & \text{(双尾)} \end{cases}

其中,SS为检验统计量,xx为其观测值。

Z 检验

对于 Z 分数为ZZ的 Z 检验:

Z=Xˉμσ/nZ = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}
  • 左尾Φ(Z)\Phi(Z)
  • 右尾1Φ(Z)1 - \Phi(Z)
  • 双尾2×Φ(Z)2 \times \Phi(-|Z|)

t 检验

对于 t 分数为tt且自由度df=n1df = n-1的 t 检验:

t=Xˉμs/nt = \frac{\bar{X} - \mu}{s / \sqrt{n}}
  • 左尾T_df(t)T\_{df}(t)
  • 右尾1T_df(t)1 - T\_{df}(t)
  • 双尾2×T_df(t)2 \times T\_{df}(-|t|)

卡方(χ²)检验

对于自由度为kk的 χ² 分数:

  • 左尾χ2_k(x)\chi²\_{k}(x)
  • 右尾1χ2_k(x)1 - \chi²\_{k}(x)

F 检验

对于自由度为(d1,d2)(d₁, d₂)的 F 分数:

  • 左尾F_d1,d2(x)F\_{d₁,d₂}(x)
  • 右尾1F_d1,d2(x)1 - F\_{d₁,d₂}(x)

示例

示例 1:总体均值的 Z 检验

场景:某工厂声称灯泡寿命为 1200 小时。50 个灯泡的样本均值为Xˉ=1180\bar{X} = 1180,标准差σ=100\sigma = 100。检验均值是否低于声称值。
解答

Z=11801200100/501.414Z = \frac{1180 - 1200}{100 / \sqrt{50}} \approx -1.414
  • 左尾 p 值Φ(1.414)0.078\Phi(-1.414) \approx 0.078
    结论:在α=0.05\alpha = 0.05水平下无法拒绝 H₀。

示例 2:卡方独立性检验

场景:一项调查检验性别(男/女)与偏好(是/否)是否独立。观测到 χ² = 6.25,自由度df=1df = 1
解答

  • 右尾 p 值1χ2_1(6.25)0.0121 - \chi²\_{1}(6.25) \approx 0.012
    结论:在α=0.05\alpha = 0.05水平下拒绝 H₀。

解读指南

  • p 值 < 0.01:有强证据反对 H₀。
  • 0.01 ≤ p 值 < 0.05:有中等证据反对 H₀。
  • p 值 ≥ 0.05:证据不足以拒绝 H₀。

常见误解

  1. 误解:高 p 值“证明”H₀ 为真。
    事实:仅表明反对 H₀ 的证据不足。
  2. 误解:p 值 = H₀ 为真的概率。
    事实:p 值基于 H₀ 为真的假设,并不衡量 H₀ 本身的可能性。

常见问题

p 值可以为负数吗?

不能。p 值表示概率,取值范围为 0 到 1。

如何解释 p 值为 0.07?

α=0.05\alpha = 0.05水平下无法拒绝 H₀。但该结果接近显著性边界,需进一步研究。

为什么 0.05 是常用的显著性水平?

费舍尔推广的 0.05 平衡了 I 类错误(假阳性)和检验敏感性。但该值是人为设定的,不同领域可能不同(如物理学使用5σ5\sigma,对应p3×107p \approx 3 \times 10^{-7})。

样本量如何影响 p 值?

样本量越大,检验敏感性越高,越容易检测到微小效应。报告 p 值时应同时说明效应量(如 Cohen’s d)。

单尾检验和双尾检验有何区别?

  • 单尾:检验单一方向的效应(如“大于”)。
  • 双尾:检验任意方向的效应。使用双倍尾部概率。