Trong ví dụ của bài kiểm định nhị thức có đoạn tính xác suất 2 phía. Bài này sẽ giúp bạn giải thích binomial test cụ thể hơn về cách tính trong kiểm định hai phía.
Mục lục bài viết
Mục tiêu của kiểm định hai phía
Trong kiểm định hai phía (two-sided test), ta không chỉ quan tâm xem tỉ lệ thực tế có lớn hơn giá trị giả định [math]p_0[/math] hay không, mà quan tâm đến cả hai hướng:
Liệu tỉ lệ thực tế có khác (lớn hơn hoặc nhỏ hơn) [math]p_0[/math]?
Vì vậy, ta cần xem xét mọi giá trị của [math]X[/math] (số lần thành công) xa với giá trị kỳ vọng như kết quả ta quan sát được. Cả phía trên và phía dưới.
>>>> Tại sao bạn dễ bị người khác điều khiển? xem ngay tại đây nhé!
Giải thích binomial test cụ thể với đồng xu
- [math]n = 10[/math], [math]p_0 = 0.5[/math], [math]X = 8[/math] (tức 8 lần ra mặt ngửa)
- Giá trị kỳ vọng (trung bình): [math]E[X] = n \times p_0 = 10 \times 0.5 = 5[/math]. Nghĩa là: nếu đồng xu thật sự công bằng, ta mong đợi trung bình 5 mặt ngửa.
Bây giờ, kết quả 8 mặt ngửa nằm cách trung bình 3 đơn vị về phía “nhiều ngửa hơn”.
→ Để kiểm định hai phía, ta phải xem xét phía đối xứng còn lại, tức là những kết quả “ít ngửa hơn trung bình cũng 3 đơn vị”, tức là [math]X = 2[/math].
Tư duy “mức độ cực đoan” (extremeness)
Để giải thích ví dụ binomial test bài trước, ta không chỉ xét phía mà ta quan sát được (≥8), mà còn xét phía đối xứng tương đương (≤2), vì:
- Khi [math]X \geq 8[/math]: kết quả quá nhiều mặt ngửa → nghi ngờ xu hướng nghiêng về ngửa.
- Khi [math]X \leq 2[/math]: kết quả quá ít mặt ngửa → nghi ngờ xu hướng nghiêng về sấp.
Cả hai trường hợp đều là “xa trung tâm” (xa giá trị 5 của kỳ vọng) như nhau, nên đều là các bằng chứng phản đối giả thuyết [math]H_0: p = 0.5[/math].

Do đó, ta phải tính xác suất ở cả hai phía “cực đoan” như nhau:
[math]p\text{-value} = P(X \ge 8) + P(X \le 2)[/math]
hoặc một cách khác:
[math]p\text{-value} = 2 \times \min[P(X \ge 8), P(X \le 2)][/math]
Minh họa trực quan để giải thích binomial test
| Kết quả (X) | Xác suất P(X) | “Độ xa” so với trung bình (5) |
|---|---|---|
| 0 | 0.00098 | 5 |
| 1 | 0.00977 | 4 |
| 2 | 0.04395 | 3 |
| 3 | 0.11719 | 2 |
| 4 | 0.20508 | 1 |
| 5 | 0.24609 | 0 |
| 6 | 0.20508 | 1 |
| 7 | 0.11719 | 2 |
| 8 | 0.04395 | 3 |
| 9 | 0.00977 | 4 |
| 10 | 0.00098 | 5 |
Ta thấy [math]X = 8[/math] và [math]X = 2[/math] đều cách 3 đơn vị so với trung bình (5) và có cùng xác suất 0.04395.
→ Đây chính là hai vùng “cực đoan” tương ứng của phân phối nhị thức.
>>>> Xem ngay: giá trị p-value là gì mà nhà khoa học nào cũng phải biết??
Kết luận cho giải thích binomial test
Vì kiểm định hai phía, ta phải xem xét mọi kết quả “cực đoan” hơn hoặc bằng giá trị quan sát được.
Nên nếu ta quan sát [math]X = 8[/math], thì phía đối xứng tương ứng là [math]X = 2[/math].
Do đó, ta cộng xác suất [math]P(X \ge 8)[/math] và [math]P(X \le 2)[/math].
Tóm tắt giải thích binomial test
| Loại kiểm định | Vùng tính xác suất | Khi nào dùng |
|---|---|---|
| Một phía phải | [math]P(X \ge x)[/math] | Nghi ngờ tỉ lệ lớn hơn [math]p_0[/math] |
| Một phía trái | [math]P(X \le x)[/math] | Nghi ngờ tỉ lệ nhỏ hơn [math]p_0[/math] |
| Hai phía | [math]P(X \ge x) + P(X \le x)[/math] | Nghi ngờ tỉ lệ khác [math]p_0[/math] theo cả hai hướng |
