Thống kê

Kiểm định nhị thức | Series thống kê cho KHDL bài 18

Kiểm định nhị thức là gì?

Kiểm định nhị thức (Binomial Test) là một phép kiểm định xác suất dùng để xác định xem tỉ lệ thành công quan sát được có khác biệt đáng kể so với tỉ lệ giả định hay không.

Nói cách khác, nó giúp ta trả lời câu hỏi:

“Kết quả thu được có chỉ là do ngẫu nhiên hay thật sự khác biệt với tỉ lệ mong đợi?”

Ví dụ: Một công ty nói rằng 80% sản phẩm của họ đạt chuẩn. Bạn kiểm tra 10 sản phẩm, thấy chỉ 6 sản phẩm đạt. Câu hỏi đặt ra là: Liệu tỉ lệ thật có khác 80% không?

Đó chính là trường hợp dùng kiểm định nhị thức.

>>>> Xem thêm: Tìm hiểu về giá trị p-value

Khi nào dùng kiểm định nhị thức

Phép kiểm định này phù hợp khi:

  1. Mỗi phép thử chỉ có hai kết quả: thành công hoặc thất bại.
  2. Các phép thử là độc lập.
  3. Xác suất thành công p là cố định trong mọi lần thử.
  4. Ta biết số lần thử [math]n[/math] và số lần thành công [math]X[/math].
khi nào dùng kiểm định nhị thức

Cấu trúc giả thuyết kiểm định

Trong kiểm định nhị thức, ta đặt ra hai giả thuyết:

Giả thuyết không ([math]H_0[/math]): [math]p = p_0[/math] (Tỉ lệ thành công thật sự bằng tỉ lệ giả định).

Giả thuyết đối ([math]H_1[/math]):

  • [math]p \neq p_0[/math]​: kiểm định hai phía
  • [math]p > p_0[/math]​: kiểm định một phía phải
  • [math]p < p_0[/math]​: kiểm định một phía trái

>>>> Hướng dẫn sử dụng pymol quan sát cấu trúc protein

Phân phối nhị thức và công thức xác suất

Biến ngẫu nhiên [math]X[/math] là số lần thành công trong [math]n[/math] phép thử. Có xác suất thành công trong mỗi lần thử là [math]p[/math], tuân theo phân phối nhị thức:

[math]X \sim \text{Binomial}(n, p)[/math]

Công thức xác suất cho mỗi giá trị của [math]X[/math] là:

[math]P(X = x) = \binom{n}{x} p^x (1 – p)^{n – x}[/math]

Trong đó:

  • [math]\binom{n}{x} = \frac{n!}{x!(n – x)!}[/math]​: số cách chọn [math]x[/math] thành công trong [math]n[/math] lần thử
  • [math]p[/math]: xác suất thành công trong mỗi lần thử
  • [math]1-p[/math]: xác suất thất bại

>>>> Tìm hiểu cách kiểm định biến phân loại

Tính p-value trong kiểm định nhị thức

p-value là xác suất để quan sát được kết quả “cực đoan” bằng hoặc hơn giá trị thực tế nếu giả thuyết [math]H_0[/math] đúng.

Tùy loại kiểm định mà cách tính khác nhau:

Kiểm định hai phía

[math]p\text{-value} = 2 \times \min[P(X \leq x), P(X \geq x)][/math]

Kiểm định một phía phải ([math]H_1[/math]: [math]p > p_0[/math])

[math]p\text{-value} = P(X \geq x)[/math]

Kiểm định một phía trái ([math]H_1[/math]: [math]p < p_0[/math])

[math]p\text{-value} = P(X \leq x)[/math]

Sau khi tính p-value, ta so sánh với mức ý nghĩa [math]\alpha[/math] (thường là 0.05):

  • Nếu [math]p\text{-value} < \alpha[/math] → bác bỏ [math]H_0[/math]
  • Nếu [math]p\text{-value} \geq \alpha[/math] → chưa đủ bằng chứng bác bỏ [math]H_0[/math]

>>>> Bạn có biết cách đi bộ giúp mình khỏe hơn??

Ví dụ minh họa chi tiết

Một đồng xu được cho là công bằng, tức [math]p_0 = 0.5[/math]. Bạn tung đồng xu 10 lần, kết quả ra 8 mặt ngửa (thành công). Liệu đồng xu này có thật sự công bằng không?

Bước 1: Xác định giả thuyết

  • [math]H_0[/math]: [math]p=0.5[/math]
  • [math]H_1[/math]: [math]p \neq 0.5[/math] (kiểm định hai phía)
  • [math]\alpha = 0.05[/math]

Bước 2: Tính xác suất quan sát được 8 mặt ngửa

Sử dụng công thức phân phối nhị thức:

[math]P(X = 8) = \binom{10}{8} (0.5)^8 (0.5)^2 = 45 \times 0.5^{10} = 0.0439[/math]

Bước 3: Tính tổng xác suất “cực đoan”

Vì đây là kiểm định hai phía, ta cần cộng xác suất ở hai đầu ([math]\leq 2[/math] hoặc [math]\geq 8[/math]):

  • [math]p\text{-value} = 2 \times [P(X \geq 8)][/math]
  • [math]P(X \geq 8) = P(X = 8) + P(X = 9) + P(X = 10)= 0.0439 + 0.0098 + 0.0010 = 0.0547[/math]
  • [math]p\text{-value} = 2 \times 0.0547 = 0.1094[/math]

Bước 4: So sánh với [math]\alpha[/math]

Vì 0.1094 > 0.05 → không bác bỏ [math]H_0[/math] ⟹ Không đủ bằng chứng cho rằng đồng xu bị lệch.

Thí nghiệm kinh điển của binomial test – tung đồng xu

Thực hiện kiểm định nhị thức trong Python

Bạn có thể dùng scipy.stats.binomtest để tính nhanh:

from scipy.stats import binomtest

# Số lần thành công, số lần thử, và p giả định
x = 8
n = 10
p0 = 0.5

# Kiểm định hai phía
result = binomtest(x, n, p=p0, alternative='two-sided')
print("p-value:", result.pvalue)

Kết quả sẽ được

p-value: 0.109375

Cách diễn giải kết quả kiểm định nhị thức

  • Nếu [math]p\text{-value} < 0.05[/math]: Có sự khác biệt đáng kể về tỉ lệ thành công → bác bỏ [math]H_0[/math].
  • Nếu [math]p\text{-value} \geq 0.05[/math]: Không có bằng chứng đủ mạnh để bác bỏ [math]H_0[/math] → dữ liệu phù hợp với tỉ lệ giả định.

💡 Lưu ý: “Không bác bỏ [math]H_0[/math]” không có nghĩa là [math]H_0[/math] đúng, chỉ là chưa thấy bằng chứng sai khác đủ mạnh.

So sánh với kiểm định tỷ lệ (Z-test)

Đặc điểmKiểm định nhị thứcKiểm định Z cho tỷ lệ
Mẫu nhỏ✅ Phù hợp❌ Không chính xác
Mẫu lớn❌ Tính chậm✅ Xấp xỉ chuẩn
Loại dữ liệuNhị phânNhị phân
Công thứcDựa vào phân phối nhị thứcDựa vào phân phối chuẩn
Ví dụ10 lần tung đồng xu1000 cuộc khảo sát

>>>> Bằng chứng khoa học vì sao phụ nữ sống thọ hơn nam giới

Tổng kết

Kiểm định nhị thức là công cụ cơ bản nhưng cực kỳ mạnh mẽ trong thống kê, giúp đánh giá tính xác thực của tỉ lệ quan sát so với lý thuyết. Dù đơn giản, nó được ứng dụng rộng rãi trong:

  • Kiểm định chất lượng sản phẩm
  • Nghiên cứu y học (tỉ lệ bệnh, hiệu quả thuốc)
  • Thí nghiệm sinh học (tỉ lệ sống sót, di truyền)
  • Tâm lý học, khảo sát xã hội, và nghiên cứu thị trường

>>>> Xem thêm các bài thống kê cơ bản khác ở đây nhé

>>>> Bạn có thể tự học tin sinh học ở đây nhé!!

>>>> Bạn có biết, hạt nano kim cương được tổng hợp từ chất gì không?

Ra là thế

Chia sẽ những gì góp nhặt được trong cuộc sống. Mỗi ngày trôi qua đều để lại gì đó, điều quan trọng là bạn có chú ý đến nó hay không. “Bạn có hai cách để sống cuộc sống của mình. Một là nghĩ rằng trên đời này chẳng có điều gì là phép màu. Hai là nghĩ rằng mọi thứ đến với bạn đều là phép màu.” – Albert Einstein.

Recent Posts

Tổng hợp kim cương | Bước tiến mới trong khoa học vật liệu

Các nhà nghiên cứu Đại học Tokyo công bố phương pháp tổng hợp kim cương…

2 months ago

Công cụ tìm DNA | Google của bộ gen mở ra kỷ nguyên mới

Công cụ tìm DNA đã tạo ra một làn sóng đột phá. Giúp giải mã…

2 months ago

Bán dẫn siêu dẫn | Bước đột phá mới trong công nghệ siêu dẫn

Các nhà khoa học đã tạo ra dạng bán dẫn siêu dẫn. Một bước đột…

2 months ago

Đi bộ mỗi ngày – Bí quyết sống thọ không tốn kém

Những người duy trì thói quen đi bộ liên tục từ 10 đến 15 phút…

2 months ago

Phụ nữ sống thọ | Tiết lộ khoa học vì sao phụ nữ thọ hơn nam giới

Trên toàn cầu và trong suốt lịch sử, phụ nữ thường sống thọ hơn đàn…

3 months ago

Chia nhỏ để thành công | bí kíp sống sót của người bận rộn

Chia nhỏ để thành công, từng bước một thì chắc chắn sẽ được. Người ta…

3 months ago

This website uses cookies.