Thống kê

t-test độc lập | Series thống kê cho KHDL bài 15

1. t-test độc lập là gì?

Trong thống kê, t-test độc lập (tiếng Anh: independent t-test) là một phương pháp kiểm định giả thuyết dùng để so sánh giá trị trung bình của hai nhóm độc lập.

Độc lập ở đây có nghĩa là không có sự phụ thuộc của bất kỳ phần tử nào của nhóm này đến nhóm kia.

Nói cách khác, sự thay đổi của phần tử trong nhóm này không ảnh hưởng đến nhóm kia. Chúng ta không là gì của nhau 😛😝😜

Mục tiêu của kiểm định này là xác định xem sự khác biệt về trung bình giữa hai nhóm có ý nghĩa thống kê hay chỉ xảy ra do ngẫu nhiên.

Ví dụ:

  • So sánh điểm trung bình toán của học sinh nam và nữ trong cùng một khối lớp.
  • So sánh mức độ hài lòng giữa hai nhóm khách hàng sử dụng hai phiên bản sản phẩm khác nhau.
Giới thiệu về kiểm tra t-test độc lập

Phép kiểm định này rất phổ biến trong nghiên cứu khoa học xã hội, giáo dục, y học và cả trong lĩnh vực kinh doanh, khi cần so sánh hai nhóm độc lập.

Xem thêm: Những bài thống kê dễ hiểu, đơn giản


2. Giả thuyết trong t-test độc lập

Tương tự các kiểm định thống kê t-test khác, t-test độc lập dựa trên việc xây dựng giả thuyết [math]H_0[/math] và giả thuyết [math]H_1[/math]

[math]H_0: \mu_1 = \mu_2[/math]​

[math]H_1: \mu_1 \neq \mu_2[/math]​

Trong một số nghiên cứu, ta có thể kiểm định một phía (one-tailed test), ví dụ: [math]H_1: \mu_1 > \mu_2[/math] hoặc [math]H_1: \mu_1 < \mu_2[/math]


3. Điều kiện áp dụng independent t-test

Để sử dụng t-test độc lập, dữ liệu cần thỏa mãn:

  1. Hai nhóm phải độc lập (không có phần tử nào cùng lúc thuộc cả hai nhóm).
  2. Biến phân tích phải là biến định lượng (khoảng hoặc tỉ lệ).
  3. Dữ liệu trong mỗi nhóm nên phân phối chuẩn (Normality) hoặc dữ liệu đủ lớn để gần phân phối chuẩn.
  4. Phương sai của hai nhóm gần bằng nhau (giả định phương sai đồng nhất – homogeneity of variance). Nếu không, ta có thể sử dụng Welch’s t-test, một biến thể của independent t-test.

4. Công thức t-test độc lập

Giả sử ta có:

  • Nhóm 1 có kích thước mẫu [math]n_1[/math] có trung bình là [math]\bar{X}_1[/math]​ và phương sai là [math]s_1^2[/math]​.
  • Nhóm 2 có kích thước mẫu [math]n_2[/math] có trung bình là [math]\bar{X}_2[/math]​ và phương sai là [math]s_2^2[/math]​.

Công thức t-test độc lập khi giả định phương sai bằng nhau:

[math]t = \frac{\bar{X}_1 – \bar{X}_2}{S_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}[/math]​​

Trong đó:

[math]S_p[/math] là độ lệch chuẩn gộp (pooled standard deviation).

[math]S_p = \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}}[/math].

Số bậc tự do (df): [math]df = n_1 + n_2 – 2[/math]

Nếu phương sai của hai nhóm không bằng nhau, ta sử dụng công thức Welch:

[math]t = \frac{\bar{X}_1 – \bar{X}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}[/math]​​

với bậc tự do xấp xỉ theo công thức Welch–Satterthwaite.

Công thức tính bậc tự do (df) xấp xỉ theo Welch–Satterthwaite:

[math]df = \frac{\left( \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2} \right)^2}{\frac{\left( \frac{s_1^2}{n_1} \right)^2}{n_1 – 1} + \frac{\left( \frac{s_2^2}{n_2} \right)^2}{n_2 – 1}}[/math]​

Trong đó:

  • [math]s_1^2[/math]​ và [math]s_2^2[/math]​ là phương sai của nhóm 1 và nhóm 2.
  • [math]n_1[/math]​ và [math]n_2[/math]​ là kích thước mẫu của nhóm 1 và nhóm 2.

Xem thêm: Những bài viết khoa học hay ho


5. Ví dụ minh họa t-test độc lập

Bài toán:

Một giáo viên muốn so sánh điểm kiểm tra Toán của học sinh namhọc sinh nữ lớp 5 để xem có sự khác biệt đáng kể không.

Dữ liệu thu được:

  • Nhóm nam (n₁ = 8): 7, 6, 8, 5, 6, 7, 8, 7
  • Nhóm nữ (n₂ = 8): 9, 8, 7, 9, 10, 8, 9, 9

Bước 1: Tính trung bình và phương sai

  • Trung bình nam:

[math]\bar{X}_1 = \frac{7+6+8+5+6+7+8+7}{8} = 6.75[/math]

  • Trung bình nữ:

[math]\bar{X}_2 = \frac{9+8+7+9+10+8+9+9}{8} = 8.625[/math]

  • Phương sai nhóm nam:

[math]s_1^2 \approx 0.93[/math]

  • Phương sai nhóm nữ:

[math]s_2^2 \approx 0.70[/math]

Bước 2: Tính độ lệch chuẩn gộp

[math]S_p = \sqrt{\frac{(8-1)(0.93) + (8-1)(0.70)}{8+8-2}} = \sqrt{\frac{6.51 + 4.90}{14}} \approx \sqrt{0.82} \approx 0.905[/math]

Bước 3: Tính giá trị t

[math]t = \frac{6.75 – 8.625}{0.905 \times \sqrt{\frac{1}{8}+\frac{1}{8}}}[/math]

[math]t = \frac{-1.875}{0.905 \times \sqrt{0.25}} = \frac{-1.875}{0.905 \times 0.5}[/math]

[math]t \approx \frac{−1.875}{0.425}​ \approx -4.15[/math]

Bước 4: So sánh với giá trị tới hạn

Với df=14, mức ý nghĩa [math]\alpha = 0.05[/math], giá trị tới hạn [math]t_{0.05} \approx \pm 2.145[/math]

Do [math]|t| = 4.15 > 2.145[/math], ta bác bỏ H₀.

Kết luận:

Điểm trung bình của học sinh nữ cao hơn có ý nghĩa thống kê so với học sinh nam.

>>>> Tìm hiểu về t-test bắt cặp (paired t-test)


6. Diễn giải kết quả independent t-test

Khi chạy t-test độc lập trên phần mềm thống kê (SPSS, R, Python, Excel), bạn thường sẽ thấy kết quả gồm:

  • Mean difference (chênh lệch trung bình)
  • t-value (giá trị kiểm định)
  • df (bậc tự do)
  • p-value (xác suất kiểm định)

Nếu p-value < α (0.05) → có ý nghĩa thống kê → bác bỏ [math]H_0[/math].


7. Ứng dụng thực tiễn

  • Giáo dục: So sánh điểm số giữa hai lớp học khác nhau.
  • Y học: So sánh hiệu quả điều trị giữa nhóm dùng thuốc và nhóm giả dược.
  • Kinh doanh: So sánh mức độ hài lòng của khách hàng giữa hai sản phẩm.

Independent t-test là công cụ cơ bản nhưng cực kỳ quan trọng, giúp nhà nghiên cứu đưa ra kết luận khoa học từ dữ liệu.

Tính toán t-test độc lập bằng python_phần 1. nhập dữ liệu
Tính toán t-test độc lập bằng python_phần 2. tính t-test

8. Kết luận

t-test độc lập (independent t-test) là một trong những phương pháp kiểm định thống kê phổ biến nhất, dùng để so sánh trung bình của hai nhóm độc lập. Bằng việc áp dụng công thức và ví dụ cụ thể, ta có thể thấy sức mạnh của công cụ này trong việc phân tích dữ liệu và đưa ra kết luận chính xác.

Việc hiểu và sử dụng đúng t-test độc lập giúp nhà nghiên cứu, giáo viên, bác sĩ hay doanh nghiệp có thể đưa ra quyết định dựa trên bằng chứng dữ liệu, thay vì chỉ dựa vào trực giác.


Có thể bạn quan tâm:

Tìm hiểu tin sinh học từ đơn giản nhất!

Cá vàng đang dần thông minh hơn chúng ta?!

Ra là thế

Chia sẽ những gì góp nhặt được trong cuộc sống. Mỗi ngày trôi qua đều để lại gì đó, điều quan trọng là bạn có chú ý đến nó hay không. “Bạn có hai cách để sống cuộc sống của mình. Một là nghĩ rằng trên đời này chẳng có điều gì là phép màu. Hai là nghĩ rằng mọi thứ đến với bạn đều là phép màu.” – Albert Einstein.

Recent Posts

Tổng hợp kim cương | Bước tiến mới trong khoa học vật liệu

Các nhà nghiên cứu Đại học Tokyo công bố phương pháp tổng hợp kim cương…

4 weeks ago

Công cụ tìm DNA | Google của bộ gen mở ra kỷ nguyên mới

Công cụ tìm DNA đã tạo ra một làn sóng đột phá. Giúp giải mã…

4 weeks ago

Bán dẫn siêu dẫn | Bước đột phá mới trong công nghệ siêu dẫn

Các nhà khoa học đã tạo ra dạng bán dẫn siêu dẫn. Một bước đột…

4 weeks ago

Kiểm định nhị thức | Series thống kê cho KHDL bài 18

Kiểm định nhị thức, hay binomial test, là một trong những phép kiểm định xác…

2 months ago

Đi bộ mỗi ngày – Bí quyết sống thọ không tốn kém

Những người duy trì thói quen đi bộ liên tục từ 10 đến 15 phút…

2 months ago

Phụ nữ sống thọ | Tiết lộ khoa học vì sao phụ nữ thọ hơn nam giới

Trên toàn cầu và trong suốt lịch sử, phụ nữ thường sống thọ hơn đàn…

2 months ago

This website uses cookies.