Trong bài one sample t-test lần này chúng ta sẽ cùng nhau tìm hiểu về kiểm định t. Ở bài z-test lần trước, ta đã thấy sức mạnh của kiểm định. Lần này, hãy cùng tìm hiểu xem nó có lợi ích gì so với z-test nhé!
Mục lục bài viết
One sample t-test là gì?
Giới thiệu cơ bản về kiểm định t một mẫu
One Sample T-Test (Kiểm định t một mẫu) là một phương pháp thống kê được sử dụng để so sánh giá trị trung bình của một tập dữ liệu với một giá trị trung bình giả thuyết.
Đây là một trong những kiểm định quan trọng trong thống kê suy luận. Nó giúp đánh giá xem liệu trung bình của một mẫu có khác biệt gì so với giá trị mong đợi hay không.
Khi nào thì chúng ta sử dụng kiểm định này
One Sample T-Test thường được sử dụng khi:
- Bạn có một tập dữ liệu mẫu và muốn so sánh trung bình của nó với một giá trị chuẩn. Ví dụ: điểm trung bình của một lớp học so với điểm trung bình quốc gia).
- Dữ liệu có phân phối chuẩn hoặc gần chuẩn.
- Dữ liệu được lấy mẫu ngẫu nhiên từ một tổng thể.
Những điều kiện để có thể sử dụng kiểm định t
Khi thực hiện kiểm định t, chúng ta cần tuân theo những thừa nhận (assumption) sau:
- Phải độc lập (các giá trị không có liên quan với nhau)
- Phải là biến liên tục
- Cách lấy mẫu phải là ngẫu nhiên
- Và như nói ở trên, dữ liệu phải có phân phối chuẩn hoặc gần chuẩn
Công thức của kiểm định t một mẫu
One Sample t-Test sử dụng công thức sau:
[math]t=\frac{\bar{x}-\mu}{s/\sqrt{n}}[/math]
Trong đó:
- [math]\bar{x}[/math] là giá trị trung bình của mẫu.
- [math]\mu[/math] là giá trị trung bình giả thuyết (giá trị mà mình muốn so sánh).
- [math]s[/math] là độ lệch chuẩn của mẫu.
- [math]n[/math] là kích thước mẫu.
Giá trị t thu được sẽ được so sánh với giá trị tới hạn của phân phối t (t-critical) để xác định mức ý nghĩa thống kê.
Bạn có thể tải bản t-table ở đây hoặc xem trực tiếp bên dưới nhé:
>>>> Có thể bạn quan tâm: tìm hiểu về cơ sở dữ liệu ensembl trong tin sinh học
Ví dụ sử dụng one sample t-test
Một trường đại học muốn kiểm tra xem điểm trung bình của sinh viên năm nhất có khác biệt so với điểm chuẩn 75 hay không. Một mẫu ngẫu nhiên gồm 30 sinh viên có điểm trung bình là 72 với độ lệch chuẩn 8 được thu thập.
Sử dụng One Sample T-Test, giả sử mức ý nghĩa 5%, hãy tìm hiểu xem liệu điểm trung bình của sinh viên có khác biệt gì so với điểm chuẩn không?
Đầu tiên: Đặt giả thuyết
Giả thuyết [math]H_0[/math]: không có sự khác biệt giữa điểm trung bình của sinh viên và điểm chuẩn ([math]\mu = \mu_0[/math]) với [math]\mu_0 = 75[/math]
Giả thuyết [math]H_1[/math]: có sự khác biệt giữa điểm trung bình của sinh viên và điểm chuẩn ([math]\mu \neq \mu_0[/math])
Tiếp theo: Chọn mức ý nghĩa
Mức ý nghĩa ở đây theo đề bài chúng ta sẽ chọn là [math]\alpha = 0.05[/math].
Lưu ý, do ở ta so sánh có khác hay không nên ta sẽ làm thống kê 2 đuôi (two tail).
Kế đến: Tính toán giá trị t
Dựa vào công thức ở trên, ta tính được giá trị t-value:
[math]t=\frac{\bar{x}-\mu}{s/\sqrt{n}}[/math] = [math]t=\frac{72-75}{8/\sqrt{30}}[/math] = -2.054
Bước 4: So sánh với giá trị t-critical
Để có thể sử dụng được bảng t-critical ở trên, chúng ta cần 1 giá trị nữa, đó chính là bậc tự do (degree of freedom). Trong one sample t-test thì bậc tự do (df) được tính là tổng số phần tử trong mẫu trừ 1 hay [math]df=n-1[/math].
Ở ví dụ này, df = 30 – 1 = 29. Từ giá trị df và [math]t_\alpha[/math] (t-critical của one sample t-test) ta tra bảng sẽ được:
[math]t_\alpha=\pm2.045[/math]
Ở đây, do giá trị t-value ta tính ra được là giá trị âm nên ta sẽ so sánh t-value của chúng ta và [math]t_\alpha=-2.045[/math].
[math]t_{tính toán} < t_\alpha[/math] -> Ta loại giả thuyết [math]H_0[/math]
Cuối cùng: Kết luận
Có sự khác biệt giữa điểm trung bình của sinh viên và điểm chuẩn.
Tới đây là hoàn tất ví dụ về one sample t-test.