one sample t-test | series thống kê cho KHDL bài 14

one sample t-test thumbnail

One sample t-test là gì?

Giới thiệu cơ bản về kiểm định t một mẫu

One Sample T-Test (Kiểm định t một mẫu) là một phương pháp thống kê được sử dụng để so sánh giá trị trung bình của một tập dữ liệu với một giá trị trung bình giả thuyết.

Giải thích dễ hiểu về kiểm định t một mẫu

Đây là một trong những kiểm định quan trọng trong thống kê suy luận. Nó giúp đánh giá xem liệu trung bình của một mẫu có khác biệt gì so với giá trị mong đợi hay không.

Khi nào thì chúng ta sử dụng kiểm định này

One Sample T-Test thường được sử dụng khi:

  • Bạn có một tập dữ liệu mẫu và muốn so sánh trung bình của nó với một giá trị chuẩn. Ví dụ: điểm trung bình của một lớp học so với điểm trung bình quốc gia).
  • Dữ liệu có phân phối chuẩn hoặc gần chuẩn.
  • Dữ liệu được lấy mẫu ngẫu nhiên từ một tổng thể.

>>>> Xem thêm: cách lấy mẫu trong thống kê

Những điều kiện để có thể sử dụng kiểm định t

Khi thực hiện kiểm định t, chúng ta cần tuân theo những thừa nhận (assumption) sau:

  • Phải độc lập (các giá trị không có liên quan với nhau)
  • Phải là biến liên tục
  • Cách lấy mẫu phải là ngẫu nhiên
  • Và như nói ở trên, dữ liệu phải có phân phối chuẩn hoặc gần chuẩn

>>>> Xem thêm về các loại biến trong thống kê

Công thức của kiểm định t một mẫu

One Sample t-Test sử dụng công thức sau:

[math]t=\frac{\bar{x}-\mu}{s/\sqrt{n}}[/math]

Trong đó:

  • [math]\bar{x}[/math] là giá trị trung bình của mẫu.
  • [math]\mu[/math] là giá trị trung bình giả thuyết (giá trị mà mình muốn so sánh).
  • [math]s[/math] là độ lệch chuẩn của mẫu.
  • [math]n[/math] là kích thước mẫu.

Giá trị t thu được sẽ được so sánh với giá trị tới hạn của phân phối t (t-critical) để xác định mức ý nghĩa thống kê.

Bạn có thể tải bản t-table ở đây hoặc xem trực tiếp bên dưới nhé:

>>>> Có thể bạn quan tâm: tìm hiểu về cơ sở dữ liệu ensembl trong tin sinh học

Ví dụ sử dụng one sample t-test

Một trường đại học muốn kiểm tra xem điểm trung bình của sinh viên năm nhất có khác biệt so với điểm chuẩn 75 hay không. Một mẫu ngẫu nhiên gồm 30 sinh viên có điểm trung bình là 72 với độ lệch chuẩn 8 được thu thập.

Sử dụng One Sample T-Test, giả sử mức ý nghĩa 5%, hãy tìm hiểu xem liệu điểm trung bình của sinh viên có khác biệt gì so với điểm chuẩn không?

Đầu tiên: Đặt giả thuyết

Giả thuyết [math]H_0[/math]: không có sự khác biệt giữa điểm trung bình của sinh viên và điểm chuẩn ([math]\mu = \mu_0[/math]) với [math]\mu_0 = 75[/math]

Giả thuyết [math]H_1[/math]: có sự khác biệt giữa điểm trung bình của sinh viên và điểm chuẩn ([math]\mu \neq \mu_0[/math])

Tiếp theo: Chọn mức ý nghĩa

Mức ý nghĩa ở đây theo đề bài chúng ta sẽ chọn là [math]\alpha = 0.05[/math].

Lưu ý, do ở ta so sánh có khác hay không nên ta sẽ làm thống kê 2 đuôi (two tail).

ví dụ về t-critical

Kế đến: Tính toán giá trị t

Dựa vào công thức ở trên, ta tính được giá trị t-value:

[math]t=\frac{\bar{x}-\mu}{s/\sqrt{n}}[/math] = [math]t=\frac{72-75}{8/\sqrt{30}}[/math] = -2.054

Bước 4: So sánh với giá trị t-critical

Để có thể sử dụng được bảng t-critical ở trên, chúng ta cần 1 giá trị nữa, đó chính là bậc tự do (degree of freedom). Trong one sample t-test thì bậc tự do (df) được tính là tổng số phần tử trong mẫu trừ 1 hay [math]df=n-1[/math].

Ở ví dụ này, df = 30 – 1 = 29. Từ giá trị df và [math]t_\alpha[/math] (t-critical của one sample t-test) ta tra bảng sẽ được:

cách tìm t-alpha trong one sample t-test

[math]t_\alpha=\pm2.045[/math]

Ở đây, do giá trị t-value ta tính ra được là giá trị âm nên ta sẽ so sánh t-value của chúng ta và [math]t_\alpha=-2.045[/math].

[math]t_{tính toán} < t_\alpha[/math] -> Ta loại giả thuyết [math]H_0[/math]

Cuối cùng: Kết luận

Có sự khác biệt giữa điểm trung bình của sinh viên và điểm chuẩn.

Tới đây là hoàn tất ví dụ về one sample t-test.

>>>> Xem thêm: Nhập môn tin sinh học cực dễ cho người mới

Related posts

Dữ liệu Ensembl | Tự học Tin sinh học – Bài 0.2

Tin sinh học | Bài 0.1: cơ sở dữ liệu NCBI

Two sample Z-test | series thống kê cho KHDL bài 13