One sample Z-test giúp chúng ta kiểm tra xem giá trị trung bình của một quần thể chuẩn có bằng một giá trị mục tiêu hay không. Khó hiểu phải không? hãy cùng nhau đào sâu vào nhé. Tiện thể, series từ bây giờ sẽ đổi tên đã có 1 luồng gió mớ, bớt lười hơn (haha). và từ rất dài thống kê cho khoa học dữ liệu sẽ được viết tắt thành TKCKHDL nhé!
Mục lục bài viết
- 1 Khi nào thì dùng Z-test
- 2 One sample Z-test để làm gì?
- 3 Cách tính toán
- 4 Ví dụ về one sample Z-test
Khi nào thì dùng Z-test
Z-test hay kiểm định Z là phương pháp thống kê sử dụng để xác định sự khác biệt của hai giá trị trung bình của quần thể (two sample Z-test).
Hoặc sử dụng để so sánh một giá trị trung bình với một giá trị giả thuyết (One sample Z-test).
Điều cần lưu ý khi làm Z-test chính là:
- Quần thể phải có phân bố chuẩn
- Phương sai của quần thể đã biết
Thiếu một trong 2 yếu tố trên thì không thể nào làm Z-test được.
One sample Z-test để làm gì?
Như đã nói ở trên, kiểm định Z một mẫu giúp ta so sánh một giá trị (thường là giá trị trung bình) của quần thể với giá trị giả thuyết.
Ngoài giá trị trung bình (mean) ra thì chúng ta còn có thể so sánh tỉ lệ với một giá trị cho trước.
Khi nói đến so sánh thì ta sẽ có các biểu thức như lớn hơn, nhỏ hơn, hay khác so với giá trị cho trước. Tùy vào từng loại so sánh ta muốn mà ta sẽ làm test 1 đuôi (one-tail test) hay 2 đuôi (two-tail test). Và do đó đặt giả thuyết thống kê cho phù hợp.
Để hiểu rõ hơn, hãy xem cách tính bên dưới.
Cách tính toán
Đặt giả thuyết thống kê thích hợp
Tùy vào điều kiện ta muốn làm kiểm định mà đặt giả thuyết cho phù hợp như sau:
Kiểm định 2 đuôi (two-tail Z-test)
Cách đặt giả thuyết cho kiểm định có sự khác biệt hay không
- [math]H_0[/math]: [math]\mu=\mu_0[/math] (giá trị trung bình của quần thể bằng với giá trị giả thuyết [math]\mu_0[/math])
- [math]H_1[/math]: [math]\mu\neq\mu_0[/math] (giá trị trung bình của quần thể khác với giá trị giả thuyết [math]\mu_0[/math])
Kiểm định bên trái
Đặt giả thuyết cho việc kiểm định giá trị trung bình của quần thể có nhỏ hơn giá trị cho trước hay không.
- [math]H_0[/math]: [math]\mu\geq\mu_0[/math] (giá trị trung bình của quần thể lớn hơn hoặc bằng với giá trị giả thuyết [math]\mu_0[/math])
- [math]H_1[/math]: [math]\mu<\mu_0[/math] (giá trị trung bình của quần thể nhỏ hơn với giá trị giả thuyết [math]\mu_0[/math])
Kiểm định bên phải
Để kiểm định cho giá trị trung bình của quần thể lớn hơn giá trị cho trước, ta đặt giả thuyết như bên dưới.
- [math]H_0[/math]: [math]\mu\leq\mu_0[/math] (giá trị trung bình của quần thể nhỏ hơn hoặc bằng với giá trị giả thuyết [math]\mu_0[/math])
- [math]H_1[/math]: [math]\mu>\mu_0[/math] (giá trị trung bình của quần thể lớn hơn với giá trị giả thuyết [math]\mu_0[/math])
Công thức tính kiểm định Z một mẫu
Đối với việc kiểm định giá trị trung bình
Công thức tính toán có thể được biểu diễn đơn giản như bên dưới:
[math]z=\frac{\bar{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}}[/math]
Với:
- [math]\bar{x}[/math] là trung bình của mẫu số liệu
- [math]\mu_0[/math] là giá trị trung bình dự đoán của quần thể
- [math]\sigma[/math] là độ lệch chuẩn của quần thể
- [math]n[/math] là số phần tử của mẫu số liệu
Kiểm định một tỉ lệ cho trước
Để tính toán z-test cho tỉ lệ cho trước, ta tính theo công thức sau:
[math]z=\frac{p-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}[/math]
Với:
- [math]p[/math] là tỉ lệ quan sát được của một mẫu số liệu
- [math]p_0[/math] là tỉ lệ giả thuyết của quần thể
- [math]n[/math] là kích thước của mẫu số liệu
Sau khi tìm được z thì làm gì?
So sánh với z giả thuyết và kết luận
Tùy thuộc vào khoảng tin cậy [math]\alpha[/math] mà ta đã chọn khi làm one sample Z-test, và tùy thuộc vào giả thuyết thống kê mà ta sẽ so sánh [math]z[/math] tính được so với [math]z_{\alpha/2}[/math].
[math]z_{\alpha/2}[/math] có thể tìm được bằng cách tra bảng z-score.
thông thường, với độ tin cậy CI = 95% ([math]\alpha=0.05[/math] thì [math]z_{\alpha/2} = \pm1.96[/math] đối với kiểm định 2 đuôi. Tức là từ (-1.96, 1.96) (nếu [math]z[/math] tính toán được trong khoảng này thì sẽ chấp nhận [math]H_0[/math].
[math]z_{\alpha} = 1.645[/math] đối với kiểm định bên phải. Tức là [math]z \in (-\infty, 1.645)[/math] thì sẽ chấp nhận [math]H_0[/math].
Ngược lại, đối với kiểm định bên trái, [math]z_{\alpha} = -1.645[/math]. Tức là [math]z \in (-1.645, \infty)[/math] thì sẽ chấp nhận [math]H_0[/math].
Tại sao 2 đuôi là [math]\alpha/2[/math] còn 1 đuôi là [math]\alpha[/math]?
Khi kiểm định 2 đuôi, ta sẽ kiểm định cả đuôi bên trái và bên phải của đồ thị, do đó [math]\alpha[/math] sẽ được tách ra và chia đều cho mỗi bên, chính là [math]\alpha/2[/math]. Ngược lại, khi kiểm tra giả thuyết 1 đuôi, thì ta chỉ lấy về 1 phái của đồ thì, do đó không cần phải tách [math]\alpha[/math] ra.
Ví dụ về one sample Z-test
Dong dài công thức nãy giờ rồi, hãy cùng nhau làm vài ví dụ thì bạn sẽ hiểu hơn.
Ví dụ 1 của kiểm định Z một mẫu – so sánh trung bình
Một trung tâm giáo dục tuyên bố rằng điểm trung bình của học sinh sau khi học ở trung tâm của họ lớn hơn 82 điểm (trên thang 100). Độ lệch chuẩn là 20 điểm.
Một mẫu 81 học sinh được khảo sát ngẫu nhiên cho thấy có điểm trung bình là 90 điểm. Với khoảng tin cậy 95% thì lời khẳng định của trung tâm có đủ bằng chứng để khẳng định không?
Bước 1: Nêu ra giả thuyết
- Giả thuyết không [math]H_0[/math]: [math]\mu \leq 82[/math]
- Giả thuyết thay thế [math]H_1[/math]: [math]\mu > 82[/math]
Vì tuyên bố của trung tâm là lớn hơn 82 điểm, nên ta sẽ phải làm kiểm định 1 đuôi (bên phải).
Bước 2: Xác định khoảng tới hạn (tìm [math]z_{\alpha/2}[/math])
Độ tin cậy 95% nên [math]\alpha = 0.05[/math]. Do đó giá trị tới hạn sẽ là [math]1- \alpha = 0.95[/math]
Tra bảng Z-score ta sẽ thấy [math]z_{\alpha/2}=1.645[/math]
Bước 3: Tính toán giá trị z-score
- [math]\bar{x}=90[/math]
- [math]\mu=82[/math]
- [math]\sigma=20[/math]
- [math]n=81[/math]
Áp dụng công thức ta sẽ tìm được:
[math]z=\frac{\bar{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}}=\frac{90-82}{\frac{20}{\sqrt{81}}}=3.6[/math]
Bước 4: Đưa ra kết luận
So sánh [math]z > z_{\alpha/2}[/math]. Do đó, nằm trong vùng loại bỏ giả thuyết [math]H_0[/math].
Từ đây có thể đưa ra kết luận: trung tâm này hoàn toàn có đủ bằng chứng thống kê để nói rằng điểm trung bình của học sinh sau khi học xong ở trung tâm họ là lớn hơn 82 điểm.
Ví dụ 2 của one sample Z-test – so sánh tỷ lệ
Giả sử ta muốn biết tỉ lệ ủng hộ một luật mới của một quốc giá nào đó có bằng 60% hay không. Ta thực hiện một cuộc khảo sát trong 100 người ngẫu nhiên và thấy rằng có 64% người được khảo sát ủng hộ với luật này.
Với độ tin cậy 95% thì liệu có thể kết luận là 60% dân số ủng hộ đạo luật này không?
Bước 1: Đặt giả thuyết
- Giả thuyết không: [math]H_0: p = 0.60[/math] (tỉ lệ ủng hộ là 60%)
- Giả thuyết thay thế: [math]H_1: p \neq 0.60[/math] (tỉ lệ ủng hộ khác 60%)
Bước 2: Tính toán giá trị z
[math]z=\frac{p-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}=\frac{0.64-0.60}{\sqrt{\frac{0.60(1-0.60)}{100}}}=0.816[/math]
Bước 3: Đua ra kết luận
Với độ tin cậy 95% nên [math]\alpha = 0.05[/math]. Vì ta làm Z-test 2 đuôi nên ta sẽ sử dụng [math]\alpha/2 = 0.025[/math].
Do đó giá trị tới hạn là [math]1- \alpha/2 = 0.975[/math]. Tra bảng ta sẽ tìm được [math]z_{\alpha/2} = 1.96[/math].
Vùng chấp nhận giả thuyết [math]H_0[/math] sẽ là vùng (-1.96, 1.96). Do giá trị tính toán của chúng ta z = 0.816.
Ta chấp nhận giả thuyết [math]H_0[/math]. Phát biểu tỷ lệ dân số ủng hộ luật này là 60% là có cơ sở thống kê.