one sample z-test. series tkckhdl bài 12
One sample Z-test giúp chúng ta kiểm tra xem giá trị trung bình của một quần thể chuẩn có bằng một giá trị mục tiêu hay không. Khó hiểu phải không? hãy cùng nhau đào sâu vào nhé. Tiện thể, series từ bây giờ sẽ đổi tên đã có 1 luồng gió mớ, bớt lười hơn (haha). và từ rất dài thống kê cho khoa học dữ liệu sẽ được viết tắt thành TKCKHDL nhé!
Mục lục bài viết
Z-test hay kiểm định Z là phương pháp thống kê sử dụng để xác định sự khác biệt của hai giá trị trung bình của quần thể (two sample Z-test).
Hoặc sử dụng để so sánh một giá trị trung bình với một giá trị giả thuyết (One sample Z-test).
Điều cần lưu ý khi làm Z-test chính là:
Thiếu một trong 2 yếu tố trên thì không thể nào làm Z-test được.
Như đã nói ở trên, kiểm định Z một mẫu giúp ta so sánh một giá trị (thường là giá trị trung bình) của quần thể với giá trị giả thuyết.
Ngoài giá trị trung bình (mean) ra thì chúng ta còn có thể so sánh tỉ lệ với một giá trị cho trước.
Khi nói đến so sánh thì ta sẽ có các biểu thức như lớn hơn, nhỏ hơn, hay khác so với giá trị cho trước. Tùy vào từng loại so sánh ta muốn mà ta sẽ làm test 1 đuôi (one-tail test) hay 2 đuôi (two-tail test). Và do đó đặt giả thuyết thống kê cho phù hợp.
Để hiểu rõ hơn, hãy xem cách tính bên dưới.
Tùy vào điều kiện ta muốn làm kiểm định mà đặt giả thuyết cho phù hợp như sau:
Cách đặt giả thuyết cho kiểm định có sự khác biệt hay không
Đặt giả thuyết cho việc kiểm định giá trị trung bình của quần thể có nhỏ hơn giá trị cho trước hay không.
Để kiểm định cho giá trị trung bình của quần thể lớn hơn giá trị cho trước, ta đặt giả thuyết như bên dưới.
Công thức tính toán có thể được biểu diễn đơn giản như bên dưới:
[math]z=\frac{\bar{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}}[/math]
Với:
Để tính toán z-test cho tỉ lệ cho trước, ta tính theo công thức sau:
[math]z=\frac{p-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}[/math]
Với:
Tùy thuộc vào khoảng tin cậy [math]\alpha[/math] mà ta đã chọn khi làm one sample Z-test, và tùy thuộc vào giả thuyết thống kê mà ta sẽ so sánh [math]z[/math] tính được so với [math]z_{\alpha/2}[/math].
[math]z_{\alpha/2}[/math] có thể tìm được bằng cách tra bảng z-score.
thông thường, với độ tin cậy CI = 95% ([math]\alpha=0.05[/math] thì [math]z_{\alpha/2} = \pm1.96[/math] đối với kiểm định 2 đuôi. Tức là từ (-1.96, 1.96) (nếu [math]z[/math] tính toán được trong khoảng này thì sẽ chấp nhận [math]H_0[/math].
[math]z_{\alpha} = 1.645[/math] đối với kiểm định bên phải. Tức là [math]z \in (-\infty, 1.645)[/math] thì sẽ chấp nhận [math]H_0[/math].
Ngược lại, đối với kiểm định bên trái, [math]z_{\alpha} = -1.645[/math]. Tức là [math]z \in (-1.645, \infty)[/math] thì sẽ chấp nhận [math]H_0[/math].
Khi kiểm định 2 đuôi, ta sẽ kiểm định cả đuôi bên trái và bên phải của đồ thị, do đó [math]\alpha[/math] sẽ được tách ra và chia đều cho mỗi bên, chính là [math]\alpha/2[/math]. Ngược lại, khi kiểm tra giả thuyết 1 đuôi, thì ta chỉ lấy về 1 phái của đồ thì, do đó không cần phải tách [math]\alpha[/math] ra.
Dong dài công thức nãy giờ rồi, hãy cùng nhau làm vài ví dụ thì bạn sẽ hiểu hơn.
Một trung tâm giáo dục tuyên bố rằng điểm trung bình của học sinh sau khi học ở trung tâm của họ lớn hơn 82 điểm (trên thang 100). Độ lệch chuẩn là 20 điểm.
Một mẫu 81 học sinh được khảo sát ngẫu nhiên cho thấy có điểm trung bình là 90 điểm. Với khoảng tin cậy 95% thì lời khẳng định của trung tâm có đủ bằng chứng để khẳng định không?
Vì tuyên bố của trung tâm là lớn hơn 82 điểm, nên ta sẽ phải làm kiểm định 1 đuôi (bên phải).
Độ tin cậy 95% nên [math]\alpha = 0.05[/math]. Do đó giá trị tới hạn sẽ là [math]1- \alpha = 0.95[/math]
Tra bảng Z-score ta sẽ thấy [math]z_{\alpha/2}=1.645[/math]
Áp dụng công thức ta sẽ tìm được:
[math]z=\frac{\bar{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}}=\frac{90-82}{\frac{20}{\sqrt{81}}}=3.6[/math]
So sánh [math]z > z_{\alpha/2}[/math]. Do đó, nằm trong vùng loại bỏ giả thuyết [math]H_0[/math].
Từ đây có thể đưa ra kết luận: trung tâm này hoàn toàn có đủ bằng chứng thống kê để nói rằng điểm trung bình của học sinh sau khi học xong ở trung tâm họ là lớn hơn 82 điểm.
Giả sử ta muốn biết tỉ lệ ủng hộ một luật mới của một quốc giá nào đó có bằng 60% hay không. Ta thực hiện một cuộc khảo sát trong 100 người ngẫu nhiên và thấy rằng có 64% người được khảo sát ủng hộ với luật này.
Với độ tin cậy 95% thì liệu có thể kết luận là 60% dân số ủng hộ đạo luật này không?
[math]z=\frac{p-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}=\frac{0.64-0.60}{\sqrt{\frac{0.60(1-0.60)}{100}}}=0.816[/math]
Với độ tin cậy 95% nên [math]\alpha = 0.05[/math]. Vì ta làm Z-test 2 đuôi nên ta sẽ sử dụng [math]\alpha/2 = 0.025[/math].
Do đó giá trị tới hạn là [math]1- \alpha/2 = 0.975[/math]. Tra bảng ta sẽ tìm được [math]z_{\alpha/2} = 1.96[/math].
Vùng chấp nhận giả thuyết [math]H_0[/math] sẽ là vùng (-1.96, 1.96). Do giá trị tính toán của chúng ta z = 0.816.
Ta chấp nhận giả thuyết [math]H_0[/math]. Phát biểu tỷ lệ dân số ủng hộ luật này là 60% là có cơ sở thống kê.
>>>> Từ hư không | Sự sống nhân tạo nay đã không còn là viễn tưởng
Các nhà nghiên cứu Đại học Tokyo công bố phương pháp tổng hợp kim cương…
Công cụ tìm DNA đã tạo ra một làn sóng đột phá. Giúp giải mã…
Các nhà khoa học đã tạo ra dạng bán dẫn siêu dẫn. Một bước đột…
Kiểm định nhị thức, hay binomial test, là một trong những phép kiểm định xác…
Những người duy trì thói quen đi bộ liên tục từ 10 đến 15 phút…
Trên toàn cầu và trong suốt lịch sử, phụ nữ thường sống thọ hơn đàn…
This website uses cookies.