One sample Z-test | Bài 12 trong series TKCKHDL

by Ra là thế

Khi nào thì dùng Z-test

Z-test hay kiểm định Z là phương pháp thống kê sử dụng để xác định sự khác biệt của hai giá trị trung bình của quần thể (two sample Z-test).

Hoặc sử dụng để so sánh một giá trị trung bình với một giá trị giả thuyết (One sample Z-test).

Điều cần lưu ý khi làm Z-test chính là:

Thiếu một trong 2 yếu tố trên thì không thể nào làm Z-test được.

One sample Z-test để làm gì?

Như đã nói ở trên, kiểm định Z một mẫu giúp ta so sánh một giá trị (thường là giá trị trung bình) của quần thể với giá trị giả thuyết.

Ngoài giá trị trung bình (mean) ra thì chúng ta còn có thể so sánh tỉ lệ với một giá trị cho trước.

Khi nói đến so sánh thì ta sẽ có các biểu thức như lớn hơn, nhỏ hơn, hay khác so với giá trị cho trước. Tùy vào từng loại so sánh ta muốn mà ta sẽ làm test 1 đuôi (one-tail test) hay 2 đuôi (two-tail test). Và do đó đặt giả thuyết thống kê cho phù hợp.

Để hiểu rõ hơn, hãy xem cách tính bên dưới.

Cách tính toán

Đặt giả thuyết thống kê thích hợp

Tùy vào điều kiện ta muốn làm kiểm định mà đặt giả thuyết cho phù hợp như sau:

các loại giả thuyết thống kê thường gặp
các loại giả thuyết thống kê thường gặp

Kiểm định 2 đuôi (two-tail Z-test)

Cách đặt giả thuyết cho kiểm định có sự khác biệt hay không

  • [math]H_0[/math]: [math]\mu=\mu_0[/math] (giá trị trung bình của quần thể bằng với giá trị giả thuyết [math]\mu_0[/math])
  • [math]H_1[/math]: [math]\mu\neq\mu_0[/math] (giá trị trung bình của quần thể khác với giá trị giả thuyết [math]\mu_0[/math])

Kiểm định bên trái

Đặt giả thuyết cho việc kiểm định giá trị trung bình của quần thể có nhỏ hơn giá trị cho trước hay không.

  • [math]H_0[/math]: [math]\mu\geq\mu_0[/math] (giá trị trung bình của quần thể lớn hơn hoặc bằng với giá trị giả thuyết [math]\mu_0[/math])
  • [math]H_1[/math]: [math]\mu<\mu_0[/math] (giá trị trung bình của quần thể nhỏ hơn với giá trị giả thuyết [math]\mu_0[/math])

Kiểm định bên phải

Để kiểm định cho giá trị trung bình của quần thể lớn hơn giá trị cho trước, ta đặt giả thuyết như bên dưới.

  • [math]H_0[/math]: [math]\mu\leq\mu_0[/math] (giá trị trung bình của quần thể nhỏ hơn hoặc bằng với giá trị giả thuyết [math]\mu_0[/math])
  • [math]H_1[/math]: [math]\mu>\mu_0[/math] (giá trị trung bình của quần thể lớn hơn với giá trị giả thuyết [math]\mu_0[/math])

Công thức tính kiểm định Z một mẫu

Đối với việc kiểm định giá trị trung bình

Công thức tính toán có thể được biểu diễn đơn giản như bên dưới:

[math]z=\frac{\bar{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}}[/math]

Với:

  • [math]\bar{x}[/math] là trung bình của mẫu số liệu
  • [math]\mu_0[/math] là giá trị trung bình dự đoán của quần thể
  • [math]\sigma[/math] là độ lệch chuẩn của quần thể
  • [math]n[/math] là số phần tử của mẫu số liệu

Kiểm định một tỉ lệ cho trước

Để tính toán z-test cho tỉ lệ cho trước, ta tính theo công thức sau:

[math]z=\frac{p-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}[/math]

Với:

  • [math]p[/math] là tỉ lệ quan sát được của một mẫu số liệu
  • [math]p_0[/math] là tỉ lệ giả thuyết của quần thể
  • [math]n[/math] là kích thước của mẫu số liệu

Sau khi tìm được z thì làm gì?

So sánh với z giả thuyết và kết luận

Tùy thuộc vào khoảng tin cậy [math]\alpha[/math] mà ta đã chọn khi làm one sample Z-test, và tùy thuộc vào giả thuyết thống kê mà ta sẽ so sánh [math]z[/math] tính được so với [math]z_{\alpha/2}[/math].

[math]z_{\alpha/2}[/math] có thể tìm được bằng cách tra bảng z-score.

thông thường, với độ tin cậy CI = 95% ([math]\alpha=0.05[/math] thì [math]z_{\alpha/2} = \pm1.96[/math] đối với kiểm định 2 đuôi. Tức là từ (-1.96, 1.96) (nếu [math]z[/math] tính toán được trong khoảng này thì sẽ chấp nhận [math]H_0[/math].

[math]z_{\alpha} = 1.645[/math] đối với kiểm định bên phải. Tức là [math]z \in (-\infty, 1.645)[/math] thì sẽ chấp nhận [math]H_0[/math].

Ngược lại, đối với kiểm định bên trái, [math]z_{\alpha} = -1.645[/math]. Tức là [math]z \in (-1.645, \infty)[/math] thì sẽ chấp nhận [math]H_0[/math].

Tại sao 2 đuôi là [math]\alpha/2[/math] còn 1 đuôi là [math]\alpha[/math]?

Khi kiểm định 2 đuôi, ta sẽ kiểm định cả đuôi bên trái và bên phải của đồ thị, do đó [math]\alpha[/math] sẽ được tách ra và chia đều cho mỗi bên, chính là [math]\alpha/2[/math]. Ngược lại, khi kiểm tra giả thuyết 1 đuôi, thì ta chỉ lấy về 1 phái của đồ thì, do đó không cần phải tách [math]\alpha[/math] ra.

Tại sao lại là alpha chia 2 cho 2 đuôi
Tại sao lại là alpha chia 2 cho 2 đuôi

Ví dụ về one sample Z-test

Dong dài công thức nãy giờ rồi, hãy cùng nhau làm vài ví dụ thì bạn sẽ hiểu hơn.

Ví dụ 1 của kiểm định Z một mẫu – so sánh trung bình

Một trung tâm giáo dục tuyên bố rằng điểm trung bình của học sinh sau khi học ở trung tâm của họ lớn hơn 82 điểm (trên thang 100). Độ lệch chuẩn là 20 điểm.

Một mẫu 81 học sinh được khảo sát ngẫu nhiên cho thấy có điểm trung bình là 90 điểm. Với khoảng tin cậy 95% thì lời khẳng định của trung tâm có đủ bằng chứng để khẳng định không?

Bước 1: Nêu ra giả thuyết

  • Giả thuyết không [math]H_0[/math]: [math]\mu \leq 82[/math]
  • Giả thuyết thay thế [math]H_1[/math]: [math]\mu > 82[/math]

Vì tuyên bố của trung tâm là lớn hơn 82 điểm, nên ta sẽ phải làm kiểm định 1 đuôi (bên phải).

Bước 2: Xác định khoảng tới hạn (tìm [math]z_{\alpha/2}[/math])

Độ tin cậy 95% nên [math]\alpha = 0.05[/math]. Do đó giá trị tới hạn sẽ là [math]1- \alpha = 0.95[/math]

Tra bảng Z-score ta sẽ thấy [math]z_{\alpha/2}=1.645[/math]

Bước 3: Tính toán giá trị z-score

  • [math]\bar{x}=90[/math]
  • [math]\mu=82[/math]
  • [math]\sigma=20[/math]
  • [math]n=81[/math]

Áp dụng công thức ta sẽ tìm được:

[math]z=\frac{\bar{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}}=\frac{90-82}{\frac{20}{\sqrt{81}}}=3.6[/math]

Bước 4: Đưa ra kết luận

So sánh [math]z > z_{\alpha/2}[/math]. Do đó, nằm trong vùng loại bỏ giả thuyết [math]H_0[/math].

Ví dụ về one sample z-test
Ví dụ về one sample z-test

Từ đây có thể đưa ra kết luận: trung tâm này hoàn toàn có đủ bằng chứng thống kê để nói rằng điểm trung bình của học sinh sau khi học xong ở trung tâm họ là lớn hơn 82 điểm.

Ví dụ 2 của one sample Z-test – so sánh tỷ lệ

Giả sử ta muốn biết tỉ lệ ủng hộ một luật mới của một quốc giá nào đó có bằng 60% hay không. Ta thực hiện một cuộc khảo sát trong 100 người ngẫu nhiên và thấy rằng có 64% người được khảo sát ủng hộ với luật này.

Với độ tin cậy 95% thì liệu có thể kết luận là 60% dân số ủng hộ đạo luật này không?

Bước 1: Đặt giả thuyết

  • Giả thuyết không: [math]H_0: p = 0.60[/math] (tỉ lệ ủng hộ là 60%)
  • Giả thuyết thay thế: [math]H_1: p \neq 0.60[/math] (tỉ lệ ủng hộ khác 60%)

Bước 2: Tính toán giá trị z

[math]z=\frac{p-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}=\frac{0.64-0.60}{\sqrt{\frac{0.60(1-0.60)}{100}}}=0.816[/math]

Bước 3: Đua ra kết luận

Với độ tin cậy 95% nên [math]\alpha = 0.05[/math]. Vì ta làm Z-test 2 đuôi nên ta sẽ sử dụng [math]\alpha/2 = 0.025[/math].

Do đó giá trị tới hạn là [math]1- \alpha/2 = 0.975[/math]. Tra bảng ta sẽ tìm được [math]z_{\alpha/2} = 1.96[/math].

Vùng chấp nhận giả thuyết [math]H_0[/math] sẽ là vùng (-1.96, 1.96). Do giá trị tính toán của chúng ta z = 0.816.

Ta chấp nhận giả thuyết [math]H_0[/math]. Phát biểu tỷ lệ dân số ủng hộ luật này là 60% là có cơ sở thống kê.

You may also like

Leave a Comment

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
-
00:00
00:00
Update Required Flash plugin
-
00:00
00:00