giới thiệu về kiểm định chi bình phương_thumnail
Trong thống kê, Chi-squared test (kiểm định Chi-bình phương) là một trong những phương pháp phổ biến được áp dụng khi ta muốn xem xét sự khác biệt giữa dữ liệu quan sát và dữ liệu kỳ vọng.
Mục lục bài viết
Kiểm định Chi-bình phương đặc biệt hữu ích trong các nghiên cứu khoa học xã hội, y học, marketing và giáo dục, khi ta làm việc với dữ liệu phân loại (categorical data). Phương pháp này giúp chúng ta trả lời những câu hỏi như:
Chi-squared test có nhiều biến thể, nhưng phổ biến nhất có hai dạng:
Trường hợp này thường dùng để so sánh xem mô hình đưa ra có phù hợp với thực tế hay không.
Công thức tính thống kê kiểm định trong Chi-squared test như sau:
[math]\chi^2 = \sum \frac{(O_i – E_i)^2}{E_i}[/math]
Trong đó:
Điều kiện áp dụng:
Để thực hiện kiểm định Chi-bình phương, ta thường theo các bước sau:
[math]H_0[/math]: Không có sự khác biệt hoặc không có mối liên hệ giữa các biến.
[math]H_1[/math]: Có sự khác biệt hoặc có mối liên hệ giữa các biến.
[math]E_{ij} = \frac{(\text{Tổng hàng i}) \times (\text{Tổng cột j})}{\text{Tổng số quan sát}}[/math]
Áp dụng công thức [math]\chi^2 = \sum \frac{(O – E)^2}{E}[/math]
Xác định bậc tự do (df):
[math]df = (r – 1) \times (c – 1)[/math]
Trong đó: [math]r[/math] = số hàng, [math]c[/math] = số cột.
Dựa vào bảng phân phối [math]chi^2[/math] và mức ý nghĩa [math]\alpha[/math] (thường là 0.05).
Nếu [math]\chi^2_\text{tính toán} > \chi^2_{bảng}[/math] thì ta bác bỏ [math]H_0[/math].
Một nhà nghiên cứu muốn kiểm tra xem giới tính (Nam/Nữ) có liên quan đến sở thích uống cà phê hay trà không (với độ tin cậy 95%).
Dữ liệu khảo sát 100 người như sau:
| Giới tính | Thích uống cà phê | Thích uống trà | Tổng |
|---|---|---|---|
| Nam | 35 | 10 | 45 |
| Nữ | 20 | 35 | 55 |
| Tổng | 55 | 45 | 100 |
[math]H_0[/math]: Không có sự liên quan nào giữa giới tính và thức uống.
[math]H_1[/math]: Có mối liên hệ giữa giới tính và thức uống.
Nam thích uống cà phê:
[math]E = \frac{45 \times 55}{100} = 24.75[/math]
Nam thích uống trà:
[math]E = \frac{45 \times 45}{100} = 20.25[/math]
Nữ thích uống cà phê:
[math]E = \frac{55 \times 55}{100} = 30.25[/math]
Nữ thích uống trà:
[math]E = \frac{55 \times 45}{100} = 24.75[/math]
Ta được bảng kỳ vọng trong kiểm định chi-bình phương sau khi đã tính toán:
| Giới tính | Thích uống cà phê (E) | Thích uống trà (E) |
|---|---|---|
| Nam | 24.75 | 20.25 |
| Nữ | 30.25 | 24.75 |
Áp dụng công thức [math]\chi^2 = \sum \frac{(O – E)^2}{E}[/math]:
Nam thích uống cà phê:
[math]\frac{(35 – 24.75)^2}{24.75} = 4.24[/math]
Nam thích uống trà:
[math]\frac{(10 – 20.25)^2}{20.25} = 5.18[/math]
Nữ thích uống cà phê:
[math]\frac{(20-30.25)^2}{30.25} = 3.47[/math]
Nữ thích uống trà:
[math]\frac{(35-24.75)^2}{24.75} = 4.24[/math]
Từ đó ta tính được giá trị [math]\chi^2[/math] là:
[math]\chi^2 = 4.24+5.18+3.47+4.24 = 17.13[/math]
[math]df = (2 – 1) \times (2 – 1) = 1[/math]
Với [math]\alpha = 0.05[/math] ta tìm được giá trị [math]\chi^2_{bảng}= 3.841[/math].
Vì 17.13 > 3.841 nên ta bác bỏ giả thuyết [math]H_0[/math]
Kết luận: Giới tính và sở thích đồ uống có liên quan với nhau.
Chi-squared test là một công cụ mạnh mẽ để phân tích dữ liệu phân loại. Bằng cách so sánh dữ liệu quan sát với dữ liệu kỳ vọng, kiểm định Chi-bình phương giúp nhà nghiên cứu đưa ra kết luận khách quan về mối quan hệ giữa các biến.
Nếu bạn đang làm việc với dữ liệu phân loại, đừng quên sử dụng Chi-squared test để có được kết quả phân tích chính xác và khoa học.
Các nhà nghiên cứu Đại học Tokyo công bố phương pháp tổng hợp kim cương…
Công cụ tìm DNA đã tạo ra một làn sóng đột phá. Giúp giải mã…
Các nhà khoa học đã tạo ra dạng bán dẫn siêu dẫn. Một bước đột…
Kiểm định nhị thức, hay binomial test, là một trong những phép kiểm định xác…
Những người duy trì thói quen đi bộ liên tục từ 10 đến 15 phút…
Trên toàn cầu và trong suốt lịch sử, phụ nữ thường sống thọ hơn đàn…
This website uses cookies.