Cập nhật

Thống kê cho khoa học dữ liệu | Bài SI-1: Coefficient of variation – Hệ số biến thiên

Và vì là SI nên đây sẽ là những bài rất ngắn, cung cấp thông tin về một khái niệm thống kê cụ thể nào đó, giúp chúng ta hiểu sâu hơn về thống kê cho khoa học dữ liệu.

Khái niệm cơ bản trong thống kê cho khoa học dữ liệu

Hệ số biến thiên, tiếng anh là coefficient of variation, cho biết mức độ phân tán của tập dữ liệu xung quanh giá trị mean. Và có thể dùng để so sánh hai tập dữ liệu khác nhau về độ phân tán của các phần tử của những tập dữ liệu này.

Hệ số biến thiên (CV) được tính theo công thức:

[math]CV = \frac{\sigma}{\mu}[/math]

vì chúng ta chia cho mean của dữ liệu, nên giá trị này giúp chuẩn hóa trong việc so sánh các tập dữ liệu với nhau.

>>> Xem thêm: series về thống kê cho khoa học dữ liệu cơ bản

Ứng dụng của Coefficient of variation

Để biết được ứng dụng của hệ số biến thiên trong thống kê cho khoa học dữ liệu, hãy xét ví dụ sau:

Có hai nhà hàng bán cơ tấm sườn bì chả, nhà hàng A có độ ngon trung bình là 80% với độ lệch chuẩn là 10%. Nhà hàng B có độ ngon trung bình là 70% và độ lệch chuẩn là 20%.

cơm tấm sườn bì chả dùng làm ví dụ trong thống kê cho khoa học dữ liệu

Ở đây, khi nói đến độ ngon trung bình tức là cứ 100 thực khách đến nhà hàng A sẽ có 80 người khen nhà hàng A nấu ăn ngon. Tương tự vậy sẽ có 70 thực khách khen nhà hàng B nấu ăn ngon.

Như vậy chúng ta có thể dễ dàng tính hệ số biến thiên của 2 nhà hàng như sau:

Nhà hàng A:

[math]CV_A=\frac{10\%}{80\%}=12.5[/math]

Nhà hàng B:

[math]CV_B=\frac{20\%}{70\%}=28.57[/math]

Do đó, khi so sánh, ta thấy độ biến động về độ ngon của nhà hàng A ít hơn nhà hàng B. Nghĩa là nếu muốn lúc nào cũng ăn ngon thì đến nhà hàng A. Còn khi đến nhà hàng B, có lúc bạn sẽ được ăn ngon hơn, có lúc thức ăn lại tệ hơn (có thể là do tâm trạng của đầu bếp chăng 🤣🤣🤣)

Và đó chính là hệ số biến thiên trong thống kê cho khoa học dữ liệu.

Cảm ơn các bạn đã quan tâm!

>>> Xem thêm: Để trở thành bất kỳ ai bạn muốn dễ dàng

Ra là thế

Chia sẽ những gì góp nhặt được trong cuộc sống. Mỗi ngày trôi qua đều để lại gì đó, điều quan trọng là bạn có chú ý đến nó hay không. “Bạn có hai cách để sống cuộc sống của mình. Một là nghĩ rằng trên đời này chẳng có điều gì là phép màu. Hai là nghĩ rằng mọi thứ đến với bạn đều là phép màu.” – Albert Einstein.

Recent Posts

Tổng hợp kim cương | Bước tiến mới trong khoa học vật liệu

Các nhà nghiên cứu Đại học Tokyo công bố phương pháp tổng hợp kim cương…

4 weeks ago

Công cụ tìm DNA | Google của bộ gen mở ra kỷ nguyên mới

Công cụ tìm DNA đã tạo ra một làn sóng đột phá. Giúp giải mã…

4 weeks ago

Bán dẫn siêu dẫn | Bước đột phá mới trong công nghệ siêu dẫn

Các nhà khoa học đã tạo ra dạng bán dẫn siêu dẫn. Một bước đột…

4 weeks ago

Kiểm định nhị thức | Series thống kê cho KHDL bài 18

Kiểm định nhị thức, hay binomial test, là một trong những phép kiểm định xác…

2 months ago

Đi bộ mỗi ngày – Bí quyết sống thọ không tốn kém

Những người duy trì thói quen đi bộ liên tục từ 10 đến 15 phút…

2 months ago

Phụ nữ sống thọ | Tiết lộ khoa học vì sao phụ nữ thọ hơn nam giới

Trên toàn cầu và trong suốt lịch sử, phụ nữ thường sống thọ hơn đàn…

2 months ago

This website uses cookies.