Cập nhật

Thống kê cho khoa học dữ liệu | Bài SI-1: Coefficient of variation – Hệ số biến thiên

Và vì là SI nên đây sẽ là những bài rất ngắn, cung cấp thông tin về một khái niệm thống kê cụ thể nào đó, giúp chúng ta hiểu sâu hơn về thống kê cho khoa học dữ liệu.

Khái niệm cơ bản trong thống kê cho khoa học dữ liệu

Hệ số biến thiên, tiếng anh là coefficient of variation, cho biết mức độ phân tán của tập dữ liệu xung quanh giá trị mean. Và có thể dùng để so sánh hai tập dữ liệu khác nhau về độ phân tán của các phần tử của những tập dữ liệu này.

Hệ số biến thiên (CV) được tính theo công thức:

[math]CV = \frac{\sigma}{\mu}[/math]

vì chúng ta chia cho mean của dữ liệu, nên giá trị này giúp chuẩn hóa trong việc so sánh các tập dữ liệu với nhau.

>>> Xem thêm: series về thống kê cho khoa học dữ liệu cơ bản

Ứng dụng của Coefficient of variation

Để biết được ứng dụng của hệ số biến thiên trong thống kê cho khoa học dữ liệu, hãy xét ví dụ sau:

Có hai nhà hàng bán cơ tấm sườn bì chả, nhà hàng A có độ ngon trung bình là 80% với độ lệch chuẩn là 10%. Nhà hàng B có độ ngon trung bình là 70% và độ lệch chuẩn là 20%.

cơm tấm sườn bì chả dùng làm ví dụ trong thống kê cho khoa học dữ liệu

Ở đây, khi nói đến độ ngon trung bình tức là cứ 100 thực khách đến nhà hàng A sẽ có 80 người khen nhà hàng A nấu ăn ngon. Tương tự vậy sẽ có 70 thực khách khen nhà hàng B nấu ăn ngon.

Như vậy chúng ta có thể dễ dàng tính hệ số biến thiên của 2 nhà hàng như sau:

Nhà hàng A:

[math]CV_A=\frac{10\%}{80\%}=12.5[/math]

Nhà hàng B:

[math]CV_B=\frac{20\%}{70\%}=28.57[/math]

Do đó, khi so sánh, ta thấy độ biến động về độ ngon của nhà hàng A ít hơn nhà hàng B. Nghĩa là nếu muốn lúc nào cũng ăn ngon thì đến nhà hàng A. Còn khi đến nhà hàng B, có lúc bạn sẽ được ăn ngon hơn, có lúc thức ăn lại tệ hơn (có thể là do tâm trạng của đầu bếp chăng 🤣🤣🤣)

Và đó chính là hệ số biến thiên trong thống kê cho khoa học dữ liệu.

Cảm ơn các bạn đã quan tâm!

>>> Xem thêm: Để trở thành bất kỳ ai bạn muốn dễ dàng

Ra là thế

Chia sẽ những gì góp nhặt được trong cuộc sống. Mỗi ngày trôi qua đều để lại gì đó, điều quan trọng là bạn có chú ý đến nó hay không. “Bạn có hai cách để sống cuộc sống của mình. Một là nghĩ rằng trên đời này chẳng có điều gì là phép màu. Hai là nghĩ rằng mọi thứ đến với bạn đều là phép màu.” – Albert Einstein.

Recent Posts

Vật liệu MXene | công nghệ mở đường cho tổng hợp amoniac xanh

Trong nhóm 2D, vật liệu MXene nổi bật nhờ khả năng chuyển đổi các thành…

1 week ago

Tế bào gốc planaria: Bí mật tái sinh phi thường của giun dẹp

Nghiên cứu từ Stowers Institute phát hiện tế bào gốc planaria giúp tái sinh hiệu…

2 weeks ago

Giải thích binomial test | Bài SI.4 series thống kê cho KHDL

Trong ví dụ của bài kiểm định nhị thức có đoạn tính xác suất 2…

3 weeks ago

Bộ não cuồng nhiệt – khi cảm xúc vượt quá giới hạn

Nghiên cứu về bộ não cuồng nhiệt của fan bóng đá bằng fMRI cho thấy…

4 weeks ago

Tổng hợp kim cương | Bước tiến mới trong khoa học vật liệu

Các nhà nghiên cứu Đại học Tokyo công bố phương pháp tổng hợp kim cương…

4 months ago

Công cụ tìm DNA | Google của bộ gen mở ra kỷ nguyên mới

Công cụ tìm DNA đã tạo ra một làn sóng đột phá. Giúp giải mã…

4 months ago

This website uses cookies.