Trong lĩnh vực thống kê, các đại lượng đo lường xu hướng trung tâm sẽ giúp mô tả vị trí tập trung của một tập dữ liệu. Trong đó, trung bình (mean), trung vị (median) và yếu vị (mode) chính là 3 đại lượng phổ biến và được sử dụng nhiều nhất. Trong bài viết này, Marketing Du Ký sẽ hướng dẫn các bạn cách phân biệt giữa trung bình (mean), trung vị (median) và yếu vị (mode).


    Phân Biệt Giữa Trung Bình (Mean), Trung Vị (Median), Yếu Vị (Mode)

    1. Trung bình (Mean)

    Trung bình (mean) là giá trị đại diện cho toàn bộ tập dữ liệu và được tính bằng cách lấy tổng tất cả các giá trị trong tập dữ liệu chia cho số lượng phần tử.

    Giá trị trung bình phản ánh giá trị tổng thể của dữ liệu, giúp so sánh các nhóm dữ liệu khác nhau cũng như đưa ra các dự đoán về xu hướng chung.

    Ví dụ: Nếu bạn có 5 số tự nhiên, bao gồm: 2, 4, 6, 8, 10 thì giá trị trung bình sẽ là: (2 + 4 + 6 + 8 + 10)/5 = 6

    2. Trung vị (Median)

    Trung vị (median) là giá trị nằm ở giữa tập dữ liệu khi các giá trị được sắp xếp theo thứ tự tăng dần hoặc giảm dần.

    Thông thường, trung vị sẽ giúp xác định giá trị trung tâm của dữ liệu mà không bị ảnh hưởng bởi các giá trị ngoại lai (outlier).

    Về cách xác định giá trị trung vị:

    Nếu số lượng phần tử là lẻ, trung vị là giá trị chính giữa.

    Nếu số lượng phần tử là chẵn, trung vị là trung bình của hai giá trị giữa.

    Ví dụ:

    Với tập dữ liệu 2, 4, 6, 8, 10 thì giá trị trung vị sẽ là 6 (giá trị giữa).

    Với tập dữ liệu 1, 3, 5, 7 thì giá trị trung vị sẽ là (3 + 5)/2 = 4 (trung bình của 2 giá trị giữa).

    3. Yếu vị (Mode)

    Yếu vị (mode) là giá trị xuất hiện nhiều lần nhất trong tập dữ liệu.

    Trên thực tế, yếu vị sẽ giúp xác định giá trị phổ biến nhất trong tập dữ liệu. Chỉ số nãy hữu ích trong việc phân tích xu hướng hành vi, sở thích của khách hàng hoặc phân bố tần suất của dữ liệu.

    Ví dụ: Tập dữ liệu 2, 2, 4, 6, 8 có yếu vị là 2 (vì 2 xuất hiện nhiều nhất).

    Lưu ý:

    Nếu không có giá trị nào lặp lại thì tập dữ liệu không có yếu vị.

    Nếu có nhiều giá trị cùng xuất hiện nhiều lần thì tập dữ liệu có nhiều yếu vị.

    4. Khác biệt giữa trung bình, trung vị và yếu vị

    Từ các khái niệm và đặc điểm riêng của 3 giá trị nêu trên, có thể thấy khác biệt lớn nhất giữa trung bình (average), trung vị (median) và yếu vị (mode) nằm ở:

    TRUNG BÌNH

    TRUNG VỊ

    YẾU VỊ

    Tổng giá trị chia cho số phần tử

    Giá trị giữa sau khi sắp xếp dữ liệu

    Giá trị xuất hiện nhiều nhất

    Dùng khi dữ liệu phân bố đều

    Dùng khi có giá trị ngoại lai

    Dùng khi cần tìm giá trị phổ biến nhất

    Ví dụ: Giả sử mức lương cơ bản của nhân viên công ty X theo thứ tự tăng dần lần lượt như sau (đơn vị: triệu VND): 10, 12, 14, 15, 17, 19, 20, 22, 50, 100. Hãy tính mức lương bình quân của nhân viên công ty X?

    Thông thường, để tính mức lương bình quân ta sẽ dùng giá trị trung bình (mean) để tính. Tuy nhiên, trong trường hợp này đã xuất hiện giá trị ngoại lai là 50 và 100 (2 giá trị cao hơn nhiều lần so với xu hướng chung). Do đó, ta cần dùng giá trị trung vị (median) để tính mức lương bình quân của nhân viên công ty X. Như vậy:

    Mức lương bình quân = (17 + 19)/2 = 18 (triệu VND)

    Trên thực tế, việc hiểu rõ sự khác biệt giữa trung bình, trung vị và yếu vị sẽ giúp bạn có thể lựa chọn phương pháp thống kê phù hợp trong phân tích dữ liệu. Marketing Du Ký hy vọng rằng bạn đã có thể biết cách phân biệt cả 3 chỉ số thống kê trên thông qua bài viết này.