Khi bắt đầu xử lý dữ liệu với SmartPLS, chắc hẳn không ít bạn đã từng nghe hoặc đọc được trong các tài liệu cũ về một chỉ số có tên là GoF (Goodness of Fit). Nó nghe có vẻ rất quan trọng, giống như một "chứng nhận" cho thấy mô hình của bạn tốt và phù hợp. Trong bài viết này, Marketing Du Ký sẽ cùng bạn tìm hiểu chỉ số GoF là gì? Liệu có nên dùng trong Smart PLS hay không.
1. Chỉ số GoF (Goodness of Fit) là gì?
Chỉ số GoF được đề xuất bởi Tenenhaus và các cộng sự vào năm 2005 với mục tiêu cung cấp một thước đo tổng thể duy nhất, đánh giá mức độ phù hợp chung của mô hình PLS-SEM. Về cơ bản, nó được tạo ra để hoạt động như một chỉ số tương tự các chỉ số độ phù hợp tổng thể (overall model fit) mà chúng ta thường thấy trong phương pháp CB-SEM (ví dụ: AMOS) như CMIN/df, GFI, TLI, CFI, RMSEA. Ý tưởng đằng sau nó là kết hợp cả chất lượng của mô hình đo lường và chất lượng của mô hình cấu trúc vào một con số duy nhất.
Công thức tính của GoF khá đơn giản, là căn bậc hai của tích giữa giá trị trung bình cộng của các chỉ số AVE (Average Variance Extracted) và giá trị trung bình cộng của các hệ số R² (R-squared).
Trong đó:
AVE trung bình: Đại diện cho chất lượng của mô hình đo lường.
R² trung bình: Đại diện cho sức mạnh dự báo của mô hình cấu trúc.
2. Vì sao KHÔNG nên dùng chỉ số GoF trong Smart PLS
Mặc dù ý tưởng ban đầu nghe có vẻ hữu ích, nhưng chỉ sau một thời gian ngắn, chỉ số GoF đã vấp phải sự chỉ trích dữ dội từ các học giả hàng đầu. Các nghiên cứu sau này, đặc biệt là công trình của Henseler và Sarstedt (2013), đã chỉ ra những yếu kém "chí mạng" của chỉ số này. Dưới đây là bức tranh tổng quan về những lý do tại sao cộng đồng khoa học hiện đại, bao gồm cả các nhà phát triển Smart PLS, khuyến cáo KHÔNG NÊN sử dụng chỉ số GoF.
2.1. GoF không có khả năng phát hiện mô hình sai
Đây là lý do quan trọng nhất! Các nhà nghiên cứu đã chứng minh rằng chỉ số GoF không thể phân biệt được một mô hình có ý nghĩa lý thuyết và một mô hình được thiết lập sai hoàn toàn. Nói cách khác, ngay cả khi bạn vẽ các mối quan hệ vô lý giữa các biến, mô hình của bạn vẫn có thể đạt được chỉ số GoF cao. Nó chỉ đo lường sự phù hợp chung một cách mù quáng mà không có khả năng cảnh báo rằng mô hình của bạn về cơ bản là sai. Điều này cực kỳ nguy hiểm vì nó có thể dẫn đến việc chấp nhận và công bố những kết quả sai lầm.
2.2. GoF không phù hợp với triết lý của PLS-SEM
Phương pháp PLS-SEM vốn được thiết kế với mục tiêu chính là dự báo và giải thích phương sai của các biến phụ thuộc, chứ không phải là để kiểm định một mô hình lý thuyết có "khớp" hoàn toàn với dữ liệu mẫu hay không như CB-SEM. Việc cố gắng áp dụng một chỉ số "độ phù hợp tổng thể" như GoF lên PLS-SEM là một sự khập khiễng, đi ngược lại với mục tiêu và bản chất của phương pháp này.
2.3. Không có ngưỡng giá trị tin cậy
Các ngưỡng giá trị cho GoF (ví dụ: GoF nhỏ > 0.1, GoF vừa > 0.25, GoF lớn > 0.36) được đề xuất ban đầu chỉ mang tính tham khảo và không được xây dựng dựa trên bất kỳ nền tảng thống kê vững chắc nào. Việc dựa vào các ngưỡng giá trị tùy ý này để kết luận về chất lượng mô hình là không có cơ sở khoa học và có thể dẫn đến những diễn giải sai lệch.
2.4. Bị "khai tử" bởi cộng đồng khoa học và các tạp chí uy tín
Hiện nay, hầu hết các chuyên gia hàng đầu về PLS-SEM đều đồng thuận rằng GoF là một chỉ số lỗi thời và không nên được báo cáo trong các nghiên cứu. Việc bạn vẫn trích dẫn và sử dụng GoF làm bằng chứng cho chất lượng mô hình có thể bị các nhà phản biện tại các tạp chí khoa học uy tín đánh giá là bạn chưa cập nhật kiến thức phương pháp luận, và đây có thể là một lý do khiến bài báo của bạn bị từ chối. Thậm chí, chính phần mềm Smart PLS đã loại bỏ chỉ số này khỏi kết quả báo cáo mặc định trong các phiên bản gần đây.
3. Đâu là thước đo thay thế cho GoF trong Smart PLS?
Khi đã từ bỏ GoF, chúng ta cần tuân thủ quy trình đánh giá mô hình hai bước chuẩn mực và đáng tin cậy của PLS-SEM. Thay vì tìm kiếm một con số tổng thể duy nhất, bạn hãy tập trung vào việc đánh giá chi tiết từng phần của mô hình.
3.1. Đánh giá chất lượng Mô hình đo lường
Đây là bước kiểm tra chất lượng của các biến tiềm ẩn và thang đo của bạn. Các chỉ số quan trọng của mô hình đo lường cần báo cáo bao gồm:
Độ giá trị phân biệt: Sử dụng tiêu chí Fornell-Larcker, Tỷ lệ phương sai không đồng nhất (HTMT), và hệ số tải chéo (cross-loadings).
3.2. Đánh giá chất lượng Mô hình cấu trúc
Sau khi mô hình đo lường đã đảm bảo chất lượng, bạn sẽ đánh giá các mối quan hệ giả thuyết giữa các biến. Các chỉ số cốt lõi để đánh giá mô hình cấu trúc bao gồm:
Kiểm tra hiện tượng đa cộng tuyến: Sử dụng hệ số VIF.
Đánh giá năng lực dự báo: Sử dụng chỉ số Q² (thông qua kỹ thuật Blindfolding).
Đánh giá sự phù hợp của mô hình (Model Fit): Có thể sử dụng chỉ số SRMR như một thước đo thay thế phù hợp hơn cho độ phù hợp tổng thể.
Kiểm định các giả thuyết: Sử dụng kết quả từ thuật toán Bootstrapping để xem xét các hệ số đường dẫn, p-values và khoảng tin cậy.
Tóm lại, câu trả lời cho việc "Có nên dùng chỉ số GoF trong Smart PLS không?" là KHÔNG. GoF là một chỉ số đã lỗi thời, chứa đựng nhiều yếu điểm và đã bị cộng đồng khoa học bác bỏ. Việc tiếp tục sử dụng nó không những không làm tăng giá trị cho nghiên cứu của bạn mà còn có thể khiến nó bị đánh giá thấp. Marketing Du Ký chúc bạn có những phân tích thật sắc bén và thành công.