Vấn đề cốt lõi trong dữ liệu đếm: Chẩn đoán và xử lý phân tán quá mức The core issue in count data: Diagnosing and handling overdispersion Khi thực tế biến động hơn lý thuyết Trong bài học trước, chúng ta đã xây dựng mô hình hồi quy Poisson dựa trên một giả định nền tảng của phân phối Poisson: giá trị kỳ vọng (trung bình) của số đếm bằng với phương sai của nó ($E(y) = \text{Var}(y)$). Đây là một giả định rất chặt chẽ và thanh lịch về mặt lý thuyết. Tuy nhiên, trong hầu hết các bộ dữ liệu thực tế, giả định này thường bị vi phạm. Chúng ta thường xuyên gặp phải một hiện tượng gọi là phân tán quá mức (overdispersion), xảy ra khi phương sai của dữ liệu đếm lớn hơn đáng kể so với giá trị trung bình của nó ($\text{Var}(y) > E(y)$). Tại sao điều này lại xảy ra? Phân tán quá mức thường là một dấu hiệu cho thấy có sự không đồng nhất không quan sát được (unobserved heterogeneity) …

🔔 Khu vực THÀNH VIÊN
Bạn cần đăng ký một gói Thành viên để truy cập nội dung này.
Các gói hiện có:
Bạn đã có tài khoản → đăng nhập
Back to top button