Mô hình xử lý số 0: Hurdle và Zero-Inflated Hurdle and Zero-Inflated models for excess zeros Khi số 0 chiếm đa số Trong bài học trước, chúng ta đã tìm hiểu cách mô hình Negative Binomial (NB2) giải quyết vấn đề phân tán quá mức. Tuy nhiên, trong nhiều bộ dữ liệu thực tế, đặc biệt là trong các lĩnh vực như y tế, kinh tế học hành vi hay bảo hiểm, chúng ta còn đối mặt với một vấn đề hóc búa hơn: sự hiện diện của một lượng lớn các quan sát có giá trị bằng không. Hiện tượng này được gọi là (excess zeros). Ví dụ, khi nghiên cứu số lần đi cấp cứu trong một năm, phần lớn dân số sẽ có giá trị là 0. Tương tự, khi phân tích số điếu thuốc hút mỗi ngày, phần lớn người được khảo sát là người không hút thuốc. Việc cố gắng áp dụng mô hình Poisson hay NB2 cho loại dữ liệu này có thể dẫn đến việc mô hình không khớp tốt, vì chúng …

🔔 Khu vực THÀNH VIÊN
Bạn cần đăng ký một gói Thành viên để truy cập nội dung này.
Các gói hiện có:
Bạn đã có tài khoản → đăng nhập
Back to top button