Mở rộng cho dữ liệu dọc: Mô hình Poisson hệ số chặn ngẫu nhiên Extending to longitudinal data: The random-intercept Poisson model Mô hình hóa sự phụ thuộc và không đồng nhất Trong bài học trước, chúng ta đã xác định được một vấn đề cốt lõi trong dữ liệu đếm: hiện tượng phân tán quá mức (overdispersion), nơi phương sai của dữ liệu lớn hơn giá trị trung bình của nó. Chúng ta đã biết rằng nguyên nhân sâu xa của hiện tượng này thường là do sự không đồng nhất không quan sát được giữa các đơn vị quan sát. Khi chúng ta làm việc với dữ liệu dọc (longitudinal data)—ví dụ, theo dõi số lượt khám bệnh của cùng một người qua nhiều thời điểm—vấn đề này trở nên còn rõ ràng hơn. Các quan sát từ cùng một người chắc chắn không độc lập với nhau; có những yếu tố cố hữu (sức khỏe nền, lối sống, yếu tố di truyền) làm cho một người có xu hướng đi khám bác sĩ nhiều hơn hoặc ít …