Trong suốt các bài học vừa qua, chúng ta đã luôn làm việc dưới một giả định nền tảng: các quan sát trong mẫu là độc lập với nhau (giả định i.i.d.). Giả định này hợp lý khi chúng ta lấy mẫu ngẫu nhiên các cá nhân từ một tổng thể lớn. Tuy nhiên, trong nhiều bối cảnh thực tế, dữ liệu của chúng ta lại có một cấu trúc đặc biệt: các quan sát được nhóm lại thành các “cụm”, và các quan sát bên trong cùng một cụm có thể có mối liên hệ với nhau. Hãy tưởng tượng bạn đang nghiên cứu kết quả học tập của học sinh. Sẽ rất hợp lý khi cho rằng kết quả của các học sinh trong cùng một trường học có thể tương quan với nhau, vì họ cùng chịu ảnh hưởng từ chất lượng của trường, phương pháp giảng dạy của giáo viên, và môi trường học tập chung. Tương tự, thu nhập của các cá nhân trong cùng một gia đình, hay năng suất của các công ty …