Chào mừng các bạn đã quay trở lại! Trong các bài học trước, chúng ta đã xây dựng một bộ công cụ mạnh mẽ để phân tích các mối quan hệ phi tuyến, kể cả khi có nhiều biến kiểm soát. Tuy nhiên, chúng ta vẫn luôn làm việc dưới một giả định ngầm quan trọng: các quan sát là độc lập với nhau. Trong nhiều bối cảnh kinh tế, giả định này không được thỏa mãn. Dữ liệu thường có cấu trúc cụm (clustered structure): các quan sát được nhóm lại thành các cụm, và các quan sát trong cùng một cụm có thể có tương quan với nhau. Ví dụ, điểm thi của các học sinh trong cùng một lớp có thể tương quan với nhau do cùng một giáo viên và môi trường học tập. Lợi nhuận của các công ty trong cùng một ngành có thể tương quan do cùng chịu tác động của các cú sốc ngành. Việc bỏ qua cấu trúc cụm này có thể dẫn đến việc chúng ta tính toán sai các …