Trong bài học trước, chúng ta đã học cách chẩn đoán và xác định các quan sát có ảnh hưởng, đóng vai trò như một “bác sĩ” kiểm tra sức khỏe cho mô hình của mình. Tuy nhiên, các vấn đề trong phân tích dữ liệu không chỉ đến từ các quan sát riêng lẻ (các hàng trong bộ dữ liệu), mà còn có thể xuất phát từ chính mối quan hệ giữa các biến giải thích (các cột trong bộ dữ liệu). Ngay cả với những chiếc máy tính hiện đại nhất, một số cấu trúc dữ liệu nhất định có thể khiến cho việc tính toán trở nên khó khăn, thậm chí là không thể. Bài học hôm nay sẽ đưa chúng ta vào “phòng máy” của kinh tế lượng. Chúng ta sẽ tìm hiểu về một trong những “căn bệnh” kinh niên và phổ biến nhất mà các nhà nghiên cứu thường gặp phải: đa cộng tuyến. Các bạn sẽ học cách nhận biết hai dạng của nó: đa cộng tuyến hoàn hảo, một lỗi rõ ràng …