Chào mừng các bạn đã quay trở lại với chuỗi bài học của chúng ta. Trong bài giới thiệu, chúng ta đã nói về tầm quan trọng của việc xử lý dữ liệu không hoàn hảo trong thực tế. Bài học hôm nay sẽ là bước đi đầu tiên và cũng là quan trọng nhất trên hành trình này. Chúng ta sẽ cùng nhau tìm hiểu một trong những vấn đề phổ biến nhất: dữ liệu bị kiểm duyệt (censored data). Chắc hẳn nhiều bạn sẽ tự hỏi, tại sao chúng ta không thể cứ dùng hồi quy OLS quen thuộc cho mọi loại dữ liệu? Tại sao lại cần những mô hình phức tạp như Tobit? Bài học này sẽ trả lời những câu hỏi đó bằng cách xây dựng một nền tảng trực quan và dễ hiểu nhất. Chúng ta sẽ bắt đầu bằng việc “nhìn” xem dữ liệu bị kiểm duyệt trông như thế nào, sau đó tìm hiểu cách nhà kinh tế học đoạt giải Nobel James Tobin đã đề xuất một mô hình thanh …