Chào mừng các bạn đến với bài học đầu tiên trong chuỗi bài về Học máy trong Kinh tế lượng! Trong bài giới thiệu, chúng ta đã thảo luận về một thách thức lớn trong phân tích dữ liệu hiện đại: hồi quy đa chiều, đặc biệt là khi số lượng biến hồi quy (p) lớn hơn số quan sát (n). Trong những trường hợp như vậy, phương pháp Bình phương tối thiểu (OLS) quen thuộc của chúng ta không còn hoạt động hiệu quả, thậm chí không thể tính toán được. Vậy chúng ta phải làm gì? Câu trả lời nằm ở một ý tưởng rất mạnh mẽ gọi là “thu hẹp” (shrinkage) hay “điều chuẩn hóa” (regularization). Thay vì để các hệ số hồi quy tự do, chúng ta sẽ “kéo” chúng về phía số không một cách có hệ thống. Việc này giúp giảm phương sai của các ước lượng, đánh đổi một chút độ chệch để có được một mô hình ổn định và có khả năng dự báo tốt hơn. Trong bài học này, chúng …