Hồi quy thành phần chính (PCR) Principal components regression Tìm kiếm “tinh chất” của dữ liệu Các phương pháp Ridge và Lasso mà chúng ta đã học đều hoạt động bằng cách “co ngót” các hệ số của mô hình hồi quy. Chúng giữ lại tất cả các biến dự báo ban đầu nhưng điều chỉnh tầm quan trọng của chúng. Hồi quy thành phần chính (Principal Components Regression – PCR) lại có một triết lý hoàn toàn khác. Thay vì làm việc với hàng trăm biến dự báo gốc, PCR đặt ra câu hỏi: “Liệu chúng ta có thể tóm tắt toàn bộ thông tin từ hàng trăm biến này vào một vài ‘siêu biến’ tổng hợp không?” Hãy tưởng tượng bạn có một rổ đầy các loại trái cây khác nhau (các biến dự báo) và bạn muốn tạo ra một ly nước ép. Thay vì nếm từng loại quả một, bạn cho tất cả vào máy ép và tạo ra một ly nước ép tổng hợp (một “siêu biến”). Ly nước ép này giữ lại “tinh …