Phân tích thành phần chính (PCA) – Giảm chiều dữ liệu Principal Component Analysis (PCA) – Dimensionality Reduction Chào mừng các bạn quay trở lại với bài học thứ hai! Trong thực tế, các nhà nghiên cứu thường phải đối mặt với một vấn đề phổ biến: có quá nhiều biến trong bộ dữ liệu. Ví dụ, khi phân tích sự hài lòng của khách hàng, chúng ta có thể có hàng chục biến đo lường các khía cạnh khác nhau như chất lượng sản phẩm, giá cả, dịch vụ khách hàng, thái độ nhân viên, v.v. Nhiều biến trong số này thường có mối tương quan chặt chẽ với nhau, nghĩa là chúng cùng đo lường một khái niệm tiềm ẩn nào đó và mang thông tin trùng lặp. Việc đưa tất cả các biến này vào một mô hình hồi quy không chỉ làm mô hình trở nên cồng kềnh, khó diễn giải mà còn có thể gây ra hiện tượng đa cộng tuyến nghiêm trọng, làm sai lệch kết quả ước lượng. Vậy làm thế nào …