Trước khi đi sâu vào các kỹ thuật phức tạp như Phân tích Thành phần chính (PCA) hay Phân tích Nhân tố, việc xây dựng một nền tảng vững chắc về cách biểu diễn và mô tả dữ liệu đa biến là vô cùng quan trọng. Như đã đề cập trong bài giới thiệu, phân tích đa biến xử lý các bộ dữ liệu nơi nhiều biến được đo lường trên cùng một đối tượng quan sát, và các biến này thường có tương quan với nhau. Bài học này sẽ tập trung vào các khái niệm toán học và thống kê cốt lõi, đóng vai trò là bộ công cụ nền tảng cho toàn bộ chuỗi bài viết. Chúng ta sẽ bắt đầu bằng cách tìm hiểu cách biểu diễn dữ liệu đa biến một cách hiệu quả thông qua vector và ma trận. Tiếp theo, bài viết sẽ giới thiệu các đại lượng thống kê quan trọng như vector trung bình mẫu, ma trận hiệp phương sai và ma trận tương quan, những công cụ giúp tóm tắt …