Mô hình hồi quy tuyến tính: Tính chất và phương pháp ước lượng
Sau khi nắm vững những khái niệm nền tảng về kinh tế lượng trong chuỗi bài học trước, giờ là lúc chúng ta bước vào trung tâm của phân tích kinh tế lượng ứng dụng: Mô hình Hồi quy Tuyến tính. Đây không chỉ là một kỹ thuật, mà là công cụ lao động chính của hầu hết các nhà kinh tế lượng, cho phép chúng ta lượng hóa và kiểm định các mối quan hệ giữa các biến kinh tế. Mục tiêu cốt lõi của phân tích hồi quy là ước lượng các tham số chưa biết của mô hình, kiểm tra xem lý thuyết kinh tế có phù hợp với dữ liệu thực tế hay không, và cuối cùng là sử dụng mô hình để đưa ra các dự báo có giá trị.
Chuỗi bài học này sẽ đưa bạn đi sâu vào từng khía cạnh của mô hình hồi quy tuyến tính, từ dạng đơn giản nhất đến mô hình hồi quy bội phức tạp hơn. Một trong những sức mạnh lớn nhất của hồi quy bội, và cũng là điểm nhấn của series, là khả năng thực hiện phân tích ceteris paribus—xem xét tác động của một biến trong khi giữ các yếu tố khác không đổi—ngay cả khi dữ liệu của chúng ta không được thu thập trong điều kiện lý tưởng đó. Chúng ta sẽ khám phá chi tiết phương pháp Ước lượng Bình phương nhỏ nhất (OLS), tìm hiểu các giả định cổ điển làm nền tảng cho nó, và chứng minh tại sao OLS lại được coi là “tốt nhất” thông qua Định lý Gauss-Markov. Bằng cách kết hợp lý thuyết chặt chẽ, các chứng minh toán học và ví dụ minh họa, chuỗi bài học này sẽ trang bị cho bạn kiến thức toàn diện để tự tin xây dựng, ước lượng và diễn giải các mô hình hồi quy trong nghiên cứu của mình.
Kiến thức tiên quyết
- Kinh tế lượng cơ bản: Hiểu rõ các khái niệm PRF, SRF và vai trò của sai số ngẫu nhiên.
- Đại số tuyến tính: Quen thuộc với các phép toán ma trận (nhân, chuyển vị, nghịch đảo).
- Thống kê suy luận: Nắm vững các khái niệm về kỳ vọng, phương sai, hiệp phương sai và phân phối chuẩn.
- Giải tích: Có khả năng lấy đạo hàm riêng và giải các bài toán tối ưu hóa.
Mục tiêu học tập
- Phân biệt và xây dựng được mô hình hồi quy đơn và hồi quy bội.
- Nắm vững và diễn giải được các giả định của mô hình hồi quy tuyến tính cổ điển.
- Hiểu và tự mình suy ra được các công thức ước lượng OLS.
- Phát biểu và giải thích được ý nghĩa của Định lý Gauss-Markov về tính hiệu quả của OLS.
- Diễn giải chính xác các hệ số hồi quy riêng phần theo nguyên tắc ceteris paribus.
PHỤ LỤC: Dữ liệu thực hành cho chuỗi bài học
Để minh họa cho các khái niệm trong chuỗi bài này, chúng ta sẽ sử dụng bộ dữ liệu về chi tiêu và thu nhập của 2383 hộ gia đình tại Tây Bengal, Ấn Độ, giai đoạn 2011-2012. Dữ liệu được trích từ vòng 68 của Khảo sát Mẫu Quốc gia (NSSO) về tình hình việc làm và thất nghiệp.
Mô tả dữ liệu
- consumption: Chi tiêu tiêu dùng của hộ gia đình.
- income: Thu nhập từ lương của hộ gia đình.
Trong các ví dụ, chúng ta sẽ thường sử dụng logarit tự nhiên của hai biến này để phân tích độ co giãn.
Code Stata để trực quan hóa dữ liệu
Bạn có thể sử dụng các lệnh Stata sau để tái tạo biểu đồ phân tán và đường hồi quy như trong tài liệu gốc.
* ==================================================
* TRỰC QUAN HÓA MỐI QUAN HỆ THU NHẬP - CHI TIÊU
* Dữ liệu: West Bengal Household Survey (2011-12)
* Giả sử dữ liệu đã được load và có tên là wb_data.dta
* Các biến: log_cons (log chi tiêu), log_inc (log thu nhập)
* ==================================================
* Bước 1: Vẽ biểu đồ phân tán để xem mối quan hệ tổng quan
scatter log_cons log_inc
* Bước 2: Thêm đường hồi quy tuyến tính phù hợp nhất (best-fit line)
twoway (scatter log_cons log_inc) (lfit log_cons log_inc)
* Bước 3: Thêm khoảng tin cậy 95% cho đường hồi quy
twoway (scatter log_cons log_inc) (lfitci log_cons log_inc)
Tải về dữ liệu thực hành (wb_data.dta)
📚 Bài tiếp theo:Giới thiệu Hồi quy Tuyến tính và Mô hình Hồi quy Đơn
💡 Lưu ý: Chuỗi bài này có hàm lượng toán học cao. Hãy chuẩn bị sẵn sàng để theo dõi các chứng minh và suy luận logic một cách cẩn thận.