Giới thiệu về hồi quy hai biến
An Introduction to Bivariate Regression
Chào mừng các bạn sinh viên đã đến với chuỗi bài học đầu tiên và quan trọng nhất trong hành trình chinh phục kinh tế lượng: phân tích mối quan hệ giữa hai biến. Trong kinh tế học và tài chính, chúng ta luôn muốn trả lời những câu hỏi như: liệu tăng thêm một năm đi học có giúp tăng lương không? Chi tiêu cho quảng cáo có thực sự làm tăng doanh thu? Hay lãi suất thay đổi ảnh hưởng thế nào đến thị trường chứng khoán? Tất cả những câu hỏi này đều xoay quanh việc tìm hiểu mối quan hệ giữa hai biến số.
Chuỗi bài học này sẽ trang bị cho các bạn công cụ nền tảng để lượng hóa và kiểm định những mối quan hệ đó một cách khoa học. Chúng ta sẽ bắt đầu từ những ý tưởng trực quan nhất như vẽ một đường thẳng đi qua một đám mây điểm dữ liệu, sau đó đi sâu vào phương pháp kinh điển đã định hình nên kinh tế lượng hiện đại. Đây không chỉ là việc học công thức, mà là học cách tư duy như một nhà kinh tế lượng: biến những ý tưởng lý thuyết thành các mô hình có thể kiểm chứng được bằng dữ liệu thực tế.
Ba khái niệm cốt lõi mà chúng ta sẽ làm chủ trong chuỗi bài này bao gồm: Hồi quy tuyến tính, công cụ để mô hình hóa mối quan hệ; Phương pháp Bình phương nhỏ nhất thông thường (OLS), kỹ thuật phổ biến nhất để ước lượng mô hình đó; và Hệ số tương quan, thước đo sức mạnh của mối quan hệ tuyến tính. Nắm vững những kiến thức này không chỉ giúp bạn vượt qua các kỳ thi, mà còn mở ra cánh cửa để thực hiện các dự án nghiên cứu độc lập và phân tích dữ liệu chuyên nghiệp trong tương lai. Hãy cùng nhau bắt đầu hành trình thú vị này!
CẤU TRÚC CHUỖI BÀI HỌC
- Nền tảng hồi quy hai biến và phương pháp OLSTìm hiểu cách khớp một đường thẳng vào dữ liệu và nguyên lý hoạt động của phương pháp bình phương nhỏ nhất.
- Hệ số tương quan và phân rã phương saiHọc cách đo lường sức mạnh mối quan hệ và đánh giá mức độ phù hợp của mô hình hồi quy.
- Các cách tiếp cận ước lượng trong hồi quyKhám phá các nền tảng lý thuyết sâu sắc đằng sau OLS như phương pháp mô-men và hợp lý tối đa.
- Tính chất của ước lượng OLS và bài toán dự báoHiểu tại sao OLS là một công cụ mạnh mẽ và cách sử dụng mô hình để đưa ra các dự báo kinh tế.
- Thực hành phân tích hồi quy hai biến với StataÁp dụng toàn bộ lý thuyết đã học vào một case study thực tế từ khâu xử lý dữ liệu đến diễn giải kết quả.
- Bài tổng hợp: Hệ thống hóa kiến thức và định hướngCung cấp một cái nhìn toàn cảnh, kết nối các khái niệm và gợi ý các hướng nghiên cứu nâng cao hơn.
MỤC TIÊU HỌC TẬP
- Nắm vững lý thuyết về mô hình hồi quy hai biến và các giả định của nó.
- Hiểu sâu sắc và diễn giải được ý nghĩa của các ước lượng từ phương pháp OLS.
- Vận dụng thành thạo phần mềm Stata để thực hiện phân tích hồi quy từ A-Z.
- Phân tích và báo cáo kết quả một cách chuyên nghiệp, có tính phê bình.
TÀI LIỆU THAM KHẢO
- Pesaran, M. H. (2015). Time Series and Panel Data Econometrics. Oxford University Press. (Tài liệu gốc của chuỗi bài)
- Wooldridge, J. M. (2019). Introductory Econometrics: A Modern Approach. Cengage Learning. (Sách giáo khoa kinh điển, rất khuyến khích)
- Hamilton, J. D. (1994). Time Series Analysis. Princeton University Press. (Tài liệu tham khảo nâng cao)
PHỤ LỤC: Dữ liệu mô phỏng cho series
Để giúp việc học trở nên trực quan, chúng ta sẽ sử dụng một bộ dữ liệu mô phỏng đơn giản trong suốt chuỗi bài này. Bộ dữ liệu này chứa thông tin về mức lương và số năm kinh nghiệm của 100 nhân viên. Các bạn có thể tự tạo lại bộ dữ liệu này bằng Stata để thực hành song song với các bài học.
* ==================================================
* MỤC ĐÍCH: Tạo dữ liệu mô phỏng cho chuỗi bài học
* CHỦ ĐỀ: Mối quan hệ giữa Lương và Kinh nghiệm
* SỐ QUAN SÁT: 100
* ==================================================
* Bước 1: Xóa dữ liệu cũ và thiết lập số quan sát
clear
set obs 100
* Bước 2: Tạo biến số năm kinh nghiệm (experience)
* Giả sử kinh nghiệm phân phối đều từ 0 đến 20 năm
set seed 123 // Đảm bảo kết quả có thể tái lập
gen experience = runiform() * 20
* Bước 3: Tạo thành phần sai số ngẫu nhiên (error)
* Giả sử sai số có phân phối chuẩn với trung bình 0, độ lệch chuẩn 2
gen error = rnormal(0, 2)
* Bước 4: Tạo biến lương (wage) dựa trên mô hình tuyến tính
* Giả sử lương khởi điểm là 5 (triệu VND) và mỗi năm kinh nghiệm giúp tăng lương 1.5 (triệu VND)
* wage = 5 + 1.5*experience + error
gen wage = 5 + 1.5*experience + error
* Bước 5: Gán nhãn cho các biến để dễ hiểu
label variable wage "Mức lương hàng tháng (triệu VND)"
label variable experience "Số năm kinh nghiệm làm việc"
* Bước 6: Lưu dữ liệu để sử dụng cho các bài sau
* Thay "D:\data" bằng đường dẫn thư mục của bạn
save "D:\data\wage_experience.dta", replace
* Bước 7: Xem qua dữ liệu vừa tạo
describe
summarize
Mô tả dữ liệu:
wage: Biến phụ thuộc, thể hiện mức lương hàng tháng của một nhân viên, đơn vị tính là triệu VND.experience: Biến độc lập (hay biến giải thích), thể hiện số năm kinh nghiệm làm việc của nhân viên đó.
Chúng ta sẽ sử dụng bộ dữ liệu này để ước lượng mối quan hệ giữa kinh nghiệm và lương, kiểm định các giả thuyết và thực hiện dự báo.
📚 Bài tiếp theo: Nền tảng hồi quy hai biến và phương pháp OLS
💡 Lưu ý: Hãy đảm bảo đã nắm vững các khái niệm chính trong bài này trước khi tiếp tục.