Ước lượng có điều kiện ràng buộc
Chào mừng các bạn sinh viên đến với chuỗi bài học mới về một kỹ thuật rất quan trọng trong kinh tế lượng: Ước lượng có ràng buộc (Restricted Estimation). Trong thực tế, các lý thuyết kinh tế thường cung cấp cho chúng ta những dự đoán cụ thể về mối quan hệ giữa các biến số. Ví dụ, lý thuyết về sản xuất có thể cho rằng tổng các hệ số co giãn của vốn và lao động bằng 1 (lợi suất không đổi theo quy mô). Thay vì bỏ qua thông tin quý giá này, chúng ta có thể tích hợp nó trực tiếp vào quá trình ước lượng để có được kết quả chính xác và hiệu quả hơn. Đó chính là mục tiêu của các phương pháp mà chúng ta sẽ tìm hiểu trong chuỗi bài học này.
Chúng ta sẽ bắt đầu với phương pháp trực quan nhất là Bình phương nhỏ nhất có ràng buộc (CLS), sau đó sẽ khám phá một phương pháp tổng quát và hiệu quả hơn là Ước lượng khoảng cách tối thiểu (EMD). Đừng lo lắng nếu những thuật ngữ này nghe có vẻ phức tạp! Chúng ta sẽ cùng nhau đi từng bước, từ lý thuyết cơ bản, công thức toán học được giải thích cặn kẽ, đến các ví dụ thực hành cụ thể bằng phần mềm Stata. Mục tiêu cuối cùng là giúp các bạn không chỉ hiểu “cái gì” mà còn hiểu “tại sao” và “làm thế nào” để áp dụng các kỹ thuật này một cách tự tin trong các dự án nghiên cứu của riêng mình.
Cấu trúc chuỗi bài học
- Bài 1: Nền tảng về ước lượng có ràng buộc và phương pháp CLSChúng ta sẽ tìm hiểu tại sao cần áp đặt ràng buộc và học cách xây dựng phương pháp ước lượng bình phương nhỏ nhất có ràng buộc (CLS) một cách trực quan.
- Bài 2: Các trường hợp đặc biệt và tính chất thống kê của CLSBài học sẽ tập trung vào ràng buộc loại trừ phổ biến và khám phá các tính chất thống kê quan trọng của ước lượng CLS trong các mẫu hữu hạn.
- Bài 3: Phương pháp ước lượng khoảng cách tối thiểu (Minimum Distance)Chúng ta sẽ học một phương pháp tổng quát và hiệu quả hơn CLS, đặc biệt hữu ích khi mô hình có phương sai của sai số thay đổi (heteroskedasticity).
- Bài 4: So sánh các ước lượng và ứng dụng với mô hình tăng trưởng SolowBài học này sẽ so sánh trực tiếp các ưu và nhược điểm của từng phương pháp và áp dụng chúng vào một nghiên cứu kinh tế học kinh điển.
- Bài 5: Các vấn đề nâng cao trong ước lượng có ràng buộcChúng ta sẽ khám phá điều gì xảy ra khi ràng buộc bị sai, cũng như cách xử lý các ràng buộc phi tuyến tính và ràng buộc dạng bất đẳng thức.
- Bài 6: Hướng dẫn thực hành tổng hợp với StataĐây là bài học thực hành toàn diện, hướng dẫn các bạn từng bước từ việc chuẩn bị dữ liệu, thực hiện các lệnh ước lượng có ràng buộc, đến diễn giải kết quả.
MỤC TIÊU HỌC TẬP
- Hiểu sâu lý thuyết: Nắm vững khái niệm, công thức và các tính chất thống kê của ước lượng CLS và EMD.
- Thực hành thành thạo: Sử dụng Stata để thực hiện hồi quy có ràng buộc tuyến tính một cách tự tin.
- Phân tích thực tế: Có khả năng áp dụng các kỹ thuật đã học để kiểm định các giả thuyết kinh tế từ lý thuyết.
- Tư duy phản biện: Nhận biết được khi nào nên sử dụng CLS, khi nào nên dùng EMD, và hiểu được hệ quả khi áp đặt một ràng buộc sai.
TÀI LIỆU THAM KHẢO
- Chính: Hansen, B. E. (2022). Econometrics. Princeton University Press. (Chương 8).
- Bổ sung: Wooldridge, J. M. (2019). Introductory Econometrics: A Modern Approach. Cengage Learning.
- Ứng dụng: Mankiw, N. G., Romer, D., & Weil, D. N. (1992). A Contribution to the Empirics of Economic Growth. The Quarterly Journal of Economics, 107(2), 407-437.
PHỤ LỤC: Dữ liệu thực hành cho chuỗi bài viết
Trong suốt chuỗi bài học này, chúng ta sẽ sử dụng bộ dữ liệu kinh điển từ nghiên cứu của Mankiw, Romer, và Weil (1992) về các yếu tố quyết định tăng trưởng kinh tế giữa các quốc gia. Việc sử dụng một bộ dữ liệu thực tế từ một bài báo nổi tiếng sẽ giúp các bạn thấy được cách các phương pháp kinh tế lượng được áp dụng trong nghiên cứu thực nghiệm.
Bộ dữ liệu này có tên là MRW1992.dta và chứa thông tin của 98 quốc gia. Chúng ta sẽ tập trung vào các biến số chính sau:
- lndY: Tốc độ tăng trưởng GDP thực trên đầu người giai đoạn 1960-1985 (biến phụ thuộc).
- lnY60: Log của GDP thực trên đầu người năm 1960.
- lnI: Log của tỷ lệ đầu tư trong GDP.
- lnG: Log của (tốc độ tăng dân số + 0.05).
- lnS: Log của tỷ lệ dân số trong độ tuổi đi học.
Các bạn có thể sử dụng đoạn code Stata dưới đây để tải và chuẩn bị dữ liệu cho các bài học sắp tới. Hãy chạy và làm quen với bộ dữ liệu này nhé!
* ==================================================
* CHUẨN BỊ DỮ LIỆU TỪ MANKIW, ROMER, AND WEIL (1992)
* Mục đích: Tải và tạo các biến cần thiết cho phân tích
* ==================================================
* Tải bộ dữ liệu (giả sử bạn đã có file MRW1992.dta trong thư mục làm việc)
use "MRW1992.dta", clear
* Tạo biến tốc độ tăng trưởng log GDP (biến phụ thuộc)
gen lndY = log(Y85) - log(Y60)
* Tạo các biến giải thích dạng log
gen lnY60 = log(Y60)
gen lnI = log(invest / 100)
gen lnG = log(pop_growth / 100 + 0.05)
gen lnS = log(school / 100)
* Xem mô tả các biến vừa tạo
describe lndY lnY60 lnI lnG lnS
* Xem thống kê mô tả
summarize lndY lnY60 lnI lnG lnS if N == 1 // N==1 để chọn mẫu 98 quốc gia
* Lưu bộ dữ liệu đã xử lý để dùng cho các bài sau
save "MRW1992_processed.dta", replace
📚 Bài tiếp theo: Nền tảng về ước lượng có ràng buộc và phương pháp CLS
💡 Lưu ý: Hãy đảm bảo đã nắm vững các khái niệm chính trong bài này trước khi tiếp tục.