Tổng quan về lý thuyết tiệm cận trong kinh tế lượng
An Overview of Asymptotic Theory
Trong kinh tế lượng ứng dụng, chúng ta hiếm khi làm việc với toàn bộ tổng thể mà thường chỉ có trong tay một mẫu dữ liệu. Các phương pháp thống kê chúng ta sử dụng, chẳng hạn như hồi quy OLS, đưa ra các kết quả dựa trên mẫu đó. Một câu hỏi quan trọng luôn được đặt ra là: Liệu kết quả từ mẫu này có đáng tin cậy khi chúng ta muốn suy rộng ra cho tổng thể hay không? Lý thuyết tiệm cận (Asymptotic Theory) cung cấp câu trả lời cho câu hỏi này bằng cách nghiên cứu các tính chất của các ước lượng và kiểm định thống kê khi kích thước mẫu (N) tiến ra vô cùng. Nói một cách đơn giản, lý thuyết này cho chúng ta biết điều gì sẽ xảy ra với các phân tích của mình “khi chúng ta có một mẫu đủ lớn”. Nó là nền tảng lý thuyết cho phép chúng ta tin tưởng vào các kết quả p-value, các khoảng tin cậy và các kiểm định giả thuyết trong thực tế. Nắm vững lý thuyết này sẽ giúp các bạn hiểu sâu sắc hơn về bản chất của suy luận thống kê và trở thành một nhà nghiên cứu kinh tế lượng bản lĩnh hơn.
Để làm chủ được lý thuyết tiệm cận, chúng ta cần tập trung vào ba khái niệm trụ cột. Thứ nhất là Hội tụ (Convergence), ý tưởng cốt lõi về việc một dãy các biến ngẫu nhiên (như một ước lượng) tiến đến một giá trị nhất định (giá trị thực của tổng thể) khi cỡ mẫu tăng lên. Thứ hai là Luật số lớn (Law of Large Numbers – LLN), một định lý cụ thể hóa khái niệm hội tụ, đảm bảo rằng trung bình mẫu sẽ hội tụ về trung bình của tổng thể. Đây chính là lý do tại sao các ước lượng của chúng ta trở nên “vững” (consistent). Cuối cùng là Định lý giới hạn trung tâm (Central Limit Theorem – CLT), một định lý kỳ diệu cho chúng ta biết rằng phân phối của một ước lượng (sau khi được chuẩn hóa) sẽ tiến về phân phối chuẩn khi cỡ mẫu đủ lớn, bất kể phân phối gốc của dữ liệu như thế nào. Đây là lý do chúng ta có thể thực hiện các kiểm định t, F và xây dựng các khoảng tin cậy một cách hợp lệ.
CẤU TRÚC CHUỖI BÀI HỌC
- Các khái niệm hội tụ cơ bảnNắm vững nền tảng về hội tụ theo xác suất, hầu chắc chắn và trung bình bình phương.
- Mối quan hệ và các định lý hội tụKhám phá định lý Slutsky và cách các loại hội tụ liên quan đến nhau trong thực tế.
- Luật số lớn (LLN)Hiểu rõ tại sao các ước lượng trở nên đáng tin cậy hơn khi cỡ mẫu tăng lên.
- Định lý giới hạn trung tâm (CLT)Lý giải nền tảng của các kiểm định thống kê và khoảng tin cậy trong kinh tế lượng.
- Thực hành ứng dụng với StataMinh họa các khái niệm LLN và CLT qua các ví dụ mô phỏng hồi quy OLS trực quan.
MỤC TIÊU HỌC TẬP
- Phân biệt và giải thích được các loại hội tụ khác nhau trong kinh tế lượng.
- Hiểu và trình bày được nội dung cốt lõi của Luật số lớn và Định lý giới hạn trung tâm.
- Vận dụng Stata để mô phỏng và kiểm chứng các tính chất tiệm cận của ước lượng OLS.
- Diễn giải chính xác hơn ý nghĩa của tính vững và phân phối tiệm cận trong các kết quả nghiên cứu.
TÀI LIỆU THAM KHẢO
- Wooldridge, J. M. (2019). Introductory Econometrics: A Modern Approach. Cengage learning.
- Hamilton, J. D. (1994). Time series analysis. Princeton university press.
- White, H. (2000). A reality check for data snooping. Econometrica, 68(5), 1097-1126.
PHỤ LỤC: DỮ LIỆU MÔ PHỎNG CHO SERIES
Để giúp các bạn dễ dàng theo dõi và thực hành trong suốt chuỗi bài học, chúng ta sẽ sử dụng một bộ dữ liệu mô phỏng đơn giản. Dưới đây là đoạn code Stata để tạo ra bộ dữ liệu này. Các bạn có thể chạy đoạn code này để có file dữ liệu cho riêng mình.
* ==================================================
* MỤC ĐÍCH: Tạo dữ liệu mô phỏng cho chuỗi bài học Lý thuyết Tiệm cận
* NỘI DUNG: Mối quan hệ giữa Lương, Học vấn và Kinh nghiệm
* CỠ MẪU: 1000 quan sát
* ==================================================
* Bước 1: Xóa bộ nhớ và thiết lập cỡ mẫu
clear
set obs 1000
* Bước 2: Tạo các biến độc lập
* educ: số năm đi học, phân phối đều từ 10 đến 22
gen educ = 10 + (22-10+1)*runiform()
label var educ "Số năm đi học"
* exper: số năm kinh nghiệm, phân phối đều từ 1 đến 30
gen exper = 1 + (30-1+1)*runiform()
label var exper "Số năm kinh nghiệm"
* Bước 3: Tạo sai số ngẫu nhiên (error term)
* Giả định sai số có phân phối chuẩn với trung bình 0 và độ lệch chuẩn 1.5
gen error_term = rnormal(0, 1.5)
label var error_term "Sai số ngẫu nhiên không quan sát được"
* Bước 4: Tạo biến phụ thuộc (wage) dựa trên mô hình tổng thể
* Giả định mô hình thực tế là: wage = 1.5 + 0.8*educ + 0.3*exper + error_term
gen wage = 1.5 + 0.8*educ + 0.3*exper + error_term
label var wage "Lương hàng giờ (đơn vị: USD)"
* Bước 5: Lưu bộ dữ liệu để sử dụng sau này
* Thay "D:\data" bằng đường dẫn thư mục của bạn
save "D:\data\asymptotic_simulation_data.dta", replace
Mô tả dữ liệu:
wage: Biến phụ thuộc, đại diện cho mức lương hàng giờ.educ: Biến độc lập, số năm đi học.exper: Biến độc lập, số năm kinh nghiệm làm việc.error_term: Thành phần sai số ngẫu nhiên, đại diện cho các yếu tố không quan sát được ảnh hưởng đến lương.
Bộ dữ liệu này sẽ là công cụ để chúng ta “thấy tận mắt” các định lý tiệm cận hoạt động như thế nào trong bài thực hành cuối cùng.
📚 Bài tiếp theo: Các khái niệm hội tụ cơ bản
💡 Lưu ý: Hãy đảm bảo đã nắm vững các khái niệm chính trong bài này trước khi tiếp tục.