Giới thiệu về câu hỏi kinh tế và dữ liệu
Introduction to Economic Questions and Data
Tổng quan chuỗi bài học
Chào mừng các bạn sinh viên đến với chuỗi bài học nhập môn về Kinh tế lượng! Nếu bạn từng thắc mắc làm thế nào các nhà kinh tế có thể đưa ra những con số cụ thể như “giảm quy mô lớp học giúp tăng 5% điểm thi” hay “tăng thuế thuốc lá 10% sẽ giảm 4% lượng tiêu thụ”, thì chuỗi bài học này chính là câu trả lời. Kinh tế lượng không phải là một môn học khô khan với những lý thuyết trừu tượng, mà là một bộ công cụ mạnh mẽ, một nghệ thuật kết hợp giữa lý thuyết kinh tế và kỹ thuật thống kê để phân tích dữ liệu trong thế giới thực. Nó giúp chúng ta biến những câu hỏi định tính thành những câu trả lời định lượng có căn cứ, từ đó đưa ra các quyết định chính sách và kinh doanh hiệu quả hơn.
Trong chuỗi bài học nền tảng này, chúng ta sẽ cùng nhau khám phá bản chất của kinh tế lượng, bắt đầu từ những câu hỏi kinh tế rất thực tế mà xã hội đang đối mặt. Chúng ta sẽ tìm hiểu về khái niệm quan trọng nhất, đó là “tác động nhân quả”, và tại sao việc xác định nó lại là mục tiêu hàng đầu của các nhà phân tích. Cuối cùng, chúng ta sẽ làm quen với các “nguyên liệu” không thể thiếu của kinh tế lượng: các loại dữ liệu. Việc hiểu rõ từng loại dữ liệu sẽ là chìa khóa để lựa chọn đúng phương pháp phân tích sau này. Chuỗi bài học này sẽ trang bị cho bạn tư duy nền tảng vững chắc, là bước đệm hoàn hảo trước khi chúng ta đi sâu vào các mô hình hồi quy phức tạp hơn. Hãy cùng nhau bắt đầu hành trình khám phá đầy thú vị này nhé!
CẤU TRÚC CHUỖI BÀI HỌC
- Bốn câu hỏi kinh tế lớn và vai trò của dữ liệuKhám phá cách kinh tế lượng giúp trả lời các vấn đề thực tiễn về giáo dục, tài chính, y tế và dự báo kinh tế vĩ mô.
- Tác động nhân quả và thí nghiệm lý tưởngTìm hiểu khái niệm cốt lõi về nhân quả và cách các thí nghiệm ngẫu nhiên có đối chứng giúp xác định tác động chính xác của chính sách.
- Các loại dữ liệu trong kinh tế lượngPhân biệt và nhận dạng ba loại dữ liệu chính: dữ liệu chéo, chuỗi thời gian và dữ liệu bảng qua các ví dụ trực quan.
- Thực hành nhận dạng dữ liệu và câu hỏi nghiên cứuVận dụng kiến thức đã học để phân loại các bộ dữ liệu thực tế và xây dựng câu hỏi nghiên cứu kinh tế lượng phù hợp.
- Tổng hợp – Nền tảng kinh tế lượng hiện đạiHệ thống hóa toàn bộ kiến thức nền tảng, kết nối các khái niệm và chuẩn bị cho các mô hình hồi quy phức tạp hơn.
MỤC TIÊU HỌC TẬP
- Hiểu rõ kinh tế lượng là gì và vai trò của nó trong việc trả lời các câu hỏi định lượng.
- Nắm vững khái niệm về tác động nhân quả và phân biệt được mối quan hệ tương quan và nhân quả.
- Nhận dạng và phân biệt thành thạo ba loại dữ liệu chính: dữ liệu chéo, chuỗi thời gian và dữ liệu bảng.
- Phát triển tư duy phản biện về cách dữ liệu được sử dụng để đưa ra kết luận về các chính sách kinh tế – xã hội.
TÀI LIỆU THAM KHẢO
- Stock, J. H., & Watson, M. W. (2020). Introduction to Econometrics. Pearson. (Tài liệu gốc của chuỗi bài viết này).
- Wooldridge, J. M. (2019). Introductory Econometrics: A Modern Approach. Cengage Learning. (Một giáo trình kinh điển khác với nhiều ví dụ ứng dụng).
- Angrist, J. D., & Pischke, J. S. (2014). Mastering ‘Metrics: The Path from Cause to Effect. Princeton University Press. (Cuốn sách diễn giải các khái niệm kinh tế lượng một cách trực quan và dễ hiểu).
PHỤ LỤC: Dữ liệu mô phỏng cho series
Để giúp các bạn dễ dàng hình dung và thực hành các khái niệm, chúng ta sẽ sử dụng một bộ dữ liệu mô phỏng đơn giản trong suốt chuỗi bài học. Bộ dữ liệu này chứa thông tin về kết quả học tập của sinh viên ở các trường đại học khác nhau qua nhiều năm.
Bối cảnh dữ liệu: Chúng ta có dữ liệu của 10 trường đại học (uni_id) trong vòng 5 năm (từ 2018 đến 2022). Các biến bao gồm điểm trung bình (gpa), chi tiêu trung bình cho mỗi sinh viên (spending), và tỷ lệ sinh viên có việc làm sau 6 tháng tốt nghiệp (employment_rate).
* ==================================================
* MỤC ĐÍCH: Tạo dữ liệu mô phỏng cho chuỗi bài học
* DỮ LIỆU: Dữ liệu bảng (Panel Data) về kết quả các trường ĐH
* GHI CHÚ: Dữ liệu này hoàn toàn giả định cho mục đích học tập
* ==================================================
* Bước 1: Xóa dữ liệu cũ và thiết lập số quan sát
clear
set obs 50 // 10 trường * 5 năm = 50 quan sát
* Bước 2: Tạo biến định danh cho trường và năm
gen uni_id = mod(_n-1, 10) + 1 // Tạo ID cho 10 trường, lặp lại
gen year = 2018 + floor((_n-1)/10) // Tạo biến năm từ 2018-2022
* Bước 3: Sắp xếp dữ liệu theo dạng panel
sort uni_id year
by uni_id: egen uni_effect = rnormal(0, 0.2) // Tạo hiệu ứng cố định cho mỗi trường
* Bước 4: Tạo các biến chính với một chút ngẫu nhiên
gen spending = 15000 + (year-2018)*500 + rnormal(0, 1000) // Chi tiêu tăng theo thời gian
gen gpa = 3.0 + 0.00002*spending + uni_effect + rnormal(0, 0.1) // GPA phụ thuộc vào chi tiêu và đặc điểm trường
gen employment_rate = 75 + 5*(gpa - 3) + rnormal(0, 5) // Tỷ lệ việc làm phụ thuộc GPA
* Bước 5: Định dạng và dán nhãn cho các biến
format gpa %9.2f
format spending %9.0fc
format employment_rate %9.1f
label var uni_id "Mã định danh trường đại học"
label var year "Năm quan sát"
label var gpa "Điểm GPA trung bình của sinh viên"
label var spending "Chi tiêu trung bình cho mỗi sinh viên ($)"
label var employment_rate "Tỷ lệ có việc làm sau 6 tháng (%)"
* Bước 6: Lưu dữ liệu để sử dụng
compress
save "university_data.dta", replace
Giải thích dữ liệu:
uni_id: Mã số định danh cho mỗi trường (từ 1 đến 10).year: Năm thu thập dữ liệu (từ 2018 đến 2022).gpa: Điểm trung bình của sinh viên năm đó, thang 4.0.spending: Chi tiêu của trường cho mỗi sinh viên, tính bằng USD.employment_rate: Tỷ lệ sinh viên của trường tìm được việc làm trong vòng 6 tháng sau khi tốt nghiệp.
Bộ dữ liệu này sẽ giúp chúng ta minh họa cho cả ba loại dữ liệu:
– Nếu chỉ xét dữ liệu năm 2022 của cả 10 trường, chúng ta có dữ liệu chéo.
– Nếu chỉ xét dữ liệu của trường có uni_id = 1 qua 5 năm, chúng ta có dữ liệu chuỗi thời gian.
– Khi sử dụng toàn bộ dữ liệu, chúng ta có dữ liệu bảng.
📚 Bài tiếp theo: Bốn câu hỏi kinh tế lớn và vai trò của dữ liệu
💡 Lưu ý: Hãy đảm bảo đã nắm vững các khái niệm chính trong bài này trước khi tiếp tục.