1. Giới thiệu về kinh tế phát triển thực chứng

Estimated reading: 55 minutes 7 views

1.1 Mục tiêu của cuốn sách

Đây là một cuốn sách về các phương pháp định lượng, nhằm giúp bạn thực hiện các công việc thực nghiệm trong lĩnh vực kinh tế phát triển. Đây không phải là một cuốn sách về lý thuyết kinh tế lượng hay mô tả dữ liệu, mặc dù cả hai đều là những yếu tố quan trọng trong “bộ công cụ” mà bạn cần để có thể thực hiện công việc thực nghiệm. Chúng tôi quan tâm đến việc đo lường các mối quan hệ kinh tế bằng cách sử dụng các kỹ thuật ước lượng và phương pháp của lý thuyết suy luận thống kê cổ điển. Các mối quan hệ kinh tế mà chúng tôi phân tích xuất phát từ lý thuyết kinh tế. Mục tiêu của chúng tôi trong cuốn sách này là dựa trên các mô hình từ lý thuyết kinh tế để cho phép chúng tôi kiểm tra các giả thuyết quan trọng trong kinh tế phát triển. Các lý thuyết có thể được phát triển mà không cần quan tâm đến các vấn đề thống kê liên quan đến việc suy luận từ dữ liệu: kinh tế lượng tìm cách thu hẹp khoảng cách giữa lý thuyết kinh tế và việc biểu diễn dựa trên dữ liệu của các hệ thống hoặc mối quan hệ kinh tế mà chúng ta quan tâm.

Chúng tôi thường sử dụng các phương pháp kinh tế lượng cho ba mục đích liên quan: phân tích chính sách, kiểm tra lý thuyết và dự báo. Chúng tôi sẽ bắt đầu bằng cách đưa ra một số ví dụ về các câu hỏi và vấn đề có thể phát sinh từ mỗi mục đích sử dụng các phương pháp định lượng trong kinh tế học này.

Ví dụ về phân tích chính sách:

Chương trình đào tạo có hiệu quả không?
Đầu tư vào giáo dục/sức khỏe/mạng lưới xã hội làm tăng năng suất và/hoặc tiền lương bao nhiêu?
Việc tăng mức lương tối thiểu ảnh hưởng đến tỷ lệ thất nghiệp như thế nào?
Tỷ lệ lạm phát cao có tốn kém không?

Các vấn đề này đều là những mối quan tâm rõ ràng về chính sách. Có một liên kết trực tiếp từ công cụ chính sách đến kết quả mong muốn. Chúng tôi muốn biết cách thức để điều tra xem liệu một công cụ chính sách cụ thể có mang lại tác động mong muốn đối với kết quả hay không.

Ví dụ về kiểm tra lý thuyết:

Mô hình Harris–Todaro dự đoán rằng các ngành có mức lương cao ở các nước nghèo sẽ có tỷ lệ thất nghiệp cao để tạo ra sự cân bằng giữa các ngành.
Lý thuyết tăng trưởng nội sinh dự đoán rằng tốc độ tăng trưởng (tốc độ tăng trưởng – không phải mức thu nhập) sẽ là một hàm của mức độ đầu tư vào vốn nhân lực.
Rủi ro đặc biệt quan trọng trong các thị trường nông nghiệp, lĩnh vực chiếm ưu thế trong sinh kế của người nghèo ở các nước đang phát triển. Nếu các hộ gia đình không thể bảo hiểm đầy đủ, các kết quả thị trường sẽ kém hiệu quả và hạn chế khả năng đầu tư của người nghèo.

Ba ví dụ này có điểm chung là chúng đều là những dự đoán từ các mô hình được sử dụng rộng rãi trong kinh tế phát triển. Trong cuốn sách này, bạn sẽ gặp những mô hình này (và nhiều mô hình khác). Mục tiêu của phần này của cuốn sách là chỉ cho bạn cách các mô hình này được kiểm tra. Đối với mỗi dự đoán đó, bạn có thể hỏi: dữ liệu có ủng hộ lý thuyết không?

Nếu câu trả lời là có, đó là tin tốt cho lý thuyết. Nếu câu trả lời là không, điều đó không nhất thiết là tin xấu cho lý thuyết. Có thể có vấn đề với dữ liệu của bạn hoặc có thể có vấn đề với cách bạn sử dụng dữ liệu. Nếu không có vấn đề nào trong số đó, bạn cần nghĩ đến lý thuyết nào tốt hơn lý thuyết bạn đang sử dụng có thể giải thích dữ liệu.

Ví dụ về các câu hỏi dự báo:

Mức giá hàng hóa cho đồng sẽ là bao nhiêu trong 20 năm tới?
Nghèo đói sẽ tăng bao nhiêu ở một quốc gia chịu cú sốc lớn về điều kiện thương mại?
Dân số Ấn Độ sẽ có trình độ học vấn như thế nào vào cuối thập kỷ tới?

Yếu tố chính của dự báo là nó yêu cầu dữ liệu chuỗi thời gian. Theo định nghĩa, bạn đang hỏi về cách mà tương lai sẽ diễn ra. Bạn chỉ có thể đánh giá các dự báo bằng cách so sánh các kết quả thực tế với các dự đoán.

Một điểm chung trong tất cả các mục đích sử dụng phương pháp định lượng này là mô hình. Chúng ta không thể thực hiện phân tích chính sách, kiểm tra lý thuyết hoặc dự báo trừ khi chúng ta có một mô hình cho chúng ta biết cách các biến số mà chúng ta quan tâm liên quan đến các biến số mà chúng ta cho rằng là yếu tố quyết định của chúng.

Bạn có thể nghĩ đến kinh tế lượng như sự kết hợp của ba yếu tố: lý thuyết kinh tế, dữ liệu và lý thuyết thống kê. Ba yếu tố này được sử dụng để phát triển các mô hình “tốt” để giải thích cho phân tích chính sách, kiểm tra lý thuyết hoặc dự báo. Thế nào là một mô hình “tốt” là một câu hỏi phức tạp mà chúng tôi sẽ quay lại nhiều lần trong suốt cuốn sách.

Trong kinh tế học nói chung, và trong kinh tế phát triển nói riêng, các mô hình rất sẵn có trong khi dữ liệu lại khan hiếm hơn nhiều. Bạn sẽ thấy nhiều mô hình chưa được kiểm tra và một số mô hình được coi là rõ ràng đúng nhưng khi kiểm tra lại, chúng không nhất quán với dữ liệu. Một ví dụ mà chúng tôi sử dụng trong phần đầu của cuốn sách là mô hình Harris–Todaro về cách xác định cân bằng trên thị trường lao động ở các nước nghèo.

1.2 Mô hình và dữ liệu: Mô hình Harris–Todaro

Dự đoán chính của mô hình Harris–Todaro về thị trường lao động rất đơn giản. Mức lương ở khu vực đô thị vượt xa mức lương ở khu vực nông thôn. Tại sao mọi người không di chuyển? Thực ra, họ có di chuyển, và khi làm như vậy, họ tạo ra thất nghiệp đô thị, điều này đóng vai trò cân bằng thị trường bằng cách đảm bảo rằng mức lương kỳ vọng ở khu vực đô thị bằng với mức lương ở khu vực nông thôn.

Trình bày sau đây được lấy từ Fields (1975: 167–8). Gọi $ W_a $ và $ W_u $ lần lượt là mức lương nông nghiệp và mức lương đô thị, $ E_u $ là số lượng việc làm đô thị, và $ L_u $ là lực lượng lao động đô thị. Thu nhập kỳ vọng ở đô thị là

$$
E(W_u) = W_u \left( \dfrac{E_u}{L_u} \right). \tag{1.1} \label{1.1}
$$

Thu nhập kỳ vọng ở nông thôn $ E(W_a) $ đơn giản là $ W_a $. Lượng di cư từ nông thôn đến đô thị $ \dot{L}_u $ là một hàm của chênh lệch lương kỳ vọng giữa đô thị và nông thôn,

$$
\dot{L}_u = \psi \left( E(W_u) – E(W_a) \right), \tag{1.2} \label{1.2}
$$

điều kiện cân bằng nông thôn–đô thị là $ E(W_u) = E(W_a) $

$$
W_u \left( \dfrac{E_u}{L_u} \right) = W_a, \tag{1.3} \label{1.3}
$$

và tỷ lệ việc làm cân bằng là

$$
\left( \dfrac{E_u}{L_u} \right) = \dfrac{W_a}{W_u}. \tag{1.4} \label{1.4}
$$

Chúng ta thấy rằng mô hình này có một số dự đoán rất đơn giản và trực quan. Khi mức lương đô thị tăng tương đối so với mức lương nông thôn, tỷ lệ việc làm phải giảm – và do đó, tỷ lệ thất nghiệp phải tăng. Vì vậy, nếu mô hình này đúng, chúng ta kỳ vọng các khu vực có mức lương cao sẽ là các khu vực có tỷ lệ thất nghiệp cao, tức là chúng ta kỳ vọng một mối quan hệ tích cực giữa mức lương và thất nghiệp.

Bài báo của Fields (1975) chỉ ra rằng mô hình đơn giản này dự đoán tỷ lệ thất nghiệp cao hơn nhiều so với thực tế quan sát được ở các nước nghèo và tiếp tục phát triển một mô hình bao gồm khu vực phi chính thức đô thị, nơi mà người tìm việc có xác suất có việc làm cao hơn so với ở khu vực nông thôn. Mặc dù mở rộng của Fields làm giảm tỷ lệ thất nghiệp kỳ vọng sẽ liên quan đến bất kỳ mức chênh lệch lương nào, nó vẫn giữ được quan điểm chính của mô hình Harris–Todaro rằng chúng ta sẽ quan sát thấy các khu vực có mức lương cao liên quan đến tỷ lệ thất nghiệp cao.

Hình 1.1 Đường cong lương cho Nam Phi (1993)
Nguồn: Dữ liệu SALDRU

Trên thực tế, chúng ta có thể quan sát điều ngược lại (xem Hình 1.1). Có một lượng lớn tài liệu đã hồi quy mức lương trên tỷ lệ thất nghiệp địa phương và, gần như không có ngoại lệ, đã tìm thấy mối quan hệ này là âm. Mối quan hệ này được gọi là “đường cong lương” và được Blanchflower và Oswald (1995) phát hiện và ghi nhận.

Đây là một trong những quy luật thực nghiệm nổi bật nhất trong kinh tế học lao động và nhìn bề ngoài, dường như mâu thuẫn hoàn toàn với mô hình Harris–Todaro. Một ví dụ như vậy là dữ liệu cho Nam Phi làm cơ sở cho Hình 1.1, trong đó biểu đồ mức lương cá nhân so với tỷ lệ thất nghiệp ở cấp cụm dân cư sử dụng dữ liệu cắt ngang từ Kingdon và Knight (2006). Nhiều nhà kinh tế nghĩ rằng kết quả này phải sai. Tại sao?

Câu trả lời là sức mạnh của logic kinh tế. Mức lương và thất nghiệp không thể tương quan âm trong trạng thái cân bằng. Tại sao? Vậy tại sao sống ở một khu vực có mức lương thấp và xác suất có việc làm thấp hơn? Về dài hạn, phải có ý nghĩa kinh tế khi di chuyển đến khu vực có mức lương cao hơn và xác suất có việc làm cao hơn. Mặc dù bạn có thể quan sát một mối quan hệ âm ngắn hạn trong dữ liệu, nhưng không thể có mối quan hệ như vậy trong dài hạn.

Logic như vậy rất mạnh mẽ. Nó vừa gợi ý các khía cạnh của thị trường mà chúng ta cần xem xét nếu muốn đẩy phân tích xa hơn, vừa đặt ra các câu hỏi chúng ta cần hỏi. Thứ nhất, chúng ta đo lường mức lương thực như thế nào? Chi phí nhà ở và các chi phí khác có thể thay đổi giữa các khu vực có tỷ lệ thất nghiệp thấp và cao – do đó cách bạn đo lường “mức lương thực” trở thành một câu hỏi quan trọng. Thứ hai, nó gợi ý loại dữ liệu nào chúng ta có thể cần để kiểm tra một số giả thuyết. Chúng ta có thể cần quan sát sự thay đổi trong mức lương và thất nghiệp trong các khu vực hoặc quận huyện theo thời gian. Điều này chúng ta không thể làm với dữ liệu trong Hình 1.1, chỉ cho thấy một “ảnh chụp nhanh” tại một thời điểm duy nhất.

Có một điểm chung quan trọng cần ghi nhớ khi suy nghĩ về công việc thực nghiệm trong kinh tế phát triển. Bạn cần liên kết câu hỏi của mình với loại dữ liệu có thể trả lời câu hỏi bạn đã đặt ra. Yếu tố xây dựng chính trong quá trình phân tích chính sách, kiểm tra lý thuyết hoặc dự báo là mô hình. Các mô hình đơn giản là sự xác định các mối quan hệ giữa các biến số quan tâm.

Để sử dụng mô hình cho một phân tích thực nghiệm, chúng ta cần dữ liệu – và để kiểm tra mô hình, chúng ta cần liên kết mô hình với dữ liệu. Cách dữ liệu được liên kết với mô hình là nhiệm vụ của thống kê – một nhiệm vụ sẽ chiếm lĩnh chúng ta từ chương tiếp theo. Trong Mục 1.3, chúng tôi muốn cho bạn thấy những loại dữ liệu mà bạn sẽ gặp và đưa ra một ví dụ về cách các mô hình có thể được đưa vào dữ liệu.

1.3 Hàm sản xuất và dạng hàm

Một hàm sản xuất là một mối quan hệ kỹ thuật cho chúng ta biết cách các yếu tố đầu vào liên kết với đầu ra. Khi diễn giải bất kỳ hàm sản xuất nào, cần tập trung vào cách cả đầu ra và đầu vào được định nghĩa và đo lường. Liệu chỉ số đầu ra là tổng sản lượng hay chỉ số giá trị gia tăng? Chỉ số vốn được xác định như thế nào? Các chỉ số đầu vào có toàn diện không? Bạn cần hiểu rõ những tác động của việc sử dụng các cấu hình khác nhau của hàm sản xuất.

1.3.1 Hàm sản xuất Cobb–Douglas

Hãy viết một dạng của hàm sản xuất Cobb–Douglas với hai yếu tố sản xuất là vốn và lao động:

$$
V_{it} = K_{it}^\alpha \left( A_{it} L_{it} \right)^{(1-\alpha)} e^{u_{it}}, \tag{1.5} \label{1.5}
$$

trong đó $ V_{it} $ là một chỉ số giá trị gia tăng của đầu ra, $ K_{it} $ là một chỉ số vốn vật chất và $ L_{it} $ là lượng lao động được sử dụng trong sản xuất. $ A_{it} $ bao gồm các yếu tố gia tăng năng suất lao động, ví dụ như giáo dục hoặc đào tạo thêm. Sai số $ u_{it} $ thu thập tất cả các yếu tố không quan sát được có thể quyết định giá trị gia tăng, bao gồm các biến bị loại khỏi phương trình, một số trong đó có thể khó đo lường, ví dụ như chất lượng quản lý.

Lưu ý rằng chúng ta đã sử dụng các chỉ số dưới $(i, t)$ trong phương trình \eqref{1.5}. Các chỉ số này đề cập đến đơn vị $i$ tại thời điểm $t$. Đơn vị này có thể là một công ty, một ngành công nghiệp hoặc một quốc gia. Nó sẽ phụ thuộc vào câu hỏi của bạn và dữ liệu mà bạn có để giải quyết câu hỏi đó. Khi viết phương trình \eqref{1.5} với các chỉ số như vậy, chúng ta giả định rằng dữ liệu bảng (panel data) có sẵn. Một tập dữ liệu bảng là một tập dữ liệu trong đó chúng ta có thể quan sát cùng một đơn vị qua thời gian. Nếu chúng ta bỏ chỉ số $t$ để chỉ có thể chỉ số hóa các biến số theo $i$, chúng ta sẽ giả định rằng chúng ta có một tập dữ liệu chéo (cross-section dataset), tức là chúng ta quan sát nhiều công ty hoặc quốc gia nhưng chỉ tại một thời điểm duy nhất. Nếu chúng ta bỏ chỉ số $i$, chúng ta sẽ giả định rằng chúng ta có một tập dữ liệu chuỗi thời gian (time-series dataset), tức là chúng ta quan sát một công ty hoặc quốc gia qua một khoảng thời gian.

Các vấn đề kinh tế lượng phát sinh trong việc liên kết dữ liệu với các mô hình khác nhau tùy thuộc vào loại dữ liệu mà chúng ta có. Các loại dữ liệu chủ yếu có sẵn cho các nhà kinh tế lượng trong những ngày đầu của lĩnh vực này là chuỗi thời gian. Các khảo sát ngân sách có sẵn và đã được sử dụng nhưng dữ liệu này còn hạn chế.

Trong hai thập kỷ qua, một phần do cuộc cách mạng trong công nghệ máy tính, số lượng các tập dữ liệu chéo đã tăng lên nhanh chóng. Các dữ liệu chéo vi mô này hiện bao gồm dữ liệu về hộ gia đình, công ty và cá nhân (xấp xỉ theo thứ tự tần suất có sẵn). Ở cấp độ vĩ mô, kết quả của Dự án So sánh Quốc tế, đã dẫn đến các Bảng Penn (xem Mục 1.5.1), chiều kích bảng của dữ liệu vĩ mô cũng đã được mở rộng đáng kể.

Vì vậy, trong phần trình bày này, chúng ta giả định rằng một tập dữ liệu bảng có sẵn để điều tra các mô hình. Dạng Cobb–Douglas của hàm sản xuất trong phương trình \eqref{1.5} là tuyến tính trong các logarit (chúng ta luôn sử dụng logarit tự nhiên trong suốt cuốn sách này), vì vậy chúng ta có thể viết:

$$
\log V_{it} = \alpha \log K_{it} + (1 – \alpha) \log A_{it} + (1 – \alpha) \log L_{it} + u_{it}. \tag{1.6} \label{1.6}
$$

Định nghĩa $ k_{it} $ là vốn trên mỗi đơn vị lao động hiệu quả, $ k_{it} = \dfrac{K_{it}}{A_{it} L_{it}} $, và $ v_{it} $ là đầu ra trên mỗi đơn vị lao động hiệu quả, $ v_{it} = \dfrac{V_{it}}{A_{it} L_{it}} $, chúng ta có thể viết phương trình này thành:

$$
\log v_{it} = \alpha \log k_{it} + u_{it}. \tag{1.7} \label{1.7}
$$

Phương trình này dường như rất đơn giản. Nó nói rằng giá trị gia tăng trên mỗi đơn vị lao động hiệu quả chỉ phụ thuộc vào vốn trên mỗi đơn vị lao động hiệu quả. Bạn có thể hỏi, làm thế nào chúng ta có thể đưa một mô hình như vậy vào dữ liệu? Làm thế nào để đo lường lao động hiệu quả? Chắc chắn giá trị gia tăng phụ thuộc vào nhiều yếu tố hơn ngoài vốn vật chất? Ngay cả khi giá trị gia tăng có phụ thuộc vào vốn vật chất, việc sử dụng một mô hình như vậy đưa ra câu hỏi quan trọng về những gì lần lượt quyết định vốn vật chất.

Tất cả những câu hỏi này đều rất phù hợp mà chúng ta sẽ quay lại nhưng, với một chút nóng vội, chúng ta muốn biết giá trị gia tăng liên quan mật thiết đến vốn và lao động như thế nào. Vì vậy, chúng ta đưa ra những giả định đơn giản nhất có thể. Chúng ta xem xét một mẫu cắt ngang của các quốc gia vào năm 2000 (vì vậy chúng ta có thể bỏ chỉ số $t$ và chỉ có $i$). Chúng ta giả định rằng tất cả lao động đều được sử dụng hiệu quả như nhau.

Bảng 1.1: Hàm sản xuất Cobb–Douglas từ dữ liệu của Hall và Jones

Hình 1.2: Hàm sản xuất thế giới (2000)

Lưu ý: Các chữ viết tắt trong hình là mã quốc gia tiêu chuẩn của Ngân hàng Thế giới.

Nguồn: Bảng Dữ liệu Thế giới PENN với vốn đầu vào đã được nhập.

Vì giả định rằng tất cả lao động được sử dụng hiệu quả, chúng ta đặt $A_i = 1$ cho tất cả $i$. Vì $\log(1) = 0$, chúng ta có thể viết hàm sản xuất cơ bản của mình như sau:

$$
\log \left( \dfrac{V}{L} \right)_i = \alpha \log \left( \dfrac{K}{L} \right)_i + u_i . \tag{1.8} \label{1.8}
$$

Lưu ý rằng chúng ta viết như vậy để rõ ràng rằng (i) chúng ta chỉ cần các chỉ số của giá trị gia tăng, vốn vật chất và lao động để có thể đưa mô hình vào dữ liệu, và (ii) chúng ta sẽ ước lượng mô hình sử dụng dữ liệu cắt ngang. Dữ liệu như vậy có sẵn từ Bảng Dữ liệu Thế giới PENN và được sử dụng bởi Hall và Jones (1999), được trình bày trong Hình 1.2.

Đường dự đoán được hiển thị trong Hình 1.2 đã được ước lượng bằng phương pháp Bình phương nhỏ nhất (OLS). Đối với những người chưa quen với khái niệm này, hiện tại bạn có thể hiểu nó là cách ‘tốt nhất’ để vẽ một đường thẳng qua dữ liệu. Những người đã quen thuộc với khái niệm này sẽ biết rằng nó xuất phát từ việc tối thiểu hóa tổng bình phương của $u_i$.

Bạn có thể hỏi, tại sao lại là bình phương? Tại sao không là giá trị tuyệt đối của $u_i$ hoặc thậm chí tại sao không chỉ vẽ một đường thẳng qua hình? Tất cả những điều đó đều là các ‘phương pháp ước lượng’ có thể (nhưng hiếm khi được sử dụng). Chúng ta sẽ dành nhiều thời gian để giải thích tại sao bạn nên chọn một phương pháp hơn là phương pháp khác để vẽ một đường thẳng. Hiện tại, chúng ta chỉ cần biết rằng hình này xuất phát từ một hồi quy OLS được thể hiện trong Bảng 1.1.

Chúng ta cần tập trung vào ý nghĩa của đường này. Bạn có thể nghĩ rằng vốn trên đầu người dường như giải thích rất tốt sự khác biệt về thu nhập trên thế giới. Một số đặc điểm quan trọng của dữ liệu xuất hiện nhiều lần trong suốt cuốn sách này có thể được minh họa bằng hình này.

Đầu tiên, hình được biểu diễn dưới dạng logarit tự nhiên và bạn cần hiểu rõ cách chúng ta chuyển đổi giữa các logarit này và các mức độ của biến số. Một phương trình tuyến tính trong logarit không phải là tuyến tính trong mức độ (so sánh phương trình \eqref{1.6} với phương trình \eqref{1.5}. Hệ số trong một phương trình tuyến tính trong logarit có thể được diễn giải như một độ co giãn.

$$
\text{Elasticity} = \dfrac{\%\text{Change in } v}{\%\text{Change in } k} = \dfrac{dv}{v} = \dfrac{d \log(v)}{d \log(k)}
$$

Với kết quả của hồi quy, chúng ta biết rằng độ co giãn của giá trị gia tăng so với vốn là xấp xỉ 0,65. Thực tế, độ co giãn này có một ý nghĩa kinh tế. Nếu các yếu tố được trả theo sản phẩm biên của chúng và ký hiệu giá của lao động là $w$ và giá của vốn là $r$, chúng ta có:

$$
\dfrac{dV}{dL} = w = (1 − \alpha) K^\alpha L^{−\alpha} = (1 − \alpha) \left( \dfrac{K}{L} \right)^\alpha = (1 − \alpha) \left( \dfrac{V}{L} \right) \tag{1.9} \label{1.9}
$$

$$
\dfrac{dV}{dK} = r = \alpha K^{\alpha − 1} L^{1− \alpha} = \alpha \left( \dfrac{K}{L} \right)^{\alpha − 1} = \alpha \left( \dfrac{V}{K} \right). \tag{1.10} \label{1.10}
$$

Với một chút sắp xếp lại, chúng ta thấy rằng dạng Cobb–Douglas của hàm sản xuất ngụ ý:

$$
\dfrac{wL}{V} = (1 − \alpha) \tag{1.11} \label{1.11}
$$

và

$$
\dfrac{rK}{V} = \alpha.
$$

Chúng ta thấy rằng $\alpha$ là phần chia của vốn trong giá trị gia tăng. Phân tích của Hall và Jones (1999) về các yếu tố quyết định sự khác biệt trong thu nhập giữa các quốc gia đã sử dụng thực tế rằng phần chia của vốn trong giá trị gia tăng là 0,3 để suy ra giá trị của $\alpha$. Bây giờ chúng ta thấy rằng kết quả hồi quy OLS của chúng ta trực tiếp mâu thuẫn với giả định đó. Nó nói rằng phần chia của vốn trong giá trị gia tăng là 0,65. Có vẻ như có điều gì đó đã xảy ra một cách nghiêm trọng. Chúng ta sẽ quay lại điều đó trong các chương sau.

Ý nghĩa của đường hồi quy

Đường hồi quy cho thấy rằng có một mối quan hệ tuyến tính chặt chẽ giữa logarit tự nhiên của giá trị gia tăng trên đầu người và vốn trên đầu người. Như chúng ta đã lưu ý trước đó, một phương trình tuyến tính trong logarit không phải là tuyến tính trong mức độ. Điều này quan trọng khi chúng ta xem xét việc giải thích đường hồi quy trong Chương 2.

Hãy lưu ý sự khác biệt lớn về vốn trên đầu người giữa các quốc gia. Logarit tự nhiên của biến này dao động từ 6 đến 12 trong Hình 1.2, với $ \exp(6) \approx 400 $ và $ \exp(12) \approx 163.000 $. Cả hai số này đều được biểu thị bằng đô la quốc tế năm 1985 (cũng được gọi là đô la sức mua tương đương (PPP)). Vì vậy, vốn trên đầu người tăng hơn 400 lần giữa các quốc gia nghèo trên thế giới, chủ yếu tập trung ở châu Phi cận Sahara và Nam Á, và các quốc gia giàu ở châu Âu và Bắc Mỹ.

Liệu hồi quy này có thể cho chúng ta biết làm thế nào mà các quốc gia đã phát triển từ mức nghèo như Ethiopia và Tanzania để trở nên giàu có như Mỹ, Luxembourg và Thụy Sĩ? Rõ ràng, hình này không mô hình hóa quá trình đã diễn ra theo thời gian và dữ liệu cắt ngang không bao giờ có thể mô hình hóa các quá trình chuỗi thời gian. Tuy nhiên, nếu chúng ta sẵn sàng diễn giải hồi quy như là một mối quan hệ nhân quả, chúng ta có thể đưa ra một tuyên bố như vậy.

Thực tế, nếu chúng ta diễn giải hồi quy như là nhân quả, chúng ta có thể nói rằng để tăng thu nhập bình quân đầu người lên mức của một quốc gia có thu nhập cao, Ethiopia và Tanzania cần đầu tư để vốn trên đầu người tăng từ 400 đô la Mỹ (PPP) năm 1985 lên 160.000 đô la Mỹ trên đầu người. Nếu vốn trên đầu người tăng 20% mỗi năm trong 30 năm, điều này sẽ đủ để nâng mức vốn trên đầu người từ một quốc gia như Uganda lên một quốc gia như Thụy Sĩ.

Vậy chúng ta biết cách giải quyết vấn đề của các quốc gia nghèo! Họ chỉ cần đầu tư để vốn trên đầu người tăng 20% mỗi năm. Làm thế nào mà chúng ta biết điều đó? À, chúng ta đã cho phương trình hồi quy của mình một diễn giải nhân quả. Chúng ta có thể làm như vậy không? Chắc chắn là không – vì những lý do mà chúng ta sẽ bàn luận nhiều trong phần còn lại của cuốn sách. Tạm thời, chúng ta chỉ cần lưu ý rằng có bằng chứng mạnh mẽ cho thấy hệ số ước lượng trên vốn là bị lệch. Thực tế, chúng ta nghĩ rằng nó ít nhất là gấp đôi so với bằng chứng cho thấy nó nên là như vậy. Nhiệm vụ hiểu cách các quốc gia phát triển vẫn chưa kết thúc.

1.3.2 Hàm sản xuất với độ co giãn thay thế hằng số (CES)

Điều gì có thể giải thích sự khác biệt giữa mô hình và dữ liệu? Câu hỏi đó là trọng tâm của nhiều nỗ lực trong các chương tiếp theo của chúng ta, nhưng hữu ích khi bắt đầu bằng cách xem xét độ mạnh của các giả định mà chúng ta đã đưa ra. Giả định mạnh đầu tiên là dạng hàm số. Mô hình Cobb–Douglas ngụ ý rằng các phần chia của yếu tố sản xuất là hằng số cho tất cả các quốc gia trong mọi thời kỳ. Chúng ta có thể nới lỏng giả định đó không? Có thể – và cách đơn giản nhất để làm điều đó là chuyển từ dạng Cobb–Douglas sang giả định độ co giãn thay thế hằng số (CES), được biểu diễn như sau:

$$
V_{it} = \left[(A_K K_{it})^\sigma + (A_L L_{it})^\sigma\right]^{\frac{1}{\sigma}} e^{u_{it}} \tag{1.12} \label{1.12}
$$

$$
\text{Elasticity of substitution} = \rho = \frac{1}{1 – \sigma} \tag{1.13} \label{1.13}
$$

$$
\frac{w}{r} = \left(\frac{A_L}{A_K}\right) \left(\frac{L}{K}\right)^{\frac{1}{\rho}} . \tag{1.14} \label{1.14}
$$

Mã lệnh dưới đây tạo ra chỉ số mà Hall và Jones áp đặt về ảnh hưởng của vốn nhân lực đến năng suất lao động.

Bảng 1.2: Mã lệnh Stata để tạo chỉ số về vốn nhân lực của Hall và Jones

gen e=0.134*hjschool if hjschool <= 4
replace e= 0.134*4+(hjschool-4)*0.101 if hjschool > 4 & hjschool <= 8
replace e=0.134*4+0.101*4+0.068*(hjschool-8) if hjschool > 8
gen hjh=(exp(e))*hjl
gen hjhl=(exp(e))

Chúng ta thấy rằng giờ đây chúng ta có thêm các bậc tự do. Dạng Cobb–Douglas giả định rằng độ co giãn thay thế là bằng 1. Điều gì sẽ xảy ra nếu không phải vậy: làm thế nào điều đó có thể ảnh hưởng đến việc chúng ta diễn giải sự khác biệt trong GDP trên toàn thế giới? Làm thế nào chúng ta có thể sử dụng sự linh hoạt bổ sung này? Chúng ta sẽ quay lại những câu hỏi này trong Chương 13, chương cuối cùng của Phần 1.

1.4 Mô hình với vốn nhân lực

Cho đến nay, chúng ta đã chỉ xem xét hai yếu tố, vốn và lao động. Phương trình này có thể được mở rộng để bao gồm vốn nhân lực, với một dạng thường được sử dụng rộng rãi như sau:

$$
V_{it} = K_{it}^{\alpha} \left(A_{it} H_{it}\right)^{1-\alpha} e^{u_{it}} \tag{1.15} \label{1.15}
$$

Để liên kết phương trình này với dữ liệu, chúng ta cần một cách đo lường vốn nhân lực. Một cách đặc trưng thường được sử dụng là:

$$
H_{it} = e^{\phi(E_{it})} L_{it}, \tag{1.16} \label{1.16}
$$

trong đó $ E_i $ là số năm học của người lao động trong lực lượng lao động.

Bạn có thể sử dụng phần mã Stata liên quan (được cung cấp trong Bảng 1.2) để tạo biến H/L, được gọi là hjhl trong chương trình Stata.

Phương trình \eqref{1.16} cho phép chúng ta liên kết thực nghiệm tiền lương trả cho lao động với các mức độ giáo dục khác nhau. Nếu chúng ta định nghĩa $ w_L $ là tiền lương của một lao động và $ w_H $ là giá của vốn nhân lực, thì chúng ta có:

$$
w_H H_{it} = w_H e^{\phi(E_{it})} L_{it} = w_L (it) L_{it} \tag{1.17} \label{1.17}
$$

và chúng ta có thể viết lại như sau:

$$
\log w_L (it) = \log w_H + \phi(E_{it}), \tag{1.18} \label{1.18}
$$

trong đó $ \log w_H $ là một hằng số và $ w_L (it) $ cho biết mức lương của một lao động với trình độ học vấn $ E_{it} $. Đây là một phương trình bán logarit và cấu trúc của nó là cơ sở để ước lượng các hàm thu nhập Mincerian.

Trong thực tế, hàm $ \phi $ thường được viết dưới dạng các biến phi tuyến như sau:

$$
\phi(E_{it}) = \delta_0 + \delta_1 E_{it} + \delta_2 E_{it}^2 + v_{it}, \tag{1.19} \label{1.19}
$$

vì vậy chúng ta có:

$$
\log w_L (it) = \delta_0 + \delta_1 E_{it} + \delta_2 E_{it}^2 + v_{it}. \tag{1.20} \label{1.20}
$$

Đây chính là hàm thu nhập Mincerian.

Lợi suất Mincerian từ giáo dục được định nghĩa là $ \phi'(E_{it}) $ và với đặc tả được chọn sẽ được tính bằng $ \delta_1 + 2 \cdot \delta_2 \cdot E_{it} $. Lưu ý rằng nếu hàm này là tuyến tính thì lợi suất Mincerian từ giáo dục là hằng số và không phụ thuộc vào trình độ học vấn.

Với phương pháp ánh xạ giáo dục (mà chúng ta có thể quan sát) vào vốn nhân lực (mà chúng ta không thể quan sát), chúng ta có thể suy ra một phương trình mà chúng ta có thể sử dụng để mô hình hóa sản xuất:

$$
\log V_{it} = \alpha \log K_{it} + (1-\alpha) \log A_{it} + (1-\alpha) \phi(E_{it}) + (1-\alpha) \log L_{it} + u_{it}, \tag{1.21} \label{1.21}
$$

chúng ta có thể sắp xếp lại phương trình này dưới dạng trên đầu người để có:

$$
\log \left(\frac{V_{it}}{L_{it}}\right) = \alpha \log \left(\frac{K_{it}}{L_{it}}\right) + (1-\alpha) \log A_{it} + (1-\alpha) \phi(E_{it}) + u_{it}. \tag{1.22} \label{1.22}
$$

Đây là hàm sản xuất mở rộng với vốn nhân lực.

Trong đặc tả này, hàm $ \phi(E) $ phản ánh hiệu quả của một đơn vị lao động với $ E $ năm học so với một đơn vị lao động không có học vấn ($ \phi(0) = 0 $). Lưu ý rằng nếu $ \phi(E) = 0 $ đối với mọi $ E $, đây là hàm sản xuất tiêu chuẩn với lao động không phân biệt.

$$
\log \left(\frac{V_{it}}{L_{it}}\right) = \alpha \log \left(\frac{K_{it}}{L_{it}}\right) + (1-\alpha) \log A_{it} + (1-\alpha) (\delta_0 + \delta_1 E_{it} + \delta_2 E_{it}^2) + u_{it}. \tag{1.23} \label{1.23}
$$

Cả hàm thu nhập Mincerian và hàm sản xuất mở rộng với vốn nhân lực đều có thể được hiểu là các ví dụ về mối quan hệ kỹ thuật. Hàm thu nhập Mincerian liên kết tiền lương với kỹ năng, trong khi hàm sản xuất về nguyên tắc chỉ là một mô tả của công nghệ cho thấy cách thức các đầu vào xác định đầu ra.

Làm thế nào chúng ta có thể liên kết đặc tả của hàm sản xuất với hàm thu nhập? Khi vi phân hàm sản xuất (phương trình \ref{1.22}) theo $ E_{it} $, chúng ta lưu ý rằng:

$$
\frac{\partial \left(\frac{V_{it}}{L_{it}}\right)}{\partial E_{it}} = (1-\alpha) \frac{\partial \phi}{\partial E_{it}} = (1-\alpha) \phi'(E_{it}) = (1-\alpha) \frac{\partial w_{it} / \partial E_{it}}{w_{it}}. \tag{1.24} \label{1.24}
$$

Biểu thức này làm rõ rằng trong mô hình mà chúng ta đã sử dụng cho đến nay, lý do duy nhất tại sao lao động được trả lương cao hơn cho nhiều giáo dục hơn là vì nó làm tăng năng suất lao động cho doanh nghiệp. Một mô hình như vậy có thể kiểm nghiệm được và chúng ta sẽ trình bày dữ liệu cho phép kiểm nghiệm trong các chương sau. Tuy nhiên, trước đó, chúng ta muốn biết câu trả lời cho câu hỏi ngầm trong Hình 1.2 và rõ ràng trong tiêu đề bài báo của Hall và Jones (1999) – tại sao một số quốc gia lại tạo ra nhiều sản lượng trên mỗi lao động hơn so với các quốc gia khác? Bạn đã có các yếu tố cần thiết để tái tạo câu trả lời của họ cho câu hỏi đó. Đây chính là trọng tâm của bài tập cho chương này.

1.5 Dữ liệu và mô hình

1.5.1 Dữ liệu GDP vĩ mô

Trong chương này, chúng ta đã giới thiệu dữ liệu từ Penn World Table (PWT). Nền tảng của các bảng này là công việc được thực hiện bởi Dự án So sánh Quốc tế (International Comparison Project – ICP), bắt đầu vào cuối những năm 1960. Deaton và Heston (2010) cung cấp một cái nhìn tổng quan về lịch sử của dự án này, giải thích các thay đổi đã được thực hiện trong vòng so sánh giá năm 2005, và thảo luận cả các vấn đề khái niệm lẫn thực tế phát sinh khi cố gắng làm cho các số liệu GDP có thể so sánh được giữa các quốc gia có cấu trúc tiêu dùng và giá cả tương đối rất khác nhau.

Mục tiêu của ICP là cho phép thực hiện so sánh giữa các quốc gia, vì đã được công nhận rộng rãi rằng sử dụng tỷ giá hối đoái thực tế để thực hiện các so sánh như vậy là gây hiểu nhầm. Một đồng đô la mua được các dịch vụ rất khác nhau ở các nước nghèo so với các nước giàu. Dự án này đã thiết lập một tập hợp giá cả bằng “Đô la Quốc tế” (International $) và lần đầu tiên công bố kết quả cho mười quốc gia vào năm 1970 và cho sáu trong số đó vào năm 1967 (xem Kravis et al. (1975) cho các kết quả ban đầu này).

Hall và Jones (1999) đã sử dụng phiên bản 5.6 của các Penn World Table, một sự phát triển của phiên bản 5 được trình bày trong Summers và Heston (1991). Hầu hết các công trình mà chúng tôi trích dẫn trong cuốn sách này, cũng như dữ liệu mà chúng tôi tự trình bày, đều sử dụng phiên bản 6.1 hoặc 6.3 của các bảng này. Phiên bản 6.1 bao phủ giai đoạn từ 1950 đến 2000 và Phiên bản 6.3 mở rộng dữ liệu này đến năm 2007. Các bảng này không bao gồm dữ liệu từ vòng ICP mới nhất cho năm 2005. Các phiên bản 7.0 và sau đó của Penn World Table đã tích hợp dữ liệu này, và điều chỉnh dữ liệu trong quá khứ để cung cấp một tập hợp số liệu nhất quán kể từ năm 1950.

Deaton và Heston (2010: 14) cung cấp phần giới thiệu sau đây về mục tiêu của các bảng này:

Để minh họa từ tập hợp cuối cùng của các tính toán toàn cầu, ‘gạo’ là một tiêu đề cơ bản trong tài khoản tiêu dùng. Một số mức tỷ giá đối với gạo từ vòng năm 2005 là 4.304 đồng Việt Nam cho mỗi đô la, 0,65 bảng Anh cho mỗi đô la, hoặc 44,6 shilling Kenya cho mỗi đô la. Nếu gạo là thành phần duy nhất của tiêu dùng (hoặc GDP), thì đây sẽ là các tỷ giá hối đoái PPP (sức mua tương đương) cho các quốc gia này so với Hoa Kỳ; thực tế, các mức PPP tiêu dùng (GDP) thực tế cho các quốc gia này là 5.920 (4.713) Việt Nam, 0,66 (0,65) Vương quốc Anh, và 32,7 (29,5) cho Kenya. Rõ ràng, việc biết giá của một hàng hóa, hoặc ít nhất một nhóm hàng hóa, đưa chúng ta đi được một quãng đường nào đó, đó là lý do tại sao Chỉ số Big Mac của The Economist lại hữu ích. Tất nhiên, giá tương đối khác nhau rất nhiều từ quốc gia này sang quốc gia khác, đó là lý do tại sao Chỉ số Big Mac là không đủ (hoặc an toàn), và ICP cố gắng làm tốt hơn bằng cách bao quát tất cả các khoản chi tiêu trong GDP.

Trong các phiên bản của Penn World Table trước 7.0, việc tạo ra một thước đo GDP bằng đô la quốc tế nghĩa là sử dụng một mức giá thế giới cho mỗi hàng hóa để mỗi thành phần GDP được định giá lại ở mức giá thế giới. Như Deaton và Heston (2010) giải thích, cần phải áp dụng các trọng số để tạo ra các chỉ số giá và chỉ số giá có thể rất nhạy cảm với các trọng số được sử dụng, mặc dù mức giá giống nhau được áp dụng cho tất cả các quốc gia.

Một điểm quan trọng được nhấn mạnh trong khảo sát của Deaton và Heston (2010) là dự án ICP chỉ quan tâm đến việc so sánh giữa các quốc gia và chuỗi thời gian xuất phát từ dữ liệu tài khoản quốc gia. Họ lập luận rằng bất kỳ việc sử dụng dữ liệu hàng năm từ các Penn World Table để đo lường thay đổi qua thời gian đều sẽ không đáng tin cậy.

1.5.2 Diễn giải dữ liệu

Khi diễn giải bất kỳ dữ liệu kinh tế nào, một mô hình là rất cần thiết. Ngay cả khi bạn không viết ra mô hình, việc bạn tìm cách diễn giải dữ liệu chắc chắn có nghĩa là bạn đang sử dụng một mô hình ngầm định nào đó, dự đoán mối quan hệ giữa các biến số. Trong chương này, chúng tôi đã cố gắng chỉ ra rằng ngay cả trong bối cảnh của một mô hình hai biến đơn giản, dường như có thể thiết lập được rằng có một mối quan hệ rõ ràng trong dữ liệu giữa tổng số vốn bình quân đầu người và năng suất lao động ở mức độ vĩ mô. Mô hình cơ bản dưới đây là một hàm sản xuất, có thể được coi như một khối xây dựng công nghệ cơ bản cho các mô hình khác—nó đơn giản chỉ ra rằng đầu vào và đầu ra có mối quan hệ với nhau.

Trong chương này, chúng tôi đã trình bày dưới dạng phác thảo những gì bạn sẽ được yêu cầu làm trong cuốn sách này. Bạn sẽ được yêu cầu suy nghĩ về cách mà câu hỏi phát triển mà bạn quan tâm có thể được hình thành sao cho nó có thể được kiểm định hoặc đánh giá. Khi kiểm định bất kỳ mô hình nào, bạn cần phải suy nghĩ về loại dữ liệu mà bạn có và liệu câu hỏi bạn đã đặt ra có thể được trả lời bằng loại dữ liệu đó hay không.

Trong chương tiếp theo, chúng tôi sẽ xem xét các phiên bản của mô hình hai biến về hàm thu nhập. Đầu tiên là một phiên bản hai biến bán-logarithm của phương trình $\log w_L (it) = \delta_0 + \delta_1 E_{it} + v_{it} $ \tag{1.2} \label{1.20} $.

Trong bài thuyết trình mà chúng tôi đã đưa ra cho đến nay, chúng tôi đã xem giáo dục là một biến liên tục. Việc giáo dục có thể được coi là biến liên tục hay không là một vấn đề quan trọng, cả về cách mô hình có thể được diễn giải và cách nó có thể được ước lượng. Chúng tôi sẽ so sánh phiên bản liên tục $E_{it}$ với một biến giáo dục nhị phân, đó là liệu cá nhân có hoàn thành một cấp độ giáo dục nhất định nào đó hay không, ví dụ như mười năm học. Chúng tôi sẽ so sánh cả hai đặc tả này với một dạng log kép:

$$\log w_L (it) = \delta_0 + \delta_1 \log E_{it} + v_{it}$$

Hai phương trình này trông khá giống nhau, nhưng như chúng ta sẽ thấy, chúng không giống nhau, và một dạng hàm sẽ bị loại bỏ rõ ràng bởi dữ liệu (ít nhất là khi sử dụng OLS).

Để kiểm định bất kỳ mô hình nào được thảo luận trong chương này, chúng ta cần các phương pháp suy luận thống kê cho phép chúng ta suy ra các khía cạnh của tổng thể từ thông tin về mẫu. Chúng ta sẽ chuyển sang nhiệm vụ đó trong các chương tiếp theo.

Tài liệu tham khảo

Blanchflower, D. và Oswald, A. (1995) The Wage Curve, MIT Press, Cambridge.
Deaton, A. và Heston, A. (2010) ‘Understanding PPPs and PPP-based national accounts’, American Economic Journal: Macroeconomics, 2(4): 1–35.
Fields, G. S. (1975) ‘Rural-urban migration, urban unemployment and underemployment, and job-search activity in LDCs’, Journal of Development Economics 2: 165–87.
Hall, R. E. và Jones, C. I. (1999) ‘Why do some countries produce so much more output per worker than others?’ Quarterly Journal of Economics, 114(1): 83–116.
Harris, J. R. và Todaro, M. P. (1970) ‘Migration, unemployment and development: A two-sector analysis’, American Economic Review, 60: 126–42.
Kingdon, G. và Knight, J. (2006) ‘How flexible are wages in response to local unemployment in South Africa?’ Industrial and Labor Relations Review, 59(3): 471–95.
Kravis, I. B., Kenessey, Z., Heston, A. và Summers, R. (1975) A System of International Comparisons of Gross Product and Purchasing Power, published for the World Bank by the Johns Hopkins Press, Baltimore and London.
Summers, R. và Heston, A. (1991) ‘The Penn World Table (Mark 5): An expanded set of international comparisons, 1950–1988’, Quarterly Journal of Economics, 106(2): 327–68.

Bài tập

Tổng năng suất nhân tố (Total Factor Productivity – TFP) khác nhau giữa các quốc gia có ý nghĩa gì?
Cơ sở cho lập luận của Hall và Jones rằng để giải thích sự khác biệt về thu nhập giữa các quốc gia, chúng ta cần hiểu sự khác biệt về TFP của họ là gì?
Thảo luận ngắn gọn về việc liệu sự phân tích của Hall và Jones có thể cho bạn biết nguyên nhân của sự khác biệt về thu nhập giữa các quốc gia không?
Mô hình của Harris và Todaro tập trung vào sự tồn tại của các khu vực khác nhau trong nền kinh tế trả mức lương khác nhau. Điều này có nghĩa là mô hình một khu vực mà Hall và Jones sử dụng phải bị sai không?
Câu trả lời của bạn cho hai câu hỏi cuối liên quan như thế nào đến việc hiểu nguyên nhân của đói nghèo?

Dữ liệu Stata hjones chứa dữ liệu nền tảng của bài báo Hall và Jones (1999) được sử dụng trong chương này. Bạn có thể sử dụng file Stata Hall and Jones_1.do để tái hiện kết quả đã báo cáo trong chương này. Bạn cũng có thể sử dụng và điều chỉnh chương trình này để trả lời các câu hỏi trên.

1. Giới thiệu về kinh tế phát triển thực chứng

1.1 Mục tiêu của cuốn sách

1.2 Mô hình và dữ liệu: Mô hình Harris–Todaro

1.3 Hàm sản xuất và dạng hàm

1.3.1 Hàm sản xuất Cobb–Douglas

Ý nghĩa của đường hồi quy

1.3.2 Hàm sản xuất với độ co giãn thay thế hằng số (CES)

1.4 Mô hình với vốn nhân lực

1.5 Dữ liệu và mô hình

1.5.1 Dữ liệu GDP vĩ mô

1.5.2 Diễn giải dữ liệu

Tài liệu tham khảo

Bài tập

1. Giới thiệu về kinh tế phát triển thực chứng

CONTENTS