Top 11 # Xem Nhiều Nhất Phương Pháp Hồi Quy Ols Mới Nhất 5/2023 # Top Like | Cuocthitainang2010.com

Phương Pháp Hồi Quy Ols Bằng Excel

Hồi quy OLS Trong bài viết này tôi sẽ hướng dẫn cách tính OLS bằng excel. Đầu tiên chúng ta coi lại công thức.

Tiếp theo chúng ta sẽ tiến hành hồi quy thủ công. Đầu tiên là tính bình quân cột y và cột x. Cột C là x trừ đi bình quân x, Cột D là y trừ đi bình quân của y. Cột E là bình phương của cột C. Cột F là Cột C nhân cột D. Giá trị chúng ta cần tính là tổng của cột E và Cột F. Số liệu dùng để tính b1. Và sau đó dùng để tính bo. Ta tính b1 bằng cách chia tổng cột F cho cột E Trong bảng trên bạn nhìn thấy sẽ là F22/E22. Tính b0 bằng cách A22- B24*B22 Và vào cuối ngày thì tôi có phương trình Nếu tôi muốn dự đoán 1 giai đoạn trong tương lai, tôi chỉ cần thay x vào vào là xong. Và chúc mừng bạn là làm xong 1 cách dài dòng văn tự, giờ tôi sẽ chỉ cho bạn một cách làm ngắn gọn hơn. Tôi có bảng số liệu như cũ thôi. Và tôi sử dụng Hàm LINEST trong excel Cụ thể để tính ra giá trị b1= 4,14 tôi làm như sau trong Excel Giải thích một chút, chúng ta có 4 nhân tố cần dùng trong công thức trên. 1. Đó chính là tất cả giá trị của Y, từ ô A2 đến ô A21. 2. Tất cả giá trị của X, từ ô B2 đến ô B21 3. Tôi xác định xem là tôi có cần hệ số chặn hay không. Thường thì sẽ để là 1. 4. Mặc định là 1. Và hồi quy OLS ở đây sẽ dùng dữ liệu kiểu mảng, tôi sẽ giải thích sau để bạn có thể hiểu hơn, nhưng mặc định là vậy đi, để sử dụng dữ liệu kiểu mảng để đem lại kết quả chính xác cho hồi quy này, đầu tiên bạn chọn một khoảng 2 cột 5 dòng để ta có các số liệu cần thiết, ở ví dụ trên là tôi chọn từ ô D2 đến ô E6,sau đó bạn viết xong công thức trên bạn ấn tổ hợp phím CTRL+SHIFT+ENTER là xong. Từ cách làm trên tôi thu được các giá trị. Các giá trị này tương ứng với ô từ D2 đến E6. Tôi sẽ giải thích kĩ hơn về ý nghĩa. Tôi có n là số quan sát, ở đây n =20 Tôi có k là biến giải thích. Ở đây thì k =1 Tôi cần tính toán hệ số tự do. (n-k-1)= 20-1-1=18 ( hàng 2 cột 4) Tiếp, hàng 2, cột 1 là giá trị b0. Hàng 1 cột 1 giá trị b1. Bạn cần phải biết được là mô hình của bạn tốt không, nó giải thích được bao nhiêu? Nó có đủ tốt để phù hợp không. Và cách duy nhất bạn có thể làm là dùng tổng bình phương. Công thức chia ra làm 2 mảng, phần thứ nhất là Tổng bình phương biến hồi quy (SSR) , phần thứ 2 là Tổng bình phương phần dư (SSE) Để tính R^2 Thì lấy SSR/SSE. R^2 nằm trong khoảng 0,1. Và nó đã được tính toán ở cột 1 hàng 3, trong bảng này là =0.93 Cột 1 hàng 5 là giá trị SSR, cột 2 hàng 5 là SSE, bạn có thể tính được R^2 bằng cách chia. Nó có nghĩa là biến độc lập X giải thích được 93% biến phụ thuộc Y trong mô hình. Chúng ta có giá trị sai số chuẩn =6.94 (cột 2 hàng 3). Và đó chính là đánh giá về phương sai của lỗi quanh đường hồi quy. Nó được tính bằng tổng bình phương các phần dư chia cho hệ số tự do. Rồi căn nó là ra. Chúng ta cũng đồng thời tìm được cả sai số chuẩn cho hệ số chặn và hệ số góc. ( cột 1 hàng 2 và cột 2 hàng 2). Vậy các hệ số này có quan trọng không? Chúng giải thích điều gì? Chúng có thể bằng 0 không. Chúng ta có thể kiểm tra chúng như thế nào? Để kiểm định chúng ta dùng cặp giả thiết Ho B1=0 và H1 B1#0 Chúng ta sử dụng hàm two-tail T test trong excel =TDIST(t_statistic;df;number tails) Ở nhân tố 1 trong công thức, chúng ta cần tính toán t-statistic. Giá trị thứ 2 là hệ số tự do =18 (n-k-1) Giá trị thứ 3 là số cặp giả thuyết ( ở đây là 2) Ta có Pvalue 0,05 Chấp nhận Ho. Quay trở lại ví dụ để tính cho dễ hiểu. Ok đã xong các hồi quy bằng Excel cũng như là kiểm định lại cặp giả thuyết mô hình. Bye! See you again!

Excel, chuỗi cung ứng, Hồi quy OLS bằng Excel, OLS regression excel, supply chain Logistics và Supply chain management

Hồi Quy Ols Đa Biến Stata Kiểm Tra Sai Phạm

Để thuận tiện cho việc đọc kết quả, các bạn nên sử dụng chung bộ dữ liệu của chúng tôi, mở phần mềm stata ra và nhập lệnh sử dụng dữ liệu như sau:

use https://solieu.vip/data/reg01.dta

Bây giờ chúng ta đang sử dụng bộ dữ liệu chúng tôi với các biến như sau: income, educ, jobexp, race

Để hồi quy đa biến trên phần mềm stata chúng ta sử dụng lệnh reg hay regress

reg income educ jobexp race

Ta có, income là biến phụ thuộc các biến còn lại là biến độc lập. Ta nhận kết quả như sau:

Như thế là chúng ta đã có kết quả của việc hồi quy bình phương nhỏ nhất ( ols) cho đa biến này rồi. Quá đơn giản phải không các bạn.

Cách kiểm tra sai phạm

a, Mức độ phù hợp của mô hình

Chúng ta xem xét trong bảng kết quả hồi quy ở trên, xét chỉ tiêu R-Squared. Đây chính mức độ giải biến phụ thuộc được giải thích bởi các biến độc lập là 84,54%. Chỉ số R2 này tương đối tốt vì chỉ riêng có 3 biến độc lập là educ, jobexp, race mà đã giải thích đến 85%, còn lại 15% là do các biến khác.

Chú ý: Khi chạy mô hình hồi quy thì chỉ số R-Squared rất quan trọng, nên chúng tôi rút ra được một số kinh nghiệm như sau:

b, Kiểm tra hiện tượng đa cộng tuyến

Đa cộng tuyến là gì: Đa cộng tuyến là hiện tượng các biến độc lập có mối tương quan rất mạnh với nhau. Mô hình hồi quy xảy ra hiện tượng đa cộng tuyến sẽ khiến nhiều chỉ số bị sai lệch, dẫn đến kết quả của việc phân tích định lượng không còn mang lại nhiều ý nghĩa.

Để kiểm tra đa cộng tuyến trong stata, ta dùng lệnh: vif sau khi hồi quy

Định nghĩa VIF ( hệ số phóng đại phương sai): Trong thống kê , hệ số lạm phát phương sai ( VIF ) là tỷ lệ phương sai trong một mô hình có nhiều số hạng, chia cho phương sai của một mô hình chỉ có một thuật ngữ. [1] Nó định lượng mức độ nghiêm trọng của đa cộng tuyến trong phân tích hồi quy bình phương nhỏ nhất bình thường . Nó cung cấp một chỉ số đo lường mức độ chênh lệch (bình phương độ lệch chuẩn của ước tính) của một hệ số hồi quy ước tính được tăng lên do cộng tuyến.

c, Kiểm định giả thuyết thống kê (Hypothesis testing)

Chúng ta nghe cái tên thì thấy nó chung chung, kho hiểu dịch nôm na cho dễ hiểu đó là kiểm định các biến không đồng thời bằng không.

Kiểm định giả thuyết thống kê (statistical hypothesis test) là phương pháp ra quyết định sử dụng dữ liệu, hoặc từ thí nghiệm hoặc từ nghiên cứu quan sát (observational study)(không có kiểm soát). Trong thống kê (statistics), một kết quả được gọi là đủ độ tin cậy mang tính thống kê (statistically significant) nếu nó ít có khả năng diễn ra theo một ngưỡng xác suất cho trước (ví dụ 5% hay 10%). Cụm từ kiểm định độ tin cậy (“test of significance”) được đưa ra bởi Ronald Fisher.

Có 2 định nghĩa như trên các bạn muốn hiểu theo cách nào thì hiểu, còn phần kiểm định hypothesis test này thì đơn giản vô cùng với stata, ta dùng lệnh test

Cách đặt giả thuyết:

H0: các biến không đồng thời bằng không

H1: các biến đồng thời bằng không

Ta có kết quả là chấp nhận H0, bác bỏ H1, tức là hai biến educ và jobexp không đồng thời bằng 0.

chúng ta kiểm tra cho các cặp biến còn lại, tương tự như thế

d. Kiểm định phương sai phần dư thay đổi.

Đây là một kiểm định cực kỳ quan trọng nên bất cứ mô hình hồi quy nào cũng cần phải có. Để kiểm định phương sai phần dư thây đổi ta dùng lệnh hettest sau hồi quy.

Ta đặt giả thuyết như sau:

H0: có hiện tượng phương sai phần dư thay đổi

H1: Không có hiện tượng phươn sai phần dư thay đổi

Trong mô hình hồi quy ols đa biến chúng ta phải kiểm tra hết tất cả các khuyêt tật hay còn gọi là sai phạm trong mô hình hồi quy, nếu mô hình có khuyết tật thì chúng ta phải khăc phục nó, trước khi sử dụng mô hình.

Note: Thế nào cũng có các bạn hỏi, tại sao nói kiểm tra hết các khuyết tật mà không thấy kiểm tra hiện tượng tự tương quan mô hình, hay tự tương quạn phần dư … do bộ dữ liệu của chúng tôi không có dữ liệu thời gian nên chúng ta không thể kiểm tra tự tương quan. Nói cách khác, khi mô hình có chuỗi thời gian thì chúng ta mới có kiểm tra tự tương quan.

Hướng Dẫn Hồi Quy Gmm Toàn Tập

Hướng dẫn hồi quy GMM toàn tập, hồi quy GMM là một trong những mô hình hồi quy được các bạn nghiên cứu sinh rất thích, vì nó giải quyết vấn đề cốt lõi của kinh tế là nội sinh trong mô hình nghiên cứu. Nhưng thật ra để hiểu đúng và áp dụng đúng cũng là một vấn đề rất nan giải, mà chưa có tài liệu chính thống nào “diễn giải” hay đề cập đề vấn đề này.

Trong tip bài ” Hướng dẫn hồi quy GMM toàn tập “, có rất nhiều thuật ngữ mà cả chúng tôi cũng không định nghĩa được, nên chúng tôi sẽ diễn giải và dùng ví dụ để minh họa, rất mong các bạn thông cảm, cho vấn đề “yếu kém” của bên chúng tôi.

GMM: Phương pháp hồi quy tổng quát khoảng khắc

Trong kinh tế lượng và thống kê , phương pháp tổng quát của các khoảnh khắc (GMM ) là một phương pháp chung để ước tính các tham số trong các mô hình thống kê . Thông thường, nó được áp dụng trong ngữ cảnh của các mô hình bán tổng thể , trong đó tham số quan tâm là hữu hạn, trong khi hình dạng đầy đủ của hàm phân phối dữ liệu có thể không được biết và do đó ước tính khả năng tối đa không được áp dụng.

Phương pháp yêu cầu một số điều kiện nhất định được chỉ định cho mô hình. Các điều kiện thời điểm này là các hàm của các tham số mô hình và dữ liệu, sao cho kỳ vọng của chúng bằng 0 tại các giá trị thực của tham số. Phương pháp GMM sau đó tối thiểu hóa một định mức nhất định của trung bình mẫu của các điều kiện thời điểm.

Các công cụ ước tính GMM được biết là nhất quán , bình thường không có triệu chứng và hiệu quả trong lớp của tất cả các công cụ ước tính không sử dụng bất kỳ thông tin bổ sung nào ngoài các điều kiện có trong điều kiện thời điểm.

Trước khi bắt đầu xem xét các trường phái của gmm chúng ta sử dụng dữ liệu sau để các bạn có thể ứng dụng thực hành và sử dụng phần mềm STATA

use http:// solieu.vip/dulieu/Cong.13.8.dta

Chúng ta hồi quy ols và được kết quả như sau:

GMM Tĩnh: Stationarity GMM

Chúng tôi tìm hiểu thì cũng không có nhiều tài liệu định nghĩa về GMM tĩnh, nhưng mà chúng tôi diễn giải cho các bạn dễ hiểu, trong mô hình nghiên cứu chúng ta biến được biến nào là biến nội sinh biến bào là biến công cụ, như cái video trên các bạn qua sẽ hiểu.

Để chúng tôi tóm tắt lại, mô hình hồi quy GMM tĩnh là chúng ta biết cụ thể biến nào là biến nội sinh, biến nào là biến ngoại sinh, biến nào là biến công cụ; Để áp dụng vào mô hình định lượng.

Bây giờ chúng ta hồi quy với LnGDP là biến nội sinh và LnPOP + LnLAND là biến công cụ, chúng ta được kết quả như trên.

Nhân tiện, chúng ta kiểm tra xem Biến công cụ đưa vào mô hình có phải là biến công cụ yếu không ?

GMM Động: Dynamic GMM

Đây là mô hình chúng ta sư dụng nhiều nhất, nhưng mốc chốt nằm ở biến công cụ giải thích biến nội sinh, nhưng biến nội sinh ở đây là “dynamic”, tức là biến nội sinh không xác định được, thì chúng ta áp dụng phương pháp này. Trong phương pháp GMM động này thì chia ra làm 2 trường phái là chúng tôi và S.GMM.

D.GMM: Different GMM

Đây là một phương pháp, nên chúng tôi vẫn chưa có thể định nghĩa được. Chúng tôi sẽ dùng ví dụ sau, cho các bạn nhận biến được mô hình định lượng chúng tôi này.

Sau khi hồi quy chúng tôi ta được kết quả như trên, vẫn dùng LnPOP và LnLAND làm biến công cụ.

S.GMM: System GMM

Trong kinh tế lượng , công cụ ước tính trái phiếu Arellano Nhận là một phương pháp tổng quát của công cụ ước tính khoảnh khắc được sử dụng để ước tính mô hình dữ liệu bảng động . Nó được đề xuất lần đầu tiên bởi Manuel Arellano và Stephen Bond vào năm 1991 để giải quyết vấn đề nội sinh, sự không đồng nhất và các vấn đề tương quan nối tiếp trong vấn đề dữ liệu bảng tĩnh. Công cụ ước tính GMM-SYS là một hệ thống chứa cả các mức và phương trình khác biệt đầu tiên. Nó cung cấp một sự thay thế cho công cụ ước tính GMM khác biệt đầu tiên.

Trong ước lượng khắc phục biến nội sinh (Không quan tâm đến GMM động hay tĩnh, hay chúng tôi hay chúng tôi thì thường chúng ta nghĩ là chạy s.GMM.

Các bạn có thể xem theo về GMM tĩnh tại kênh youtube của chúng tôi.

Thân ái,

Hướng Dẫn Hồi Quy 2 Giai Đoạn 2Sls Model

Hồi quy 2 giai đoạn là gì (2sls) ?

Phân tích hồi quy bình phương tối thiểu hai giai đoạn (2SLS) là một kỹ thuật thống kê được sử dụng trong phân tích các phương trình cấu trúc . Kỹ thuật này là sự mở rộng của phương pháp OLS. Nó được sử dụng khi các thuật ngữ lỗi của biến phụ thuộc có tương quan với các biến độc lập. Ngoài ra, nó rất hữu ích khi có các vòng phản hồi trong mô hình. Trong mô hình phương trình cấu trúc , chúng tôi sử dụng phương pháp khả năng tối đa để ước tính hệ số đường dẫn. Kỹ thuật này là một thay thế trong mô hình SEM để ước tính hệ số đường dẫn. Kỹ thuật này cũng có thể được áp dụng trong các nghiên cứu gần như thí nghiệm.

Biến độc lập là gì ?

Đây là biến trả lời (hoặc Y) sẽ được hồi quy trên các biến ngoại sinh và nội sinh (nhưng không phải là công cụ).

Biến ngoại sinh là gì ?

Exogenous Variables: Các biến độc lập (Xex) này được bao gồm trong cả mô hình hồi quy giai đoạn đầu và giai đoạn thứ hai. Chúng không tương quan với các giá trị lỗi ngẫu nhiên trong hồi quy giai đoạn thứ hai.

Biến nội sinh là gì ?

Endogenous Variables: Mỗi biến nội sinh (hoặc Ven) trở thành biến phụ thuộc n phương trình bậc nhất đầu tiên. Mỗi cái được hồi quy trên tất cả các biến exogenous và biếncông cụ. Các giá trị dự đoán từ các hồi quy này thay thế các giá trị ban đầu của các biến nội sinh trong mô hình hồi quy giai đoạn hai.

Biến công cụ là gì (IV) ?

Instrument Variable: Mỗi biến nội sinh trở thành biến phụ thuộc trong phương trình hồi quy giai đoạn đầu tiên. Mỗi biến được hồi quy trên tất cả các biến ngoại sinh và công cụ (Xiv). Các giá trị dự đoán từ các hồi quy này thay thế các giá trị ban đầu của các biến nội sinh trong mô hình hồi quy giai đoạn hai.

Sau khi đọc xong mấy cái định nghĩa trên về phân loại các biến sẽ làm chúng ta mông lung hơn. Vậy ứng dụng của mô hình hồi quy 2 giai đoạn này là gì ?

Biến nội sinh là những biến có tương quan với phần dư, nên trong tường hợp hồi quy chúng ta thường xuyên gặp những vấn đề này, dẫn đến những sai xót nghiêm trọng, như: bỏ biến, sai số trong biến, hoặc xác định đồng thời qua các biến giải thích khác. Trong những trường hợp này chúng ta áp dụng những mô hình hồi quy ols sẽ không chính xác, cần phải có mô hình khác ước lượng chính xác hơn; đó chính là hồi quy bình phương nhỏ nhất hai giai đoạn (2sls).

Ứng dụng hồi quy 2sls

Trước hết chúng ta sử dụng bộ như liệu sau:

use http://solieu.vip/data/hsng.dta

Ta có:

rent : biến phụ thuộc

pcturban: biến độc lập

hsngval: biến nội sinh

region, faninc: biến công cụ

Bây giờ ta hồi quy ols, ta được

Ta có hai biến region và faminc là 2 biến động giải thích cho biến hsngval. Vì vậy ta áp dụng vào mô hình 2sls. sử dụng câu lệnh sau trên stata:

ivregress 2sls rent pcturban ( hsngval=faminc region)

Kết quả bây giờ đã khác ols rồi, thậm chí ngay cả biến pcurban cũng không có ý nghĩa thống kê trong mô hình.

Bây giờ chúng ta cần phải kiểm định vài thứ cho mô hình

Kiểm đinh nội sinh trong mô hình

Kiểm định hạn chế mô hình

ivregress gmm rent pcturban ( hsngval=faminc region)

Như vậy, khi ta tăng 1 đơn vị hsngval thì làm cho rent tăng 0.001 đơn vị.