Hồi quy OLS Trong bài viết này tôi sẽ hướng dẫn cách tính OLS bằng excel. Đầu tiên chúng ta coi lại công thức.
Tiếp theo chúng ta sẽ tiến hành hồi quy thủ công. Đầu tiên là tính bình quân cột y và cột x. Cột C là x trừ đi bình quân x, Cột D là y trừ đi bình quân của y. Cột E là bình phương của cột C. Cột F là Cột C nhân cột D. Giá trị chúng ta cần tính là tổng của cột E và Cột F. Số liệu dùng để tính b1. Và sau đó dùng để tính bo. Ta tính b1 bằng cách chia tổng cột F cho cột E Trong bảng trên bạn nhìn thấy sẽ là F22/E22. Tính b0 bằng cách A22- B24*B22 Và vào cuối ngày thì tôi có phương trình Nếu tôi muốn dự đoán 1 giai đoạn trong tương lai, tôi chỉ cần thay x vào vào là xong. Và chúc mừng bạn là làm xong 1 cách dài dòng văn tự, giờ tôi sẽ chỉ cho bạn một cách làm ngắn gọn hơn. Tôi có bảng số liệu như cũ thôi. Và tôi sử dụng Hàm LINEST trong excel Cụ thể để tính ra giá trị b1= 4,14 tôi làm như sau trong Excel Giải thích một chút, chúng ta có 4 nhân tố cần dùng trong công thức trên. 1. Đó chính là tất cả giá trị của Y, từ ô A2 đến ô A21. 2. Tất cả giá trị của X, từ ô B2 đến ô B21 3. Tôi xác định xem là tôi có cần hệ số chặn hay không. Thường thì sẽ để là 1. 4. Mặc định là 1. Và hồi quy OLS ở đây sẽ dùng dữ liệu kiểu mảng, tôi sẽ giải thích sau để bạn có thể hiểu hơn, nhưng mặc định là vậy đi, để sử dụng dữ liệu kiểu mảng để đem lại kết quả chính xác cho hồi quy này, đầu tiên bạn chọn một khoảng 2 cột 5 dòng để ta có các số liệu cần thiết, ở ví dụ trên là tôi chọn từ ô D2 đến ô E6,sau đó bạn viết xong công thức trên bạn ấn tổ hợp phím CTRL+SHIFT+ENTER là xong. Từ cách làm trên tôi thu được các giá trị. Các giá trị này tương ứng với ô từ D2 đến E6. Tôi sẽ giải thích kĩ hơn về ý nghĩa. Tôi có n là số quan sát, ở đây n =20 Tôi có k là biến giải thích. Ở đây thì k =1 Tôi cần tính toán hệ số tự do. (n-k-1)= 20-1-1=18 ( hàng 2 cột 4) Tiếp, hàng 2, cột 1 là giá trị b0. Hàng 1 cột 1 giá trị b1. Bạn cần phải biết được là mô hình của bạn tốt không, nó giải thích được bao nhiêu? Nó có đủ tốt để phù hợp không. Và cách duy nhất bạn có thể làm là dùng tổng bình phương. Công thức chia ra làm 2 mảng, phần thứ nhất là Tổng bình phương biến hồi quy (SSR) , phần thứ 2 là Tổng bình phương phần dư (SSE) Để tính R^2 Thì lấy SSR/SSE. R^2 nằm trong khoảng 0,1. Và nó đã được tính toán ở cột 1 hàng 3, trong bảng này là =0.93 Cột 1 hàng 5 là giá trị SSR, cột 2 hàng 5 là SSE, bạn có thể tính được R^2 bằng cách chia. Nó có nghĩa là biến độc lập X giải thích được 93% biến phụ thuộc Y trong mô hình. Chúng ta có giá trị sai số chuẩn =6.94 (cột 2 hàng 3). Và đó chính là đánh giá về phương sai của lỗi quanh đường hồi quy. Nó được tính bằng tổng bình phương các phần dư chia cho hệ số tự do. Rồi căn nó là ra. Chúng ta cũng đồng thời tìm được cả sai số chuẩn cho hệ số chặn và hệ số góc. ( cột 1 hàng 2 và cột 2 hàng 2). Vậy các hệ số này có quan trọng không? Chúng giải thích điều gì? Chúng có thể bằng 0 không. Chúng ta có thể kiểm tra chúng như thế nào? Để kiểm định chúng ta dùng cặp giả thiết Ho B1=0 và H1 B1#0 Chúng ta sử dụng hàm two-tail T test trong excel =TDIST(t_statistic;df;number tails) Ở nhân tố 1 trong công thức, chúng ta cần tính toán t-statistic. Giá trị thứ 2 là hệ số tự do =18 (n-k-1) Giá trị thứ 3 là số cặp giả thuyết ( ở đây là 2) Ta có Pvalue 0,05 Chấp nhận Ho. Quay trở lại ví dụ để tính cho dễ hiểu. Ok đã xong các hồi quy bằng Excel cũng như là kiểm định lại cặp giả thuyết mô hình. Bye! See you again!
Excel, chuỗi cung ứng, Hồi quy OLS bằng Excel, OLS regression excel, supply chain Logistics và Supply chain management