Γράφημα γραμμικής παλινδρόμησης δύο παραγόντων στο Excel. Βασικές εργασίες παλινδρόμησης στο Excel: παράδειγμα δημιουργίας μοντέλου

Σε προηγούμενες δημοσιεύσεις, η ανάλυση επικεντρωνόταν συχνά σε μια μεμονωμένη αριθμητική μεταβλητή, όπως οι αποδόσεις αμοιβαίων κεφαλαίων, οι χρόνοι φόρτωσης της ιστοσελίδας ή η κατανάλωση αναψυκτικών. Σε αυτήν και στις επόμενες σημειώσεις, θα εξετάσουμε μεθόδους για την πρόβλεψη των τιμών μιας αριθμητικής μεταβλητής ανάλογα με τις τιμές μιας ή περισσότερων άλλων αριθμητικών μεταβλητών.

Το υλικό θα επεξηγηθεί με ένα εγκάρσιο παράδειγμα. Πρόβλεψη όγκου πωλήσεων σε κατάστημα ρούχων.Η αλυσίδα καταστημάτων εκπτωτικών ρούχων Sunflowers επεκτείνεται συνεχώς εδώ και 25 χρόνια. Ωστόσο, η εταιρεία δεν έχει επί του παρόντος συστηματική προσέγγιση για την επιλογή νέων καταστημάτων. Η τοποθεσία στην οποία μια εταιρεία σκοπεύει να ανοίξει ένα νέο κατάστημα καθορίζεται βάσει υποκειμενικών εκτιμήσεων. Τα κριτήρια επιλογής είναι οι ευνοϊκές συνθήκες ενοικίασης ή η ιδέα του διαχειριστή για την ιδανική τοποθεσία του καταστήματος. Φανταστείτε ότι είστε επικεφαλής του τμήματος ειδικών έργων και προγραμματισμού. Σας έχει ανατεθεί να αναπτύξετε ένα στρατηγικό σχέδιο για το άνοιγμα νέων καταστημάτων. Αυτό το σχέδιο θα πρέπει να περιλαμβάνει μια πρόβλεψη ετήσιων πωλήσεων για νέα καταστήματα. Πιστεύετε ότι ο χώρος λιανικής σχετίζεται άμεσα με τα έσοδα και θέλετε να το συνυπολογίσετε στη διαδικασία λήψης αποφάσεων. Πώς αναπτύσσετε ένα στατιστικό μοντέλο για να προβλέψετε τις ετήσιες πωλήσεις με βάση το μέγεθος ενός νέου καταστήματος;

Συνήθως, η ανάλυση παλινδρόμησης χρησιμοποιείται για την πρόβλεψη των τιμών μιας μεταβλητής. Στόχος του είναι να αναπτύξει ένα στατιστικό μοντέλο που μπορεί να προβλέψει τις τιμές μιας εξαρτημένης μεταβλητής ή απόκρισης από τις τιμές μιας τουλάχιστον ανεξάρτητης ή επεξηγηματικής μεταβλητής. Σε αυτή τη σημείωση, θα εξετάσουμε την απλή γραμμική παλινδρόμηση - μια στατιστική μέθοδο που σας επιτρέπει να προβλέψετε τις τιμές μιας εξαρτημένης μεταβλητής Υαπό τις τιμές της ανεξάρτητης μεταβλητής Χ. Οι επόμενες σημειώσεις θα περιγράψουν ένα μοντέλο πολλαπλής παλινδρόμησης σχεδιασμένο να προβλέπει τις τιμές μιας ανεξάρτητης μεταβλητής Υμε βάση τις τιμές πολλών εξαρτημένων μεταβλητών ( X 1, X 2, …, X k).

Κατεβάστε τη σημείωση σε ή μορφή, παραδείγματα σε μορφή

Τύποι μοντέλων παλινδρόμησης

Οπου ρ 1 – συντελεστής αυτοσυσχέτισης. Αν ρ 1 = 0 (χωρίς αυτοσυσχέτιση), ρε≈ 2; Αν ρ 1 ≈ 1 (θετική αυτοσυσχέτιση), ρε≈ 0; Αν ρ 1 = -1 (αρνητική αυτοσυσχέτιση), ρε ≈ 4.

Στην πράξη, η εφαρμογή του κριτηρίου Durbin-Watson βασίζεται στη σύγκριση της τιμής ρεμε κρίσιμες θεωρητικές αξίες δ ΛΚαι δ Uγια δεδομένο αριθμό παρατηρήσεων n, αριθμός ανεξάρτητων μεταβλητών του μοντέλου κ(για απλή γραμμική παλινδρόμηση κ= 1) και επίπεδο σημαντικότητας α. Αν ρε< d L , η υπόθεση για την ανεξαρτησία των τυχαίων αποκλίσεων απορρίπτεται (επομένως, υπάρχει θετική αυτοσυσχέτιση). Αν D>dU, η υπόθεση δεν απορρίπτεται (δηλαδή δεν υπάρχει αυτοσυσχέτιση). Αν δ Λ< D < d U , δεν υπάρχουν επαρκείς λόγοι για τη λήψη απόφασης. Όταν η υπολογιζόμενη τιμή ρευπερβαίνει το 2, τότε με δ ΛΚαι δ UΔεν συγκρίνεται ο ίδιος ο συντελεστής ρε, και η έκφραση (4 – ρε).

Για να υπολογίσουμε τα στατιστικά στοιχεία Durbin-Watson στο Excel, ας στραφούμε στον κάτω πίνακα στο Σχ. 14 Απόσυρση υπολοίπου. Ο αριθμητής στην παράσταση (10) υπολογίζεται χρησιμοποιώντας τη συνάρτηση =SUMMAR(array1;array2) και τον παρονομαστή =SUMMAR(array) (Εικ. 16).

Ρύζι. 16. Τύποι υπολογισμού στατιστικών Durbin-Watson

Στο παράδειγμά μας ρε= 0,883. Το κύριο ερώτημα είναι: ποια τιμή της στατιστικής Durbin-Watson θα πρέπει να θεωρηθεί αρκετά μικρή για να συμπεράνουμε ότι υπάρχει θετική αυτοσυσχέτιση; Είναι απαραίτητο να συσχετιστεί η τιμή του D με τις κρίσιμες τιμές ( δ ΛΚαι δ U), ανάλογα με τον αριθμό των παρατηρήσεων nκαι επίπεδο σημαντικότητας α (Εικ. 17).

Ρύζι. 17. Κρίσιμες τιμές στατιστικών Durbin-Watson (τεμάχιο πίνακα)

Έτσι, στο πρόβλημα του όγκου πωλήσεων σε ένα κατάστημα που παραδίδει αγαθά στο σπίτι, υπάρχει μία ανεξάρτητη μεταβλητή ( κ= 1), 15 παρατηρήσεις ( n= 15) και επίπεδο σημαντικότητας α = 0,05. Ως εκ τούτου, δ Λ= 1,08 και ρεU= 1,36. Επειδή η ρε = 0,883 < δ Λ= 1,08, υπάρχει θετική αυτοσυσχέτιση μεταξύ των υπολειμμάτων, η μέθοδος των ελαχίστων τετραγώνων δεν μπορεί να χρησιμοποιηθεί.

Έλεγχος υποθέσεων σχετικά με την κλίση και τον συντελεστή συσχέτισης

Παραπάνω, η παλινδρόμηση χρησιμοποιήθηκε αποκλειστικά για την πρόβλεψη. Για τον προσδιορισμό των συντελεστών παλινδρόμησης και την πρόβλεψη της τιμής μιας μεταβλητής Υγια μια δεδομένη τιμή μεταβλητής ΧΧρησιμοποιήθηκε η μέθοδος των ελαχίστων τετραγώνων. Επιπλέον, εξετάσαμε το ριζικό μέσο τετραγωνικό σφάλμα της εκτίμησης και τον μικτό συντελεστή συσχέτισης. Εάν η ανάλυση των υπολειμμάτων επιβεβαιώσει ότι δεν παραβιάζονται οι προϋποθέσεις εφαρμογής της μεθόδου των ελαχίστων τετραγώνων και ότι το μοντέλο της απλής γραμμικής παλινδρόμησης είναι επαρκές, με βάση τα δεδομένα του δείγματος, μπορεί να υποστηριχθεί ότι υπάρχει γραμμική σχέση μεταξύ των μεταβλητών στο πληθυσμός.

Εφαρμογήt -κριτήρια για την κλίση.Δοκιμάζοντας εάν η κλίση του πληθυσμού β 1 είναι ίση με μηδέν, μπορείτε να προσδιορίσετε εάν υπάρχει στατιστικά σημαντική σχέση μεταξύ των μεταβλητών ΧΚαι Υ. Εάν αυτή η υπόθεση απορριφθεί, μπορεί να υποστηριχθεί ότι μεταξύ των μεταβλητών ΧΚαι Υυπάρχει μια γραμμική σχέση. Οι μηδενικές και οι εναλλακτικές υποθέσεις διατυπώνονται ως εξής: H 0: β 1 = 0 (δεν υπάρχει γραμμική εξάρτηση), H1: β 1 ≠ 0 (υπάρχει γραμμική εξάρτηση). Α-πριό t-το στατιστικό είναι ίσο με τη διαφορά μεταξύ της κλίσης του δείγματος και της υποθετικής τιμής της κλίσης του πληθυσμού, διαιρούμενη με το ριζικό μέσο τετραγωνικό σφάλμα της εκτίμησης της κλίσης:

(11) t = (σι 1 β 1 ) / Sb 1

Οπου σι 1 – κλίση άμεσης παλινδρόμησης σε δεδομένα δείγματος, β1 – υποθετική κλίση άμεσου πληθυσμού, και στατιστικά δοκιμών tΕχει t-διανομή με n – 2βαθμοί ελευθερίας.

Ας ελέγξουμε αν υπάρχει στατιστικά σημαντική σχέση μεταξύ του μεγέθους του καταστήματος και των ετήσιων πωλήσεων στο α = 0,05. t-το κριτήριο εμφανίζεται μαζί με άλλες παραμέτρους όταν χρησιμοποιείται Πακέτο ανάλυσης(επιλογή Οπισθοδρόμηση). Τα πλήρη αποτελέσματα του πακέτου ανάλυσης φαίνονται στο Σχ. 4, θραύσμα που σχετίζεται με τη στατιστική t - στο Σχ. 18.

Ρύζι. 18. Αποτελέσματα αιτήσεων t

Από τον αριθμό των καταστημάτων n= 14 (βλ. Εικ. 3), κρίσιμη τιμή t- στατιστικές σε επίπεδο σημαντικότητας α = 0,05 μπορούν να βρεθούν χρησιμοποιώντας τον τύπο: tL=STUDENT.ARV(0,025,12) = –2,1788, όπου 0,025 είναι το μισό του επιπέδου σημαντικότητας και 12 = n – 2; t U=STUDENT.OBR(0,975,12) = +2,1788.

Επειδή η t-statistics = 10,64 > t U= 2,1788 (Εικ. 19), μηδενική υπόθεση H 0απορρίφθηκε. Στην άλλη πλευρά, R-τιμή για Χ= 10,6411, υπολογισμένο με τον τύπο =1-STUDENT.DIST(D3,12,TRUE), είναι περίπου ίσο με μηδέν, οπότε η υπόθεση H 0και πάλι απορρίφθηκε. Το γεγονός οτι R-Η τιμή σχεδόν μηδέν σημαίνει ότι αν δεν υπήρχε πραγματική γραμμική σχέση μεταξύ του μεγέθους του καταστήματος και των ετήσιων πωλήσεων, θα ήταν σχεδόν αδύνατο να εντοπιστεί χρησιμοποιώντας γραμμική παλινδρόμηση. Επομένως, υπάρχει μια στατιστικά σημαντική γραμμική σχέση μεταξύ των μέσων ετήσιων πωλήσεων καταστήματος και του μεγέθους του καταστήματος.

Ρύζι. 19. Έλεγχος της υπόθεσης για την κλίση του πληθυσμού σε επίπεδο σημαντικότητας 0,05 και 12 βαθμών ελευθερίας

Εφαρμογήφά -κριτήρια για την κλίση.Μια εναλλακτική προσέγγιση για τον έλεγχο υποθέσεων σχετικά με την κλίση της απλής γραμμικής παλινδρόμησης είναι να χρησιμοποιηθεί φά-κριτήρια. Ας το θυμηθούμε φάΤο -test χρησιμοποιείται για τον έλεγχο της σχέσης μεταξύ δύο διακυμάνσεων (για περισσότερες λεπτομέρειες, βλ.). Κατά τον έλεγχο της υπόθεσης της κλίσης, το μέτρο των τυχαίων σφαλμάτων είναι η διακύμανση σφάλματος (το άθροισμα των τετραγώνων σφαλμάτων διαιρεμένο με τον αριθμό των βαθμών ελευθερίας), οπότε φά-Το κριτήριο χρησιμοποιεί τον λόγο της διακύμανσης που εξηγείται από την παλινδρόμηση (δηλαδή την τιμή SSR, διαιρούμενο με τον αριθμό των ανεξάρτητων μεταβλητών κ), στη διακύμανση σφάλματος ( MSE = S YΧ 2 ).

Α-πριό φά-το στατιστικό είναι ίσο με το μέσο τετράγωνο παλινδρόμησης (MSR) διαιρούμενο με τη διακύμανση σφάλματος (MSE): φά = MSR/ MSE, Οπου MSR=SSR / κ, MSE =SSE/(n– κ – 1), κ– αριθμός ανεξάρτητων μεταβλητών στο μοντέλο παλινδρόμησης. Στατιστικά δοκιμών φάΕχει φά-διανομή με κΚαι n– k – 1βαθμοί ελευθερίας.

Για ένα δεδομένο επίπεδο σημαντικότητας α, ο κανόνας απόφασης διατυπώνεται ως εξής: αν F>FU, η μηδενική υπόθεση απορρίπτεται. διαφορετικά δεν απορρίπτεται. Τα αποτελέσματα, που παρουσιάζονται με τη μορφή ενός συνοπτικού πίνακα ανάλυσης διακύμανσης, φαίνονται στο Σχ. 20.

Ρύζι. 20. Πίνακας ανάλυσης διακύμανσης για τον έλεγχο της υπόθεσης σχετικά με τη στατιστική σημασία του συντελεστή παλινδρόμησης

Επίσης t-κριτήριο φά-το κριτήριο εμφανίζεται στον πίνακα όταν χρησιμοποιείται Πακέτο ανάλυσης(επιλογή Οπισθοδρόμηση). Πλήρη αποτελέσματα της εργασίας Πακέτο ανάλυσηςφαίνονται στο Σχ. 4, θραύσμα που σχετίζεται με φά- στατιστικά - στο Σχ. 21.

Ρύζι. 21. Αποτελέσματα αιτήσεων φά-κριτήρια που λαμβάνονται με χρήση του πακέτου ανάλυσης Excel

Η στατιστική F είναι 113,23 και R-τιμή κοντά στο μηδέν (κελί Σημασίαφά). Εάν το επίπεδο σημαντικότητας α είναι 0,05, προσδιορίστε την κρίσιμη τιμή φά-κατανομές με έναν και 12 βαθμούς ελευθερίας μπορούν να ληφθούν χρησιμοποιώντας τον τύπο F U=F.OBR(1-0,05;1;12) = 4,7472 (Εικ. 22). Επειδή η φά = 113,23 > F U= 4,7472, και R-τιμή κοντά στο 0< 0,05, нулевая гипотеза H 0απορρίπτεται, δηλ. Το μέγεθος ενός καταστήματος σχετίζεται στενά με τις ετήσιες πωλήσεις του.

Ρύζι. 22. Έλεγχος της υπόθεσης κλίσης πληθυσμού σε επίπεδο σημαντικότητας 0,05 με έναν και 12 βαθμούς ελευθερίας

Διάστημα εμπιστοσύνης που περιέχει κλίση β 1 .Για να ελέγξετε την υπόθεση ότι υπάρχει γραμμική σχέση μεταξύ των μεταβλητών, μπορείτε να κατασκευάσετε ένα διάστημα εμπιστοσύνης που περιέχει την κλίση β 1 και να επαληθεύσετε ότι η υποθετική τιμή β 1 = 0 ανήκει σε αυτό το διάστημα. Το κέντρο του διαστήματος εμπιστοσύνης που περιέχει την κλίση β 1 είναι η κλίση του δείγματος σι 1 , και τα όριά του είναι οι ποσότητες b 1 ±tn –2 Sb 1

Όπως φαίνεται στο Σχ. 18, σι 1 = +1,670, n = 14, Sb 1 = 0,157. t 12 =STUDENT.ARV(0,975,12) = 2,1788. Ως εκ τούτου, b 1 ±tn –2 Sb 1 = +1,670 ± 2,1788 * 0,157 = +1,670 ± 0,342, ή + 1,328 ≤ β 1 ≤ +2,012. Έτσι, υπάρχει μια πιθανότητα 0,95 ότι η κλίση του πληθυσμού κυμαίνεται μεταξύ +1.328 και +2.012 (δηλαδή, $1.328.000 έως $2.012.000). Δεδομένου ότι αυτές οι τιμές είναι μεγαλύτερες από το μηδέν, υπάρχει μια στατιστικά σημαντική γραμμική σχέση μεταξύ των ετήσιων πωλήσεων και της περιοχής καταστήματος. Εάν το διάστημα εμπιστοσύνης περιείχε μηδέν, δεν θα υπήρχε σχέση μεταξύ των μεταβλητών. Επιπλέον, το διάστημα εμπιστοσύνης σημαίνει ότι κάθε αύξηση της επιφάνειας του καταστήματος κατά 1.000 τ. ft οδηγεί σε αύξηση του μέσου όγκου πωλήσεων μεταξύ 1.328.000 $ και 2.012.000 $.

Χρήσηt -κριτήρια για τον συντελεστή συσχέτισης.εισήχθη ο συντελεστής συσχέτισης r, το οποίο είναι ένα μέτρο της σχέσης μεταξύ δύο αριθμητικών μεταβλητών. Μπορεί να χρησιμοποιηθεί για να προσδιοριστεί εάν υπάρχει στατιστικά σημαντική σχέση μεταξύ δύο μεταβλητών. Ας υποδηλώσουμε τον συντελεστή συσχέτισης μεταξύ των πληθυσμών και των δύο μεταβλητών με το σύμβολο ρ. Οι μηδενικές και οι εναλλακτικές υποθέσεις διατυπώνονται ως εξής: H 0: ρ = 0 (χωρίς συσχέτιση), H 1: ρ ≠ 0 (υπάρχει συσχέτιση). Έλεγχος ύπαρξης συσχέτισης:

Οπου r = + , Αν σι 1 > 0, r = – , Αν σι 1 < 0. Тестовая статистика tΕχει t-διανομή με n – 2βαθμοί ελευθερίας.

Στο πρόβλημα για την αλυσίδα καταστημάτων Sunflowers r 2= 0,904, α β 1- +1.670 (βλ. Εικ. 4). Επειδή η β 1> 0, ο συντελεστής συσχέτισης μεταξύ των ετήσιων πωλήσεων και του μεγέθους του καταστήματος είναι r= +√0,904 = +0,951. Ας ελέγξουμε τη μηδενική υπόθεση ότι δεν υπάρχει συσχέτιση μεταξύ αυτών των μεταβλητών χρησιμοποιώντας t-στατιστική:

Σε επίπεδο σημαντικότητας α = 0,05, η μηδενική υπόθεση θα πρέπει να απορριφθεί γιατί t= 10,64 > 2,1788. Έτσι, μπορεί να υποστηριχθεί ότι υπάρχει στατιστικά σημαντική σχέση μεταξύ των ετήσιων πωλήσεων και του μεγέθους του καταστήματος.

Όταν συζητούνται συμπεράσματα σχετικά με την κλίση του πληθυσμού, τα διαστήματα εμπιστοσύνης και τα τεστ υποθέσεων χρησιμοποιούνται εναλλακτικά. Ωστόσο, ο υπολογισμός του διαστήματος εμπιστοσύνης που περιέχει τον συντελεστή συσχέτισης αποδεικνύεται πιο δύσκολος, δεδομένου ότι ο τύπος της δειγματοληπτικής κατανομής της στατιστικής rεξαρτάται από τον πραγματικό συντελεστή συσχέτισης.

Εκτίμηση μαθηματικής προσδοκίας και πρόβλεψη επιμέρους τιμών

Αυτή η ενότητα εξετάζει μεθόδους για την εκτίμηση της μαθηματικής προσδοκίας μιας απάντησης Υκαι προβλέψεις ατομικών αξιών Υγια δεδομένες τιμές της μεταβλητής Χ.

Κατασκευή ενός διαστήματος εμπιστοσύνης.Στο παράδειγμα 2 (βλ. ενότητα παραπάνω Μέθοδος ελάχιστου τετραγώνου) η εξίσωση παλινδρόμησης κατέστησε δυνατή την πρόβλεψη της τιμής της μεταβλητής Υ Χ. Στο πρόβλημα της επιλογής τοποθεσίας για ένα κατάστημα λιανικής, ο μέσος ετήσιος όγκος πωλήσεων σε ένα κατάστημα με έκταση 4000 τ. πόδια ήταν ίσο με 7,644 εκατομμύρια δολάρια, ωστόσο, αυτή η εκτίμηση των μαθηματικών προσδοκιών του γενικού πληθυσμού είναι σημειακή. Για την εκτίμηση της μαθηματικής προσδοκίας του πληθυσμού, προτάθηκε η έννοια του διαστήματος εμπιστοσύνης. Παρομοίως, μπορούμε να εισαγάγουμε την έννοια διάστημα εμπιστοσύνης για τη μαθηματική προσδοκία της απάντησηςγια μια δεδομένη τιμή μεταβλητής Χ:

Οπου , = σι 0 + σι 1 X i– η προβλεπόμενη τιμή είναι μεταβλητή Υστο Χ = X i, Σ ΥΧ– ρίζα μέσο τετραγωνικό σφάλμα, n- το μέγεθος του δείγματος, ΧΕγώ- καθορισμένη τιμή της μεταβλητής Χ, µ Υ|Χ = ΧΕγώ– μαθηματική προσδοκία της μεταβλητής Υστο Χ = X i, SSX =

Η ανάλυση του τύπου (13) δείχνει ότι το πλάτος του διαστήματος εμπιστοσύνης εξαρτάται από διάφορους παράγοντες. Σε ένα δεδομένο επίπεδο σημαντικότητας, μια αύξηση στο πλάτος των διακυμάνσεων γύρω από τη γραμμή παλινδρόμησης, που μετράται χρησιμοποιώντας το ριζικό μέσο τετραγωνικό σφάλμα, οδηγεί σε αύξηση του πλάτους του διαστήματος. Από την άλλη, όπως θα περίμενε κανείς, η αύξηση του μεγέθους του δείγματος συνοδεύεται από στένωση του διαστήματος. Επιπλέον, το πλάτος του διαστήματος αλλάζει ανάλογα με τις τιμές ΧΕγώ. Αν η μεταβλητή τιμή Υπροβλεπόμενη για τις ποσότητες Χ, κοντά στη μέση τιμή , το διάστημα εμπιστοσύνης αποδεικνύεται μικρότερο από ό,τι όταν προβλέπεται η απόκριση για τιμές που απέχουν πολύ από το μέσο όρο.

Ας πούμε ότι κατά την επιλογή μιας τοποθεσίας καταστήματος, θέλουμε να δημιουργήσουμε ένα διάστημα εμπιστοσύνης 95% για τις μέσες ετήσιες πωλήσεις όλων των καταστημάτων των οποίων η επιφάνεια είναι 4000 τετραγωνικά μέτρα. πόδια:

Επομένως, ο μέσος ετήσιος όγκος πωλήσεων σε όλα τα καταστήματα με έκταση 4.000 τ. πόδια, με πιθανότητα 95% να κυμαίνεται από 6,971 έως 8,317 εκατομμύρια δολάρια.

Υπολογίστε το διάστημα εμπιστοσύνης για την προβλεπόμενη τιμή.Εκτός από το διάστημα εμπιστοσύνης για τη μαθηματική προσδοκία της απόκρισης για μια δεδομένη τιμή της μεταβλητής Χ, είναι συχνά απαραίτητο να γνωρίζουμε το διάστημα εμπιστοσύνης για την προβλεπόμενη τιμή. Αν και ο τύπος για τον υπολογισμό ενός τέτοιου διαστήματος εμπιστοσύνης είναι πολύ παρόμοιος με τον τύπο (13), αυτό το διάστημα περιέχει την προβλεπόμενη τιμή και όχι την εκτίμηση της παραμέτρου. Διάστημα για την προβλεπόμενη απόκριση ΥΧ = Xiγια μια συγκεκριμένη τιμή μεταβλητής ΧΕγώκαθορίζεται από τον τύπο:

Ας υποθέσουμε ότι όταν επιλέγουμε μια τοποθεσία για ένα κατάστημα λιανικής, θέλουμε να δημιουργήσουμε ένα διάστημα εμπιστοσύνης 95% για τον προβλεπόμενο ετήσιο όγκο πωλήσεων για ένα κατάστημα του οποίου η έκταση είναι 4000 τετραγωνικά μέτρα. πόδια:

Επομένως, ο προβλεπόμενος ετήσιος όγκος πωλήσεων για ένα κατάστημα με επιφάνεια 4000 τ. πόδια, με πιθανότητα 95% κυμαίνεται από 5,433 έως 9,854 εκατομμύρια δολάρια Όπως μπορούμε να δούμε, το διάστημα εμπιστοσύνης για την προβλεπόμενη τιμή απόκρισης είναι πολύ μεγαλύτερο από το διάστημα εμπιστοσύνης για τις μαθηματικές προσδοκίες. Αυτό συμβαίνει επειδή η μεταβλητότητα στην πρόβλεψη μεμονωμένων τιμών είναι πολύ μεγαλύτερη από την εκτίμηση της μαθηματικής προσδοκίας.

Παγίδες και ηθικά ζητήματα που σχετίζονται με τη χρήση παλινδρόμησης

Δυσκολίες που σχετίζονται με την ανάλυση παλινδρόμησης:

  • Αγνοώντας τις προϋποθέσεις εφαρμογής της μεθόδου των ελαχίστων τετραγώνων.
  • Εσφαλμένη εκτίμηση των προϋποθέσεων εφαρμογής της μεθόδου των ελαχίστων τετραγώνων.
  • Λανθασμένη επιλογή εναλλακτικών μεθόδων όταν παραβιάζονται οι προϋποθέσεις εφαρμογής της μεθόδου των ελαχίστων τετραγώνων.
  • Εφαρμογή ανάλυσης παλινδρόμησης χωρίς βαθιά γνώση του αντικειμένου της έρευνας.
  • Παρέκταση μιας παλινδρόμησης πέρα ​​από το εύρος της επεξηγηματικής μεταβλητής.
  • Σύγχυση μεταξύ στατιστικών και αιτιακών σχέσεων.

Η ευρεία χρήση υπολογιστικών φύλλων και στατιστικού λογισμικού έχει εξαλείψει τα υπολογιστικά προβλήματα που είχαν παρεμποδίσει τη χρήση της ανάλυσης παλινδρόμησης. Ωστόσο, αυτό οδήγησε στο γεγονός ότι η ανάλυση παλινδρόμησης χρησιμοποιήθηκε από χρήστες που δεν είχαν επαρκή προσόντα και γνώσεις. Πώς μπορούν οι χρήστες να γνωρίζουν εναλλακτικές μεθόδους εάν πολλοί από αυτούς δεν έχουν ιδέα για τις προϋποθέσεις εφαρμογής της μεθόδου των ελαχίστων τετραγώνων και δεν γνωρίζουν πώς να ελέγξουν την εφαρμογή τους;

Ο ερευνητής δεν πρέπει να παρασυρθεί με τους τσακισμένους αριθμούς - υπολογίζοντας τη μετατόπιση, την κλίση και τον μικτό συντελεστή συσχέτισης. Χρειάζεται βαθύτερη γνώση. Ας το ερμηνεύσουμε αυτό με ένα κλασικό παράδειγμα από σχολικά βιβλία. Ο Anscombe έδειξε ότι και τα τέσσερα σύνολα δεδομένων που φαίνονται στο Σχ. 23, έχουν τις ίδιες παραμέτρους παλινδρόμησης (Εικ. 24).

Ρύζι. 23. Τέσσερα σύνολα τεχνητών δεδομένων

Ρύζι. 24. Ανάλυση παλινδρόμησης τεσσάρων συνόλων τεχνητών δεδομένων. τελείωσα με Πακέτο ανάλυσης(κάντε κλικ στην εικόνα για μεγέθυνση)

Έτσι, από την άποψη της ανάλυσης παλινδρόμησης, όλα αυτά τα σύνολα δεδομένων είναι εντελώς πανομοιότυπα. Αν η ανάλυση τελείωνε εκεί, θα χάναμε πολλές χρήσιμες πληροφορίες. Αυτό αποδεικνύεται από τα διαγράμματα διασποράς (Εικόνα 25) και τα υπολειμματικά διαγράμματα (Εικόνα 26) που κατασκευάστηκαν για αυτά τα σύνολα δεδομένων.

Ρύζι. 25. Γραφήματα διασποράς για τέσσερα σύνολα δεδομένων

Τα διαγράμματα διασποράς και τα υπολειμματικά γραφήματα υποδεικνύουν ότι αυτά τα δεδομένα διαφέρουν μεταξύ τους. Το μόνο σύνολο που κατανέμεται κατά μήκος μιας ευθείας γραμμής είναι το σύνολο Α. Η γραφική παράσταση των υπολειμμάτων που υπολογίζονται από το σύνολο Α δεν έχει κανένα σχέδιο. Αυτό δεν μπορεί να ειπωθεί για τα σύνολα Β, Γ και Δ. Η γραφική παράσταση διασποράς για το σύνολο Β δείχνει ένα έντονο τετραγωνικό σχέδιο. Αυτό το συμπέρασμα επιβεβαιώνεται από το υπολειπόμενο οικόπεδο, το οποίο έχει παραβολικό σχήμα. Το διάγραμμα διασποράς και το υπολειπόμενο διάγραμμα δείχνουν ότι το σύνολο δεδομένων Β περιέχει μια ακραία τιμή. Σε αυτήν την περίπτωση, είναι απαραίτητο να εξαιρεθεί η ακραία τιμή από το σύνολο δεδομένων και να επαναληφθεί η ανάλυση. Μια μέθοδος για τον εντοπισμό και την εξάλειψη των ακραίων τιμών στις παρατηρήσεις ονομάζεται ανάλυση επιρροής. Μετά την εξάλειψη της ακραίας τιμής, το αποτέλεσμα της επανεκτίμησης του μοντέλου μπορεί να είναι εντελώς διαφορετικό. Το διάγραμμα διασποράς που σχεδιάστηκε από δεδομένα από το σύνολο G απεικονίζει μια ασυνήθιστη κατάσταση στην οποία το εμπειρικό μοντέλο εξαρτάται σημαντικά από μια μεμονωμένη απόκριση ( Χ 8 = 19, Υ 8 = 12,5). Τέτοια μοντέλα παλινδρόμησης πρέπει να υπολογίζονται ιδιαίτερα προσεκτικά. Έτσι, τα διαγράμματα διασποράς και τα υπολειμματικά διαγράμματα είναι ένα ουσιαστικό εργαλείο για την ανάλυση παλινδρόμησης και θα πρέπει να αποτελούν αναπόσπαστο μέρος της. Χωρίς αυτές, η ανάλυση παλινδρόμησης δεν είναι αξιόπιστη.

Ρύζι. 26. Υπολειμματικά διαγράμματα για τέσσερα σύνολα δεδομένων

Πώς να αποφύγετε παγίδες στην ανάλυση παλινδρόμησης:

  • Ανάλυση πιθανών σχέσεων μεταξύ μεταβλητών ΧΚαι Υξεκινάτε πάντα σχεδιάζοντας ένα διάγραμμα διασποράς.
  • Πριν ερμηνεύσετε τα αποτελέσματα της ανάλυσης παλινδρόμησης, ελέγξτε τις προϋποθέσεις για την εφαρμογή της.
  • Σχεδιάστε τα υπολείμματα έναντι της ανεξάρτητης μεταβλητής. Αυτό θα καταστήσει δυνατό τον προσδιορισμό του πόσο καλά ταιριάζει το εμπειρικό μοντέλο με τα αποτελέσματα της παρατήρησης και θα ανιχνευθεί παραβίαση της σταθερότητας διασποράς.
  • Χρησιμοποιήστε ιστογράμματα, διαγράμματα στελέχους και φύλλων, διαγράμματα πλαισίου και γραφήματα κανονικής κατανομής για να ελέγξετε την υπόθεση της κανονικής κατανομής σφάλματος.
  • Εάν δεν πληρούνται οι προϋποθέσεις εφαρμογής της μεθόδου των ελαχίστων τετραγώνων, χρησιμοποιήστε εναλλακτικές μεθόδους (για παράδειγμα, μοντέλα τετραγωνικής ή πολλαπλής παλινδρόμησης).
  • Εάν πληρούνται οι προϋποθέσεις για τη δυνατότητα εφαρμογής της μεθόδου των ελαχίστων τετραγώνων, είναι απαραίτητο να ελεγχθεί η υπόθεση σχετικά με τη στατιστική σημασία των συντελεστών παλινδρόμησης και να κατασκευαστούν διαστήματα εμπιστοσύνης που περιέχουν τη μαθηματική προσδοκία και την προβλεπόμενη τιμή απόκρισης.
  • Αποφύγετε την πρόβλεψη τιμών της εξαρτημένης μεταβλητής εκτός του εύρους της ανεξάρτητης μεταβλητής.
  • Λάβετε υπόψη ότι οι στατιστικές σχέσεις δεν είναι πάντα αιτίου-αποτελέσματος. Να θυμάστε ότι η συσχέτιση μεταξύ των μεταβλητών δεν σημαίνει ότι υπάρχει σχέση αιτίου-αποτελέσματος μεταξύ τους.

Περίληψη.Όπως φαίνεται στο μπλοκ διάγραμμα (Εικόνα 27), η σημείωση περιγράφει το απλό μοντέλο γραμμικής παλινδρόμησης, τις προϋποθέσεις για την εφαρμογή του και τον τρόπο δοκιμής αυτών των συνθηκών. Θεωρούνται t-κριτήριο ελέγχου της στατιστικής σημασίας της κλίσης παλινδρόμησης. Χρησιμοποιήθηκε ένα μοντέλο παλινδρόμησης για την πρόβλεψη των τιμών της εξαρτημένης μεταβλητής. Θεωρείται ένα παράδειγμα που σχετίζεται με την επιλογή τοποθεσίας για ένα κατάστημα λιανικής, στο οποίο εξετάζεται η εξάρτηση του ετήσιου όγκου πωλήσεων από την περιοχή του καταστήματος. Οι πληροφορίες που λαμβάνονται σάς επιτρέπουν να επιλέξετε με μεγαλύτερη ακρίβεια μια τοποθεσία για ένα κατάστημα και να προβλέψετε τον ετήσιο όγκο πωλήσεών του. Οι ακόλουθες σημειώσεις θα συνεχίσουν τη συζήτηση της ανάλυσης παλινδρόμησης και θα εξετάσουν επίσης μοντέλα πολλαπλών παλινδρόμησης.

Ρύζι. 27. Σημειώστε διάγραμμα δομής

Χρησιμοποιούνται υλικά από το βιβλίο Levin et al. – Μ.: Williams, 2004. – Σελ. 792–872

Εάν η εξαρτημένη μεταβλητή είναι κατηγορική, πρέπει να χρησιμοποιηθεί λογιστική παλινδρόμηση.

Είναι γνωστό ότι είναι χρήσιμο σε διάφορους τομείς δραστηριότητας, συμπεριλαμβανομένου ενός κλάδου όπως η οικονομετρία, όπου αυτό το βοηθητικό πρόγραμμα λογισμικού χρησιμοποιείται στην εργασία. Βασικά, όλες οι ενέργειες των πρακτικών και εργαστηριακών τάξεων εκτελούνται σε Excel, γεγονός που διευκολύνει πολύ την εργασία παρέχοντας λεπτομερείς επεξηγήσεις ορισμένων ενεργειών. Έτσι, ένα από τα εργαλεία ανάλυσης «Παλινδρόμηση» χρησιμοποιείται για την επιλογή ενός γραφήματος για ένα σύνολο παρατηρήσεων χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Ας δούμε τι είναι αυτό το εργαλείο προγράμματος και ποια είναι τα οφέλη του για τους χρήστες. Παρακάτω θα βρείτε επίσης σύντομες αλλά σαφείς οδηγίες για την κατασκευή ενός μοντέλου παλινδρόμησης.

Κύρια καθήκοντα και τύποι παλινδρόμησης

Η παλινδρόμηση αντιπροσωπεύει τη σχέση μεταξύ δεδομένων μεταβλητών, καθιστώντας έτσι δυνατή την πρόβλεψη της μελλοντικής συμπεριφοράς αυτών των μεταβλητών. Οι μεταβλητές είναι διάφορα περιοδικά φαινόμενα, συμπεριλαμβανομένης της ανθρώπινης συμπεριφοράς. Αυτός ο τύπος ανάλυσης Excel χρησιμοποιείται για την ανάλυση του αντίκτυπου σε μια συγκεκριμένη εξαρτημένη μεταβλητή των τιμών μιας ή ορισμένων μεταβλητών. Για παράδειγμα, οι πωλήσεις σε ένα κατάστημα επηρεάζονται από διάφορους παράγοντες, όπως η ποικιλία, οι τιμές και η τοποθεσία του καταστήματος. Χάρη στην παλινδρόμηση στο Excel, μπορείτε να προσδιορίσετε τον βαθμό επιρροής καθενός από αυτούς τους παράγοντες με βάση τα αποτελέσματα των υπαρχουσών πωλήσεων και, στη συνέχεια, να εφαρμόσετε τα δεδομένα που ελήφθησαν στην πρόβλεψη πωλήσεων για έναν ακόμη μήνα ή για ένα άλλο κατάστημα που βρίσκεται κοντά.

Τυπικά, η παλινδρόμηση παρουσιάζεται ως μια απλή εξίσωση που αποκαλύπτει τις σχέσεις και τα δυνατά σημεία των σχέσεων μεταξύ δύο ομάδων μεταβλητών, όπου η μία ομάδα είναι εξαρτημένη ή ενδογενής και η άλλη είναι ανεξάρτητη ή εξωγενής. Εάν υπάρχει μια ομάδα αλληλένδετων δεικτών, η εξαρτημένη μεταβλητή Υ προσδιορίζεται με βάση τη λογική του συλλογισμού και οι υπόλοιπες λειτουργούν ως ανεξάρτητες μεταβλητές Χ.

Οι κύριες εργασίες για την κατασκευή ενός μοντέλου παλινδρόμησης είναι οι εξής:

  1. Επιλογή σημαντικών ανεξάρτητων μεταβλητών (Χ1, Χ2, ..., Χκ).
  2. Επιλογή του τύπου της λειτουργίας.
  3. Κατασκευή εκτιμήσεων για συντελεστές.
  4. Κατασκευή διαστημάτων εμπιστοσύνης και συναρτήσεων παλινδρόμησης.
  5. Έλεγχος της σημαντικότητας των υπολογισμένων εκτιμήσεων και της κατασκευασμένης εξίσωσης παλινδρόμησης.

Υπάρχουν διάφοροι τύποι ανάλυσης παλινδρόμησης:

  • ζευγαρωμένη (1 εξαρτημένη και 1 ανεξάρτητη μεταβλητή).
  • πολλαπλές (πολλές ανεξάρτητες μεταβλητές).

Υπάρχουν δύο τύποι εξισώσεων παλινδρόμησης:

  1. Γραμμική, που απεικονίζει μια αυστηρή γραμμική σχέση μεταξύ μεταβλητών.
  2. Μη γραμμικές - Εξισώσεις που μπορούν να περιλαμβάνουν δυνάμεις, κλάσματα και τριγωνομετρικές συναρτήσεις.

Οδηγίες για την κατασκευή ενός μοντέλου

Για να εκτελέσετε μια δεδομένη κατασκευή στο Excel, πρέπει να ακολουθήσετε τις οδηγίες:


Για περαιτέρω υπολογισμούς, χρησιμοποιήστε τη συνάρτηση «Γραμμική()», προσδιορίζοντας τις τιμές Y, τις τιμές X, τη συνθήκη και τη στατιστική. Μετά από αυτό, προσδιορίστε το σύνολο των σημείων στη γραμμή παλινδρόμησης χρησιμοποιώντας τη συνάρτηση "Τάση" - Τιμές Y, Τιμές X, Νέες τιμές, Const. Χρησιμοποιώντας τις δεδομένες παραμέτρους, υπολογίστε την άγνωστη τιμή των συντελεστών, με βάση τις δεδομένες συνθήκες του προβλήματος.

Δείχνει την επίδραση ορισμένων τιμών (ανεξάρτητων, ανεξάρτητων) στην εξαρτημένη μεταβλητή. Για παράδειγμα, πώς εξαρτάται ο αριθμός του οικονομικά ενεργού πληθυσμού από τον αριθμό των επιχειρήσεων, τους μισθούς και άλλες παραμέτρους. Ή: πώς οι ξένες επενδύσεις, οι τιμές της ενέργειας κ.λπ. επηρεάζουν το επίπεδο του ΑΕΠ.

Το αποτέλεσμα της ανάλυσης σάς επιτρέπει να επισημάνετε προτεραιότητες. Και με βάση τους κύριους παράγοντες, προβλέψτε, σχεδιάστε την ανάπτυξη των τομέων προτεραιότητας και λάβετε αποφάσεις διαχείρισης.

Η παλινδρόμηση συμβαίνει:

γραμμικό (y = a + bx);

· παραβολική (y = a + bx + cx 2);

· εκθετική (y = a * exp(bx));

· δύναμη (y = a*x^b);

· υπερβολική (y = b/x + a);

λογαριθμική (y = b * 1n(x) + a);

· εκθετική (y = a * b^x).

Ας δούμε ένα παράδειγμα κατασκευής ενός μοντέλου παλινδρόμησης στο Excel και ερμηνείας των αποτελεσμάτων. Ας πάρουμε τον γραμμικό τύπο παλινδρόμησης.

Εργο. Σε 6 επιχειρήσεις, αναλύθηκε ο μέσος μηνιαίος μισθός και ο αριθμός των εργαζομένων που αποχωρούν. Είναι απαραίτητο να προσδιοριστεί η εξάρτηση του αριθμού των εργαζομένων που αποχωρούν από τον μέσο μισθό.

Το μοντέλο γραμμικής παλινδρόμησης μοιάζει με αυτό:

Y = a 0 + a 1 x 1 +…+a k x k.

Όπου a είναι συντελεστές παλινδρόμησης, x είναι μεταβλητές που επηρεάζουν, k είναι ο αριθμός των παραγόντων.

Στο παράδειγμά μας, το Y είναι ο δείκτης αποχώρησης εργαζομένων. Ο παράγοντας που επηρεάζει είναι οι μισθοί (x).

Το Excel διαθέτει ενσωματωμένες λειτουργίες που μπορούν να σας βοηθήσουν να υπολογίσετε τις παραμέτρους ενός μοντέλου γραμμικής παλινδρόμησης. Αλλά το πρόσθετο "Πακέτο ανάλυσης" θα το κάνει πιο γρήγορα.

Ενεργοποιούμε ένα ισχυρό αναλυτικό εργαλείο:

1. Κάντε κλικ στο κουμπί "Office" και μεταβείτε στην καρτέλα "Επιλογές Excel". "Πρόσθετα".

2. Στο κάτω μέρος, κάτω από την αναπτυσσόμενη λίστα, στο πεδίο «Διαχείριση» θα υπάρχει η επιγραφή «Πρόσθετα Excel» (αν δεν υπάρχει, κάντε κλικ στο πλαίσιο ελέγχου στα δεξιά και επιλέξτε). Και το κουμπί "Μετάβαση". Κάντε κλικ.

3. Ανοίγει μια λίστα με τα διαθέσιμα πρόσθετα. Επιλέξτε «Πακέτο ανάλυσης» και κάντε κλικ στο OK.

Μόλις ενεργοποιηθεί, το πρόσθετο θα είναι διαθέσιμο στην καρτέλα Δεδομένα.

Τώρα ας κάνουμε την ίδια την ανάλυση παλινδρόμησης.

1. Ανοίξτε το μενού του εργαλείου «Ανάλυση δεδομένων». Επιλέξτε "Προσδιορισμός".



2. Θα ανοίξει ένα μενού για να επιλέξετε τιμές εισόδου και επιλογές εξόδου (πού θα εμφανιστεί το αποτέλεσμα). Στα πεδία για τα αρχικά δεδομένα, υποδεικνύουμε το εύρος της περιγραφόμενης παραμέτρου (Y) και τον παράγοντα που την επηρεάζει (X). Τα υπόλοιπα δεν χρειάζεται να συμπληρωθούν.

3. Αφού κάνετε κλικ στο OK, το πρόγραμμα θα εμφανίσει τους υπολογισμούς σε ένα νέο φύλλο (μπορείτε να επιλέξετε ένα διάστημα για εμφάνιση στο τρέχον φύλλο ή να εκχωρήσετε έξοδο σε ένα νέο βιβλίο εργασίας).

Πρώτα απ 'όλα, δίνουμε προσοχή στο R-τετράγωνο και τους συντελεστές.

Το R-τετράγωνο είναι ο συντελεστής προσδιορισμού. Στο παράδειγμά μας – 0,755 ή 75,5%. Αυτό σημαίνει ότι οι υπολογισμένες παράμετροι του μοντέλου εξηγούν το 75,5% της σχέσης μεταξύ των παραμέτρων που μελετήθηκαν. Όσο μεγαλύτερος είναι ο συντελεστής προσδιορισμού, τόσο καλύτερο είναι το μοντέλο. Καλό - πάνω από 0,8. Κακό – λιγότερο από 0,5 (μια τέτοια ανάλυση δύσκολα μπορεί να θεωρηθεί λογική). Στο παράδειγμά μας - "όχι κακό".

Ο συντελεστής 64,1428 δείχνει τι θα είναι το Y εάν όλες οι μεταβλητές στο υπό εξέταση μοντέλο είναι ίσες με 0. Δηλαδή, η τιμή της αναλυόμενης παραμέτρου επηρεάζεται επίσης από άλλους παράγοντες που δεν περιγράφονται στο μοντέλο.

Ο συντελεστής -0,16285 δείχνει το βάρος της μεταβλητής X στο Y. Δηλαδή, ο μέσος μηνιαίος μισθός σε αυτό το μοντέλο επηρεάζει τον αριθμό των παραιτητών με βάρος -0,16285 (αυτός είναι ένας μικρός βαθμός επιρροής). Το σύμβολο «-» υποδηλώνει αρνητικό αντίκτυπο: όσο υψηλότερος είναι ο μισθός, τόσο λιγότερα άτομα παραιτούνται. Που είναι δίκαιο.

Παλινδρόμηση στο Excel

Η επεξεργασία στατιστικών δεδομένων μπορεί επίσης να πραγματοποιηθεί χρησιμοποιώντας το πρόσθετο Πακέτο Ανάλυσης στο υποστοιχείο του μενού «Υπηρεσία». Στο Excel 2003, αν ανοίξετε ΥΠΗΡΕΣΙΑ, δεν μπορούμε να βρούμε την καρτέλα ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ, μετά κάντε κλικ στο αριστερό κουμπί του ποντικιού για να ανοίξετε την καρτέλα ΥΠΕΡΔΟΜΕΣκαι απέναντι από το σημείο ΠΑΚΕΤΟ ΑΝΑΛΥΣΗΣΚάντε κλικ στο αριστερό κουμπί του ποντικιού για να βάλετε ένα σημάδι επιλογής (Εικ. 17).

Ρύζι. 17. Παράθυρο ΥΠΕΡΔΟΜΕΣ

Μετά από αυτό στο μενού ΥΠΗΡΕΣΙΑεμφανίζεται η καρτέλα ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ.

Στο Excel 2007 για εγκατάσταση ΠΑΚΕΤΟ ΑΝΑΛΥΣΗΣπρέπει να κάνετε κλικ στο κουμπί OFFICE στην επάνω αριστερή γωνία του φύλλου (Εικ. 18α). Στη συνέχεια, κάντε κλικ στο κουμπί ΡΥΘΜΙΣΕΙΣ EXCEL. Στο παράθυρο που εμφανίζεται ΡΥΘΜΙΣΕΙΣ EXCELκάντε αριστερό κλικ στο αντικείμενο ΥΠΕΡΔΟΜΕΣκαι στη δεξιά πλευρά της αναπτυσσόμενης λίστας επιλέξτε το στοιχείο ΠΑΚΕΤΟ ΑΝΑΛΥΣΗΣ.Επόμενο κλικ στο Εντάξει.


Επιλογές Excel Κουμπί γραφείου

Ρύζι. 18. Εγκατάσταση ΠΑΚΕΤΟ ΑΝΑΛΥΣΗΣστο Excel 2007

Για να εγκαταστήσετε το Πακέτο Ανάλυσης, κάντε κλικ στο κουμπί ΠΗΓΑΙΝΩ,που βρίσκεται στο κάτω μέρος του ανοιχτού παραθύρου. Θα εμφανιστεί ένα παράθυρο όπως φαίνεται στο Σχ. 12. Βάλτε ένα τσιμπούρι μπροστά από ΠΑΚΕΤΟ ΑΝΑΛΥΣΗΣ.Στην καρτέλα ΔΕΔΟΜΕΝΑθα εμφανιστεί ένα κουμπί ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ(Εικ. 19).

Από τα προτεινόμενα είδη, επιλέξτε το στοιχείο " ΟΠΙΣΘΟΔΡΟΜΗΣΗ" και κάντε κλικ σε αυτό με το αριστερό κουμπί του ποντικιού. Στη συνέχεια, κάντε κλικ στο OK.

Θα εμφανιστεί ένα παράθυρο όπως φαίνεται στο Σχ. 21

Εργαλείο ανάλυσης " ΟΠΙΣΘΟΔΡΟΜΗΣΗ» χρησιμοποιείται για την προσαρμογή ενός γραφήματος σε ένα σύνολο παρατηρήσεων χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Η παλινδρόμηση χρησιμοποιείται για την ανάλυση της επίδρασης σε μια μεμονωμένη εξαρτημένη μεταβλητή των τιμών μιας ή περισσότερων ανεξάρτητων μεταβλητών. Για παράδειγμα, διάφοροι παράγοντες επηρεάζουν την αθλητική απόδοση ενός αθλητή, όπως η ηλικία, το ύψος και το βάρος. Είναι δυνατόν να υπολογιστεί ο βαθμός στον οποίο καθένας από αυτούς τους τρεις παράγοντες επηρεάζει την απόδοση ενός αθλητή και στη συνέχεια να χρησιμοποιήσει αυτά τα δεδομένα για να προβλέψει την απόδοση ενός άλλου αθλητή.

Το εργαλείο παλινδρόμησης χρησιμοποιεί τη συνάρτηση LINEST.

Πλαίσιο διαλόγου REGRESSION

Ετικέτες Επιλέξτε το πλαίσιο ελέγχου εάν η πρώτη σειρά ή η πρώτη στήλη του εύρους εισαγωγής περιέχει επικεφαλίδες. Καταργήστε αυτό το πλαίσιο ελέγχου εάν δεν υπάρχουν κεφαλίδες. Σε αυτήν την περίπτωση, οι κατάλληλες κεφαλίδες για τα δεδομένα του πίνακα εξόδου θα δημιουργηθούν αυτόματα.

Επίπεδο αξιοπιστίας Επιλέξτε το πλαίσιο ελέγχου για να συμπεριλάβετε ένα επιπλέον επίπεδο στον συνοπτικό πίνακα εξόδου. Στο κατάλληλο πεδίο, εισαγάγετε το επίπεδο εμπιστοσύνης που θέλετε να εφαρμόσετε, εκτός από το προεπιλεγμένο επίπεδο 95%.

Σταθερά - μηδέν Επιλέξτε το πλαίσιο ελέγχου για να αναγκάσετε τη γραμμή παλινδρόμησης να περάσει από την αρχή.

Εύρος εξόδου Εισαγάγετε την αναφορά στο επάνω αριστερό κελί της περιοχής εξόδου. Παρέχετε τουλάχιστον επτά στήλες για τον συνοπτικό πίνακα εξόδου, ο οποίος θα περιλαμβάνει: αποτελέσματα ANOVA, συντελεστές, τυπικό σφάλμα του υπολογισμού Y, τυπικές αποκλίσεις, αριθμό παρατηρήσεων, τυπικά σφάλματα για συντελεστές.

Νέο φύλλο εργασίας Επιλέξτε αυτήν την επιλογή για να ανοίξετε ένα νέο φύλλο εργασίας στο βιβλίο εργασίας και να επικολλήσετε τα αποτελέσματα της ανάλυσης, ξεκινώντας από το κελί A1. Εάν είναι απαραίτητο, εισαγάγετε ένα όνομα για το νέο φύλλο στο πεδίο που βρίσκεται απέναντι από το αντίστοιχο κουμπί επιλογής.

Νέο βιβλίο εργασίας Επιλέξτε αυτήν την επιλογή για να δημιουργήσετε ένα νέο βιβλίο εργασίας με τα αποτελέσματα να προστίθενται σε ένα νέο φύλλο εργασίας.

Υπολείμματα Επιλέξτε το πλαίσιο ελέγχου για να συμπεριλάβετε υπολείμματα στον πίνακα εξόδου.

Τυποποιημένα υπολείμματα Επιλέξτε το πλαίσιο ελέγχου για να συμπεριλάβετε τυποποιημένα υπολείμματα στον πίνακα εξόδου.

Υπολειπόμενη γραφική παράσταση Επιλέξτε το πλαίσιο ελέγχου για να σχεδιάσετε τα υπολείμματα για κάθε ανεξάρτητη μεταβλητή.

Fit Plot Επιλέξτε το πλαίσιο ελέγχου για να σχεδιάσετε τις προβλεπόμενες έναντι των παρατηρούμενων τιμών.

Οικόπεδο κανονικής πιθανότηταςΕπιλέξτε το πλαίσιο ελέγχου για να σχεδιάσετε ένα κανονικό γράφημα πιθανοτήτων.

Λειτουργία LINEST

Για να πραγματοποιήσετε υπολογισμούς, επιλέξτε με τον κέρσορα το κελί στο οποίο θέλουμε να εμφανιστεί η μέση τιμή και πατήστε το πλήκτρο = στο πληκτρολόγιο. Στη συνέχεια, στο πεδίο Όνομα, υποδείξτε την επιθυμητή λειτουργία, για παράδειγμα ΜΕΣΗ ΤΙΜΗ(Εικ. 22).


Ρύζι. 22 Εύρεση συναρτήσεων στο Excel 2003

Αν στο χωράφι ΟΝΟΜΑτο όνομα της συνάρτησης δεν εμφανίζεται και, στη συνέχεια, κάντε αριστερό κλικ στο τρίγωνο δίπλα στο πεδίο και μετά θα εμφανιστεί ένα παράθυρο με μια λίστα συναρτήσεων. Εάν αυτή η λειτουργία δεν βρίσκεται στη λίστα, κάντε αριστερό κλικ στο στοιχείο της λίστας ΑΛΛΕΣ ΛΕΙΤΟΥΡΓΙΕΣ, θα εμφανιστεί ένα πλαίσιο διαλόγου FUNCTION MASTER, στο οποίο, χρησιμοποιώντας κατακόρυφη κύλιση, επιλέξτε την επιθυμητή λειτουργία, τονίστε την με τον κέρσορα και κάντε κλικ στο Εντάξει(Εικ. 23).

Ρύζι. 23. Οδηγός λειτουργιών

Για να αναζητήσετε μια συνάρτηση στο Excel 2007, μπορείτε να ανοίξετε οποιαδήποτε καρτέλα στο μενού, στη συνέχεια, για να πραγματοποιήσετε υπολογισμούς, επιλέξτε με τον κέρσορα το κελί στο οποίο θέλουμε να εμφανιστεί η μέση τιμή και πατήστε το πλήκτρο = στο πληκτρολόγιο. Στη συνέχεια, στο πεδίο Όνομα, καθορίστε τη συνάρτηση ΜΕΣΗ ΤΙΜΗ. Το παράθυρο για τον υπολογισμό της συνάρτησης είναι παρόμοιο με αυτό που εμφανίζεται στο Excel 2003.

Μπορείτε επίσης να επιλέξετε την καρτέλα Τύποι και να κάνετε αριστερό κλικ στο κουμπί στο μενού " ΕΙΣΑΓΩΓΗ ΣΥΝΑΡΤΗΣΗΣ"(Εικ. 24), θα εμφανιστεί ένα παράθυρο FUNCTION MASTER, η εμφάνιση του οποίου μοιάζει με το Excel 2003. Επίσης στο μενού μπορείτε να επιλέξετε αμέσως μια κατηγορία συναρτήσεων (πρόσφατα χρησιμοποιημένες, οικονομική, λογική, κείμενο, ημερομηνία και ώρα, μαθηματικές, άλλες συναρτήσεις) στις οποίες θα αναζητήσουμε τις επιθυμητές λειτουργία.

Αλλα χαρακτηριστικά Σύνδεσμοι και Πίνακες Μαθηματικός

Ρύζι. 24 Επιλογή συνάρτησης στο Excel 2007

Λειτουργία LINESTυπολογίζει στατιστικά στοιχεία για μια σειρά χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων για να υπολογίσει την ευθεία που προσεγγίζει καλύτερα τα διαθέσιμα δεδομένα και στη συνέχεια επιστρέφει έναν πίνακα που περιγράφει την ευθεία που προκύπτει. Μπορείτε επίσης να συνδυάσετε τη λειτουργία LINESTμε άλλες συναρτήσεις για τον υπολογισμό άλλων ειδών μοντέλων που είναι γραμμικά σε άγνωστες παραμέτρους (των οποίων οι άγνωστες παράμετροι είναι γραμμικές), συμπεριλαμβανομένων των σειρών πολυωνυμικών, λογαριθμικών, εκθετικών και ισχύος. Επειδή επιστρέφεται ένας πίνακας τιμών, η συνάρτηση πρέπει να καθοριστεί ως τύπος πίνακα.

Η εξίσωση για μια ευθεία γραμμή είναι:

(σε περίπτωση πολλών περιοχών τιμών x),

όπου η εξαρτημένη τιμή y είναι συνάρτηση της ανεξάρτητης τιμής x, οι τιμές m είναι οι συντελεστές που αντιστοιχούν σε κάθε ανεξάρτητη μεταβλητή x και το b είναι μια σταθερά. Σημειώστε ότι τα y, x και m μπορούν να είναι διανύσματα. Λειτουργία LINESTεπιστρέφει έναν πίνακα . LINESTμπορεί επίσης να επιστρέψει πρόσθετα στατιστικά στοιχεία παλινδρόμησης.

LINEST(γνωστές_τιμές_y; γνωστές_τιμές_x; const; στατιστικά)

Known_y_values ​​είναι το σύνολο των τιμών y που είναι ήδη γνωστά για τη σχέση.

Εάν ο πίνακας Known_y_values ​​έχει μία στήλη, τότε κάθε στήλη στον πίνακα known_x_values ​​αντιμετωπίζεται ως ξεχωριστή μεταβλητή.

Εάν ο πίνακας Known_y_values ​​έχει μία σειρά, τότε κάθε γραμμή στον πίνακα known_x_values ​​αντιμετωπίζεται ως ξεχωριστή μεταβλητή.

Το Known_x-values ​​είναι ένα προαιρετικό σύνολο τιμών x που είναι ήδη γνωστά για τη σχέση.

Ο πίνακας Known_x_values ​​μπορεί να περιέχει ένα ή περισσότερα σύνολα μεταβλητών. Εάν χρησιμοποιείται μόνο μία μεταβλητή, τότε οι πίνακες Known_y_values ​​και known_x_values ​​μπορούν να έχουν οποιοδήποτε σχήμα - αρκεί να έχουν την ίδια διάσταση. Εάν χρησιμοποιούνται περισσότερες από μία μεταβλητές, τότε το know_y_values ​​πρέπει να είναι διάνυσμα (δηλαδή, ένα διάστημα σε ύψος μίας γραμμής ή πλάτους μίας στήλης).

Εάν παραλειφθεί ο πίνακας_γνωστών_χ_τιμών, τότε ο πίνακας (1;2;3;...) θεωρείται ότι έχει το ίδιο μέγεθος με τον πίνακα_γνωστές_τιμές_y.

Το Const είναι μια δυαδική τιμή που καθορίζει εάν η σταθερά b απαιτείται να είναι ίση με 0.

Εάν το όρισμα "const" είναι TRUE ή παραλειφθεί, τότε η σταθερά b αξιολογείται ως συνήθως.

Εάν το όρισμα "const" είναι FALSE, τότε η τιμή του b ορίζεται στο 0 και οι τιμές του m επιλέγονται με τέτοιο τρόπο ώστε η σχέση να ικανοποιείται.

Στατιστικά - Μια δυαδική τιμή που καθορίζει εάν θα πρέπει να επιστραφούν πρόσθετα στατιστικά στοιχεία παλινδρόμησης.

Εάν τα στατιστικά στοιχεία είναι TRUE, το LINEST επιστρέφει επιπλέον στατιστικά στοιχεία παλινδρόμησης. Ο πίνακας που επιστρέφεται θα μοιάζει με αυτό: (mn;mn-1;...;m1;b:sen;sen-1;...;se1;seb:r2;sey:F;df:ssreg;ssresid).

Εάν τα στατιστικά στοιχεία είναι FALSE ή παραλείπονται, το LINEST επιστρέφει μόνο τους συντελεστές m και τη σταθερά b.

Πρόσθετα στατιστικά παλινδρόμησης.

Μέγεθος Περιγραφή se1,se2,...,sen Τυπικές τιμές σφάλματος για τους συντελεστές m1,m2,...,mn. seb Τυπική τιμή σφάλματος για τη σταθερά b (seb = #N/A εάν το const είναι FALSE). r2 Συντελεστής ντετερμινισμού. Συγκρίνονται οι πραγματικές τιμές του y και οι τιμές που λαμβάνονται από την εξίσωση της γραμμής. Με βάση τα αποτελέσματα σύγκρισης, υπολογίζεται ο συντελεστής ντετερμινισμού, κανονικοποιημένος από 0 σε 1. Εάν είναι ίσος με 1, τότε υπάρχει πλήρης συσχέτιση με το μοντέλο, δηλ. δεν υπάρχει διαφορά μεταξύ των πραγματικών και των εκτιμώμενων τιμών του υ. Στην αντίθετη περίπτωση, εάν ο συντελεστής προσδιορισμού είναι 0, δεν έχει νόημα η χρήση της εξίσωσης παλινδρόμησης για την πρόβλεψη των τιμών του y. Για περισσότερες πληροφορίες σχετικά με τον τρόπο υπολογισμού του r2, ανατρέξτε στις «Σημειώσεις» στο τέλος αυτής της ενότητας. sey Τυπικό σφάλμα για την εκτίμηση του y. φά F-statistic ή F-παρατηρούμενη τιμή. Η στατιστική F χρησιμοποιείται για να προσδιορίσει εάν μια παρατηρούμενη σχέση μεταξύ μιας εξαρτημένης και μιας ανεξάρτητης μεταβλητής οφείλεται στην τύχη. df Βαθμοί ελευθερίας. Οι βαθμοί ελευθερίας είναι χρήσιμοι για την εύρεση κρίσιμων τιμών F σε έναν στατιστικό πίνακα. Για να προσδιορίσετε το επίπεδο εμπιστοσύνης του μοντέλου, συγκρίνετε τις τιμές στον πίνακα με το στατιστικό F που επιστρέφεται από τη συνάρτηση LINEST. Για περισσότερες πληροφορίες σχετικά με τον υπολογισμό του df, δείτε τις «Σημειώσεις» στο τέλος αυτής της ενότητας. Το Παράδειγμα 4 παρακάτω δείχνει τη χρήση των τιμών F και df. ssreg Παλινδρόμηση τετραγώνων. ssresid Υπολειπόμενο άθροισμα τετραγώνων. Για περισσότερες πληροφορίες σχετικά με τον υπολογισμό του ssreg και του ssresid, δείτε τις «Σημειώσεις» στο τέλος αυτής της ενότητας.

Το παρακάτω σχήμα δείχνει τη σειρά με την οποία επιστρέφονται πρόσθετα στατιστικά στοιχεία παλινδρόμησης.

Σημειώσεις:

Οποιαδήποτε ευθεία μπορεί να περιγραφεί από την κλίση και την τομή της με τον άξονα y:

Κλίση (m): Για να προσδιορίσετε την κλίση μιας γραμμής, που συνήθως συμβολίζεται με m, παίρνετε δύο σημεία στη γραμμή και ; η κλίση θα είναι ίση .

Y-τομή (b): Η τομή y μιας ευθείας, που συνήθως συμβολίζεται με b, είναι η τιμή y για το σημείο στο οποίο η ευθεία τέμνει τον άξονα y.

Η εξίσωση της ευθείας έχει τη μορφή . Εάν οι τιμές των m και b είναι γνωστές, τότε οποιοδήποτε σημείο στη γραμμή μπορεί να υπολογιστεί αντικαθιστώντας τις τιμές του y ή του x στην εξίσωση. Μπορείτε επίσης να χρησιμοποιήσετε τη συνάρτηση TREND.

Εάν υπάρχει μόνο μία ανεξάρτητη μεταβλητή x, μπορείτε να λάβετε την κλίση και την τομή y απευθείας χρησιμοποιώντας τους ακόλουθους τύπους:

Κλίση: INDEX(LINEST(γνωστές_y_τιμές; γνωστές_x_τιμές); 1)

Τέμμα Y: INDEX(LINEST(γνωστές_τιμές_υ; γνωστές_χ_τιμές); 2)

Η ακρίβεια της προσέγγισης χρησιμοποιώντας την ευθεία γραμμή που υπολογίζεται από τη συνάρτηση LINEST εξαρτάται από το βαθμό διασποράς δεδομένων. Όσο πιο κοντά είναι τα δεδομένα σε μια ευθεία γραμμή, τόσο πιο ακριβές είναι το μοντέλο που χρησιμοποιείται από τη συνάρτηση LINEST. Η συνάρτηση LINEST χρησιμοποιεί ελάχιστα τετράγωνα για να καθορίσει την καλύτερη προσαρμογή στα δεδομένα. Όταν υπάρχει μόνο μία ανεξάρτητη μεταβλητή x, τα m και b υπολογίζονται χρησιμοποιώντας τους ακόλουθους τύπους:

όπου x και y είναι δείγματα μέσα, για παράδειγμα x = AVERAGE(γνωστά_x) και y = AVERAGE(γνωστά_y's).

Οι συναρτήσεις προσαρμογής LINEST και LGRFPRIBL μπορούν να υπολογίσουν την ευθεία γραμμή ή την εκθετική καμπύλη που ταιριάζει καλύτερα στα δεδομένα. Ωστόσο, δεν απαντούν στο ερώτημα ποιο από τα δύο αποτελέσματα είναι καταλληλότερο για την επίλυση του προβλήματος. Μπορείτε επίσης να αξιολογήσετε τη συνάρτηση TREND(γνωστών_y's; γνωστών_x's) για μια ευθεία γραμμή ή τη συνάρτηση GROW(γνωστών_y's; γνωστών_x's) για μια εκθετική καμπύλη. Αυτές οι συναρτήσεις, εκτός αν έχουν καθοριστεί new_x-values, επιστρέφουν έναν πίνακα υπολογισμένων τιμών y για τις πραγματικές x-values ​​κατά μήκος μιας γραμμής ή καμπύλης. Στη συνέχεια, μπορείτε να συγκρίνετε τις υπολογιζόμενες τιμές με τις πραγματικές τιμές. Μπορείτε επίσης να δημιουργήσετε γραφήματα για οπτική σύγκριση.

Κατά την εκτέλεση ανάλυσης παλινδρόμησης, το Microsoft Excel υπολογίζει, για κάθε σημείο, το τετράγωνο της διαφοράς μεταξύ της προβλεπόμενης τιμής y και της πραγματικής τιμής y. Το άθροισμα αυτών των τετραγωνικών διαφορών ονομάζεται υπολειπόμενο άθροισμα τετραγώνων (ssresid). Στη συνέχεια, το Microsoft Excel υπολογίζει το συνολικό άθροισμα των τετραγώνων (sstotal). Αν const = TRUE ή η τιμή αυτού του ορίσματος δεν προσδιορίζεται, το συνολικό άθροισμα των τετραγώνων θα είναι ίσο με το άθροισμα των τετραγώνων των διαφορών μεταξύ των πραγματικών τιμών y και των μέσων τιμών y. Όταν const = FALSE, το συνολικό άθροισμα των τετραγώνων θα είναι ίσο με το άθροισμα των τετραγώνων των πραγματικών τιμών y (χωρίς να αφαιρείται η μέση τιμή y από τη μερική τιμή y). Το άθροισμα της παλινδρόμησης των τετραγώνων μπορεί στη συνέχεια να υπολογιστεί ως εξής: ssreg = sstotal - ssresid. Όσο μικρότερο είναι το υπολειπόμενο άθροισμα των τετραγώνων, τόσο μεγαλύτερη είναι η τιμή του συντελεστή προσδιορισμού r2, ο οποίος δείχνει πόσο καλά η εξίσωση που προκύπτει με την ανάλυση παλινδρόμησης εξηγεί τις σχέσεις μεταξύ των μεταβλητών. Ο συντελεστής r2 είναι ίσος με ssreg/sstotal.

Σε ορισμένες περιπτώσεις, μία ή περισσότερες στήλες X (αφήστε τις τιμές Y και X να βρίσκονται σε στήλες) δεν έχουν πρόσθετη κατηγοριματική τιμή σε άλλες στήλες X. Με άλλα λόγια, η αφαίρεση μιας ή περισσότερων στηλών X μπορεί να έχει ως αποτέλεσμα τον υπολογισμό των τιμών Y με την ίδια ακρίβεια. Σε αυτήν την περίπτωση, οι πλεονάζουσες στήλες X θα εξαιρεθούν από το μοντέλο παλινδρόμησης. Αυτό το φαινόμενο ονομάζεται «συγγραμμικότητα» επειδή οι πλεονάζουσες στήλες του X μπορούν να αναπαρασταθούν ως το άθροισμα πολλών μη περιττών στηλών. Η συνάρτηση LINEST ελέγχει για συγγραμμικότητα και αφαιρεί τυχόν περιττές στήλες X από το μοντέλο παλινδρόμησης, εάν τις εντοπίσει. Οι στήλες X που αφαιρέθηκαν μπορούν να αναγνωριστούν στην έξοδο LINEST με συντελεστή 0 και με τιμή se 0. Η κατάργηση μιας ή περισσότερων στηλών ως περιττών αλλάζει την τιμή του df επειδή εξαρτάται από τον αριθμό των στηλών X που χρησιμοποιούνται πραγματικά για σκοπούς πρόβλεψης. Για περισσότερες πληροφορίες σχετικά με τον υπολογισμό του df, δείτε το Παράδειγμα 4 παρακάτω Όταν το df αλλάζει λόγω της αφαίρεσης περιττών στηλών, αλλάζουν και οι τιμές των sey και F. Δεν συνιστάται η συχνή χρήση συγγραμμικότητας. Ωστόσο, θα πρέπει να χρησιμοποιείται εάν ορισμένες στήλες Χ περιέχουν 0 ή 1 ως δείκτη που υποδεικνύει εάν το θέμα του πειράματος ανήκει σε μια ξεχωριστή ομάδα. Εάν const = TRUE ή δεν έχει καθοριστεί μια τιμή για αυτό το όρισμα, το LINEST εισάγει μια επιπλέον στήλη X για να μοντελοποιήσει το σημείο τομής. Εάν υπάρχει μια στήλη με τιμές 1 για άνδρες και 0 για γυναίκες και υπάρχει στήλη με τιμές 1 για γυναίκες και 0 για άνδρες, τότε η τελευταία στήλη αφαιρείται επειδή μπορούν να ληφθούν οι τιμές της από τη στήλη "ανδρικός δείκτης".

Ο υπολογισμός του df για περιπτώσεις όπου οι X στήλες δεν αφαιρούνται από το μοντέλο λόγω συγγραμμικότητας γίνεται ως εξής: εάν υπάρχουν k στήλες γνωστές_x και η τιμή const = TRUE ή δεν καθορίζεται, τότε df = n – k – 1. Αν const = FALSE, τότε df = n - k. Και στις δύο περιπτώσεις, η αφαίρεση των στηλών X λόγω συγγραμμικότητας αυξάνει την τιμή df κατά 1.

Οι τύποι που επιστρέφουν πίνακες πρέπει να εισαχθούν ως τύποι πίνακα.

Όταν εισάγετε έναν πίνακα σταθερών ως όρισμα, για παράδειγμα, known_x_values, θα πρέπει να χρησιμοποιήσετε ένα ερωτηματικό για να διαχωρίσετε τις τιμές στην ίδια γραμμή και μια άνω και κάτω τελεία για να διαχωρίσετε γραμμές. Οι διαχωριστικοί χαρακτήρες ενδέχεται να διαφέρουν ανάλογα με τις ρυθμίσεις στο παράθυρο Γλώσσα και Ρυθμίσεις στον Πίνακα Ελέγχου.

Θα πρέπει να σημειωθεί ότι οι τιμές y που προβλέπονται από την εξίσωση παλινδρόμησης μπορεί να μην είναι σωστές εάν βρίσκονται εκτός του εύρους των τιμών y που χρησιμοποιήθηκαν για τον ορισμό της εξίσωσης.

Βασικός αλγόριθμος που χρησιμοποιείται στη συνάρτηση LINEST, διαφέρει από τον αλγόριθμο της κύριας συνάρτησης ΚΛΙΝΩΚαι ΕΥΘΥΓΡΑΜΜΟ ΤΜΗΜΑ. Η διαφορά μεταξύ αλγορίθμων μπορεί να οδηγήσει σε διαφορετικά αποτελέσματα με αβέβαια και συγγραμμικά δεδομένα. Για παράδειγμα, εάν τα σημεία δεδομένων ορίσματος Known_y_values ​​είναι 0 και τα σημεία δεδομένων επιχειρήματος Known_x_values ​​είναι 1, τότε:

Λειτουργία LINESTεπιστρέφει τιμή ίση με 0. Αλγόριθμος συνάρτησης LINESTχρησιμοποιείται για την επιστροφή κατάλληλων τιμών για συγγραμμικά δεδομένα και σε αυτήν την περίπτωση μπορεί να βρεθεί τουλάχιστον μία απάντηση.

Οι συναρτήσεις SLOPE και LINE επιστρέφουν το σφάλμα #DIV/0! Ο αλγόριθμος των συναρτήσεων SLOPE και INTERCEPT χρησιμοποιείται για την εύρεση μόνο μιας απάντησης, αλλά στην περίπτωση αυτή μπορεί να υπάρχουν αρκετές.

Εκτός από τον υπολογισμό στατιστικών για άλλους τύπους παλινδρόμησης, το LINEST μπορεί να χρησιμοποιηθεί για τον υπολογισμό περιοχών για άλλους τύπους παλινδρόμησης, εισάγοντας συναρτήσεις των μεταβλητών x και y ως σειρές των μεταβλητών x και y για το LINEST. Για παράδειγμα, ο ακόλουθος τύπος:

LINEST(y_τιμές, x_values^COLUMN($A:$C))

λειτουργεί έχοντας μια στήλη τιμών Y και μια στήλη τιμών X για τον υπολογισμό μιας προσέγγισης κύβου (πολυώνυμο 3ου βαθμού) της ακόλουθης μορφής:

Ο τύπος μπορεί να τροποποιηθεί για τον υπολογισμό άλλων τύπων παλινδρόμησης, αλλά σε ορισμένες περιπτώσεις μπορεί να χρειαστεί να προσαρμοστούν οι τιμές εξόδου και άλλα στατιστικά στοιχεία.

Το πακέτο MS Excel σάς επιτρέπει να κάνετε το μεγαλύτερο μέρος της εργασίας πολύ γρήγορα όταν κατασκευάζετε μια εξίσωση γραμμικής παλινδρόμησης. Είναι σημαντικό να κατανοήσουμε πώς να ερμηνεύσουμε τα αποτελέσματα που λαμβάνονται. Για να δημιουργήσετε ένα μοντέλο παλινδρόμησης, πρέπει να επιλέξετε Tools\Data Analysis\Regression (στο Excel 2007 αυτή η λειτουργία βρίσκεται στο μπλοκ Data/Data Analysis/Regression). Στη συνέχεια, αντιγράψτε τα αποτελέσματα σε ένα μπλοκ για ανάλυση.

Αρχικά δεδομένα:

Αποτελέσματα ανάλυσης

Συμπεριλάβετε στην αναφορά
Υπολογισμός παραμέτρων εξίσωσης παλινδρόμησης
Θεωρητικό υλικό
Εξίσωση παλινδρόμησης σε τυπική κλίμακα
Συντελεστής πολλαπλής συσχέτισης (Δείκτης πολλαπλής συσχέτισης)
Μερικοί συντελεστές ελαστικότητας
Συγκριτική αξιολόγηση της επίδρασης των παραγόντων που αναλύθηκαν στο προκύπτον χαρακτηριστικό (d - συντελεστές χωριστού προσδιορισμού)

Έλεγχος της ποιότητας της κατασκευασμένης εξίσωσης παλινδρόμησης
Σημασία των συντελεστών παλινδρόμησης b i (t-statistics. Student's test)
Σημασία της εξίσωσης στο σύνολό της (F-statistics. Fisher's test). Συντελεστής προσδιορισμού
Μερικές δοκιμές F

Επίπεδο σημασίας 0.005 0.01 0.025 0.05 0.1 0.25 0.4