Σε αυτό το άρθρο περιγράφονται η σύνταξη τύπου και η χρήση της συνάρτησης LINEST στο Microsoft Excel.
Περιγραφή
Η συνάρτηση LINEST υπολογίζει τα στατιστικά στοιχεία για μια ευθεία χρησιμοποιώντας τη μέθοδο των "ελαχίστων τετραγώνων" για τον υπολογισμό μιας ευθείας γραμμής που εφαρμόζει καλύτερα στα δεδομένα σας και, στη συνέχεια, επιστρέφει έναν πίνακα που περιγράφει τη γραμμή. Επίσης, μπορείτε να συνδυάσετε τη συνάρτηση LINEST με άλλες συναρτήσεις για να υπολογίσετε στατιστικά στοιχεία για άλλους τύπους μοντέλων τα οποία έχουν γραμμική σχέση με τις άγνωστες παραμέτρους, όπως πολυωνυμική, λογαριθμική, εκθετική σειρά και δυναμοσειρά. Επειδή η συνάρτηση αυτή επιστρέφει έναν πίνακα τιμών, πρέπει να εισάγεται ως τύπος πίνακα. Σε αυτό το άρθρο, τα παραδείγματα ακολουθούνται από οδηγίες.
Η εξίσωση της ευθείας είναι:
y = mx + b
–ή–
y = m1x1 + m2x2 + ... + b
εάν υπάρχουν πολλές περιοχές τιμών x, όπου οι εξαρτημένες τιμές y είναι συνάρτηση των ανεξάρτητων τιμών x. Οι τιμές m είναι συντελεστές που αντιστοιχούν σε κάθε τιμή x, ενώ η b είναι μια σταθερά. Σημειώνεται ότι τα x, y και m μπορεί να είναι ανύσματα. Ο πίνακας που επιστρέφει η συνάρτηση LINEST είναι της μορφής {mn\mn-1\...\m1\b}. Η συνάρτηση LINEST μπορεί επίσης να επιστρέψει πρόσθετα στατιστικά στοιχεία παλινδρόμησης.
Σύνταξη
LINEST(γνωστά_y; [γνωστά_x]; [σταθερά]; [στατιστικές])
Η σύνταξη της συνάρτησης LINEST περιλαμβάνει τα παρακάτω ορίσματα:
Σύνταξη
-
γνωστά_y Υποχρεωτικό. Το σύνολο των γνωστών τιμών του y, στη σχέση y = mx + b.
-
Εάν η περιοχή του ορίσματος γνωστά_y έχει μία μόνο στήλη, κάθε στήλη του ορίσματος γνωστά_x θεωρείται ως ξεχωριστή μεταβλητή.
-
Εάν η περιοχή του ορίσματος γνωστά_y περιέχεται σε μία μόνο γραμμή, κάθε γραμμή του ορίσματος γνωστά_x θεωρείται ως ξεχωριστή μεταβλητή.
-
-
γνωστά_x Προαιρετικό. Ένα σύνολο γνωστών τιμών του x, στη σχέση y = mx + b.
-
Η περιοχή του ορίσματος γνωστά_x μπορεί να περιλαμβάνει ένα ή περισσότερα σύνολα μεταβλητών. Εάν χρησιμοποιείτε μόνο μία μεταβλητή, τα ορίσματα γνωστά_y και γνωστά_x μπορούν να είναι περιοχές οποιουδήποτε σχήματος, αρκεί να έχουν ίσες διαστάσεις. Εάν χρησιμοποιούνται περισσότερες από μία μεταβλητές, το όρισμα γνωστά_y πρέπει να είναι άνυσμα (δηλαδή, μια περιοχή με ύψος μίας μόνο γραμμής ή πλάτος μίας μόνο στήλης).
-
Εάν παραλειφθεί το όρισμα γνωστά_x, θεωρείται ίσο με έναν πίνακα {1\2\3\...} με μέγεθος ίδιο με του πίνακα γνωστά_y.
-
-
σταθερά Προαιρετικό. Μια λογική τιμή που καθορίζει εάν η σταθερά b θα θεωρηθεί ίση με το μηδέν.
-
Εάν το όρισμα σταθερά είναι TRUE ή παραλείπεται, η σταθερά b υπολογίζεται κανονικά.
-
Εάν το όρισμα σταθερά είναι FALSE, η σταθερά b θεωρείται ίση με το 0 και οι τιμές m αναπροσαρμόζονται, ώστε y = mx.
-
-
στατιστικές Προαιρετικό. Μια λογική τιμή που καθορίζει αν θα επιστραφούν πρόσθετα στατιστικά στοιχεία παλινδρόμησης.
-
Εάν το όρισμα στατιστικές είναι TRUE, η συνάρτηση LINEST επιστρέφει πρόσθετα στατιστικά στοιχεία παλινδρόμησης. ως αποτέλεσμα, ο επιστρεφόμενος πίνακας είναι {mn\mn-1,...,m1\b; sen,sen-1,...,se1,seb; r2,sey, F,df; ssreg, ssresid}.
-
Εάν το όρισμα στατιστικές είναι FALSE ή παραλείπεται, η συνάρτηση LINEST επιστρέφει μόνο τους συντελεστές m και τη σταθερά b.
Τα πρόσθετα στατιστικά στοιχεία παλινδρόμησης είναι τα ακόλουθα.
-
Στατιστική τιμή |
Περιγραφή |
---|---|
se1,se2,...,sen |
Οι τιμές τυπικού σφάλματος για τους συντελεστές m1,m2,...,mn. |
seb |
Η τιμή τυπικού σφάλματος για τη σταθερά b (seb = #Δ/Υ, όταν το όρισμα σταθερά είναι FALSE). |
r2 |
Ο συντελεστής προσδιορισμού. Συγκρίνει τις εκτιμώμενες και τις πραγματικές τιμές y και η τιμή του κυμαίνεται από 0 έως 1. Εάν ο συντελεστής προσδιορισμού είναι 1, υπάρχει πλήρης γραμμική συσχέτιση στο δείγμα — δηλαδή δεν υπάρχει διαφορά ανάμεσα στην υπολογισμένη τιμή y και την πραγματική τιμή y. Αντίθετα, αν ο συντελεστής προσδιορισμού είναι 0, η εξίσωση παλινδρόμησης δεν είναι χρήσιμη για την πρόβλεψη τιμών του y. Για πληροφορίες σχετικά με τον τρόπο υπολογισμού του2 , ανατρέξτε στις "Παρατηρήσεις", παρακάτω σε αυτό το θέμα. |
sey |
Το τυπικό σφάλμα εκτίμησης της τιμής του y. |
F |
Η στατιστική τιμή F ή η παρατηρούμενη τιμή F. Χρησιμοποιήστε τη στατιστική τιμή F για να καθορίσετε εάν υπάρχει τυχαία η παρατηρούμενη σχέση μεταξύ των εξαρτημένων και των ανεξάρτητων μεταβλητών. |
df |
Οι βαθμοί ελευθερίας. Χρησιμοποιήστε τους βαθμούς ελευθερίας για να βρείτε κρίσιμες τιμές F σε κάποιον στατιστικό πίνακα. Συγκρίνετε τις τιμές που θα βρείτε στον πίνακα, με τη στατιστική τιμή F που επιστρέφει η συνάρτηση LINEST για να καθορίσετε ένα επίπεδο εμπιστοσύνης για το μοντέλο. Για πληροφορίες σχετικά με τη μέθοδο υπολογισμού των βαθμών ελευθερίας df, δείτε τις "Παρατηρήσεις", στη συνέχεια του θέματος. Το παράδειγμα 4 δείχνει τον τρόπο χρήσης των τιμών F και df. |
ssreg |
Το παλινδρομικό άθροισμα των τετραγώνων. |
ssresid |
Το υπολειπόμενο άθροισμα των τετραγώνων. Για πληροφορίες σχετικά με τον τρόπο υπολογισμού των τιμών ssreg και ssresid, δείτε τις "Παρατηρήσεις", στη συνέχεια του θέματος. |
Η ακόλουθη απεικόνιση παρουσιάζει τη σειρά με την οποία επιστρέφονται τα πρόσθετα στατιστικά στοιχεία παλινδρόμησης.
Παρατηρήσεις
-
Μπορείτε να περιγράψετε μια ευθεία γραμμή με την κλίση της και το σημείο τομής με τον άξονα y:
Κλίση (m):
Για να βρείτε την κλίση μιας γραμμής, που συχνά γράφεται ως m, πάρτε δύο σημεία στη γραμμή, (x1,y1) και (x2,y2); η κλίση ισούται με (y2 - y1)/(x2 - x1).Τομή Y (β):
Το σημείο τομής y μιας γραμμής, που συχνά γράφεται ως b, είναι η τιμή του y στο σημείο όπου η γραμμή διασχίζει τον άξονα y.Η εξίσωση μιας ευθείας γραμμής είναι y = mx + b. Εφόσον γνωρίζετε τις τιμές των συντελεστών m και b, μπορείτε να υπολογίσετε οποιοδήποτε σημείο επάνω στην ευθεία, εισάγοντας στην εξίσωση την τιμή του y ή του x. Μπορείτε επίσης να χρησιμοποιήσετε τη συνάρτηση TREND.
-
Όταν έχετε μόνο μία ανεξάρτητη μεταβλητή x, μπορείτε να υπολογίσετε απευθείας τις τιμές της κλίσης και του σημείου τομής με τον άξονα y, χρησιμοποιώντας τους εξής τύπους:
Κλίση:
=INDEX(LINEST(known_y;known_x);1)Αναχαίτιση Y:
=INDEX(LINEST(known_y;known_x);2) -
Η ακρίβεια της ευθείας που υπολογίζεται από τη συνάρτηση LINEST εξαρτάται από το βαθμό διασποράς των δεδομένων σας. Όσο πιο γραμμικά είναι τα δεδομένα, τόσο ακριβέστερο είναι το μοντέλο της LINEST. Η συνάρτηση LINEST χρησιμοποιεί τη μέθοδο των ελαχίστων τετραγώνων για να προσδιορίσει τη βέλτιστη ευθεία για τα δεδομένα σας. Όταν έχετε μόνο μία ανεξάρτητη μεταβλητή x, οι υπολογισμοί των συντελεστών m και b βασίζονται στους εξής τύπους:
όπου x και y είναι οι μέσες τιμές δείγματος, δηλαδή, x = AVERAGE(γνωστά_x) και y = AVERAGE(γνωστά_y).
-
Η συνάρτηση προσαρμογής ευθείας LINEST και η συνάρτηση προσαρμογής καμπύλης LOGEST μπορούν να προσαρμόσουν τα δεδομένα σας σε ευθεία γραμμή ή εκθετική καμπύλη, αντίστοιχα. Πρέπει, ωστόσο, να αποφασίσετε ποιο από τα δύο αποτελέσματα έχει την καλύτερη προσαρμογή στα δεδομένα σας. Μπορείτε να υπολογίσετε τη συνάρτηση TREND(γνωστά_y;γνωστά_x) για ευθεία γραμμή ή τη συνάρτηση GROWTH(γνωστά_y, ;γνωστά_x) για εκθετική καμπύλη. Οι συναρτήσεις αυτές, χωρίς το όρισμα νέα_x, επιστρέφουν έναν πίνακα με τις προβλεπόμενες τιμές του y κατά μήκος της ευθείας ή της καμπύλης προσαρμογής στα σημεία των δεδομένων σας. Μπορείτε τότε να συγκρίνετε τις προβλεπόμενες τιμές με τις πραγματικές τιμές. Μπορείτε επίσης να συμπεριλάβετε τις τιμές αυτές σε ένα γράφημα, για οπτική σύγκριση.
-
Στην ανάλυση παλινδρόμησης, το Excel υπολογίζει σε κάθε σημείο το τετράγωνο της διαφοράς της εκτιμώμενης τιμής του y και της πραγματικής τιμής του y στο σημείο αυτό. Το άθροισμα των τετραγώνων αυτών των διαφορών λέγεται υπολειπόμενο άθροισμα των τετραγώνων, ssresid. Το Excel υπολογίζει στη συνέχεια το συνολικό άθροισμα των τετραγώνων, sstotal. Όταν το όρισμα σταθερά = TRUE ή παραλείπεται, το συνολικό άθροισμα των τετραγώνων είναι το άθροισμα των τετραγώνων των διαφορών μεταξύ των πραγματικών τιμών του y και του μέσου όρου των τιμών του y. Όταν το όρισμα σταθερά = FALSE, το συνολικό άθροισμα των τετραγώνων είναι το άθροισμα των τετραγώνων των πραγματικών τιμών y (χωρίς την αφαίρεση του μέσου όρου των τιμών του y από κάθε μεμονωμένη τιμή του y). Στη συνέχεια, το άθροισμα των τετραγώνων παλινδρόμησης, ssreg, μπορεί να υπολογιστεί από τον τύπο: ssreg = sstotal - ssresid. Όσο μικρότερο είναι το υπολειπόμενο άθροισμα των τετραγώνων, σε σύγκριση με το συνολικό άθροισμα των τετραγώνων, τόσο μεγαλύτερη είναι η τιμή του συντελεστή προσδιορισμού, r2, ο οποίος αποτελεί δείκτη του πόσο καλά η εξίσωση που προκύπτει από την ανάλυση παλινδρόμησης εξηγεί τη σχέση μεταξύ των μεταβλητών. Η τιμή του r2 ισούται με ssreg/sstotal.
-
Σε ορισμένες περιπτώσεις, μία ή περισσότερες από τις στήλες X (ας υποθέσουμε ότι τα Y και τα X βρίσκονται σε στήλες) ενδέχεται να μην έχουν πρόσθετη προγνωστική τιμή στην παρουσία των άλλων στηλών X. Με άλλα λόγια, η κατάργηση μίας ή περισσότερων στηλών X μπορεί να οδηγήσει σε προβλεπόμενες τιμές Y που είναι εξίσου ακριβείς. Σε αυτή την περίπτωση, αυτές οι περιττές στήλες X θα πρέπει να παραλειφθούν από το μοντέλο παλινδρόμησης. Αυτό το φαινόμενο ονομάζεται "collinearity" επειδή οποιαδήποτε περιττή στήλη X μπορεί να εκφραστεί ως άθροισμα πολλαπλών στοιχείων των μη περιττών στηλών X. Η συνάρτηση LINEST ελέγχει για συλλογικότητα και καταργεί τυχόν περιττές στήλες X από το μοντέλο παλινδρόμησης όταν τις προσδιορίζει. Οι στήλες X που καταργήθηκαν αναγνωρίζονται στο αποτέλεσμα της συνάρτησης LINEST ότι έχουν 0 συντελεστές εκτός από τις τιμές 0 se. Εάν μία ή περισσότερες στήλες καταργηθούν ως περιττές, η τιμή df επηρεάζεται επειδή η τιμή df εξαρτάται από τον αριθμό των στηλών X που χρησιμοποιούνται στην πραγματικότητα για προγνωστικούς σκοπούς. Για λεπτομέρειες σχετικά με τον υπολογισμό του df, ανατρέξτε στο Παράδειγμα 4. Εάν η τιμή df αλλάξει, επειδή καταργούνται οι περιττές στήλες X, επηρεάζονται επίσης οι τιμές sey και F. Η συλλογικότητα θα πρέπει να είναι σχετικά σπάνια στην πράξη. Ωστόσο, μία περίπτωση όπου είναι πιο πιθανό να προκύψει είναι όταν ορισμένες στήλες X περιέχουν μόνο 0 και 1 τιμές ως ενδείξεις για το αν ένα υποκείμενο σε ένα πείραμα είναι ή δεν είναι μέλος μιας συγκεκριμένης ομάδας. Εάν σταθερά = TRUE ή παραλειφθεί, η συνάρτηση LINEST εισάγει ουσιαστικά μια πρόσθετη στήλη X και των 1 τιμών για τη δημιουργία μοντέλου του σημείου τομής. Εάν έχετε μια στήλη με 1 για κάθε θέμα εάν είναι αρσενικό ή 0 εάν όχι, και έχετε επίσης μια στήλη με 1 για κάθε θέμα εάν είναι θηλυκό ή 0 εάν όχι, αυτή η δεύτερη στήλη είναι περιττή, επειδή οι καταχωρήσεις σε αυτήν μπορούν να ληφθούν από την αφαίρεση της καταχώρησης στη στήλη "αρσενικός δείκτης" από την καταχώρηση στην πρόσθετη στήλη και των 1 τιμών που προστέθηκαν από τη συνάρτηση LINEST .
-
Η τιμή df υπολογίζεται με τον παρακάτω τρόπο, όταν δεν καταργηθεί καμία στήλη X από το μοντέλο εξαιτίας της ύπαρξης συγγραμμικότητας: αν υπάρχουν k στήλες του ορίσματος γνωστά_x και το όρισμα σταθερά = TRUE ή παραλείπεται, τότε df = n – k – 1. Εάν το όρισμα σταθερά = FALSE, τότε df = n - k. Και στις δύο περιπτώσεις, κάθε στήλη X που καταργήθηκε εξαιτίας της ύπαρξης συγγραμμικότητας, αυξάνει την τιμή df κατά 1.
-
Όταν εισάγετε μια σταθερά πίνακα ως όρισμα (όπως το όρισμα γνωστά_x), χρησιμοποιήστε ανάστροφες καθέτους (\) για να διαχωρίσετε τιμές οι οποίες περιέχονται στην ίδια γραμμή και ερωτηματικά για να διαχωρίσετε γραμμές. Οι χαρακτήρες διαχωρισμού ενδέχεται να είναι διαφορετικοί ανάλογα με τις τοπικές ρυθμίσεις.
-
Ας σημειωθεί ότι οι τιμές του y που προβλέπει η εξίσωση παλινδρόμησης μπορεί να μην είναι έγκυρες αν βρίσκονται εκτός της περιοχής τιμών y που χρησιμοποιήσατε για τον προσδιορισμό της εξίσωσης.
-
Ο υποκείμενος αλγόριθμος που χρησιμοποιείται στη συνάρτηση LINEST είναι διαφορετικός από τον αλγόριθμο που χρησιμοποιείται στις συναρτήσεις SLOPE και INTERCEPT. Η διαφορά μεταξύ αυτών των αλγόριθμων μπορεί να οδηγήσει σε διαφορετικά αποτελέσματα όταν τα δεδομένα είναι απροσδιόριστα και συγγραμικά. Για παράδειγμα, αν τα σημεία δεδομένων του ορίσματος γνωστά_y είναι 0 και τα σημεία δεδομένων του ορίσματος γνωστά_x είναι 1:
-
Η συνάρτηση LINEST επιστρέφει τιμή 0. Ο αλγόριθμος της συνάρτησης LINEST έχει σχεδιαστεί για να επιστρέφει λογικά αποτελέσματα για συγγραμμικά δεδομένα και στη συγκεκριμένη περίπτωση μπορεί να βρεθεί τουλάχιστον μία απάντηση.
-
Οι συναρτήσεις SLOPE και INTERCEPT επιστρέφουν #ΔΙΑΙΡ./0! ως τιμή σφάλματος. Ο αλγόριθμος των συναρτήσεων SLOPE και INTERCEPT έχει σχεδιαστεί για την αναζήτηση μίας μόνο απάντησης και στην περίπτωση αυτή μπορεί να υπάρχουν περισσότερες από μία απαντήσεις.
-
-
Εκτός από τη χρήση της συνάρτησης LOGEST για τον υπολογισμό στατιστικών στοιχείων για άλλους τύπους παλινδρόμησης, μπορείτε να χρησιμοποιήσετε τη συνάρτηση LINEST για τον υπολογισμό μιας περιοχής άλλων τύπων παλινδρόμησης μέσω της εισαγωγής συναρτήσεων των μεταβλητών x και y ως σειρές x και y για τη συνάρτηση LINEST. Για παράδειγμα, ο ακόλουθος τύπος:
=LINEST(τιμέςy, τιμέςx^COLUMN($A:$C))
λειτουργεί όταν έχετε μια στήλη τιμών y και μία στήλη τιμών x για τον υπολογισμό της κυβικής προσέγγισης (πολυωνυμική βαθμού 3) της μορφής:
y = m1*x + m2*x^2 + m3*x^3 + b
Μπορείτε να προσαρμόσετε αυτόν τον τύπο για τον υπολογισμό άλλων τύπων παλινδρόμησης, αλλά, σε ορισμένες περιπτώσεις, απαιτείται η προσαρμογή των τιμών που προκύπτουν και των υπόλοιπων στατιστικών στοιχείων.
-
Η τιμή ελέγχου F που επιστρέφει η συνάρτηση LINEST διαφέρει από την τιμή ελέγχου F που επιστρέφει η συνάρτηση FTEST. Η συνάρτηση LINEST επιστρέφει τη στατιστική τιμή F, ενώ η συνάρτηση FTEST επιστρέφει την πιθανότητα.
Παραδείγματα
Παράδειγμα 1 - Κλίση και σημείο τομής στον άξονα y
Αντιγράψτε τα δεδομένα του παραδείγματος στον πίνακα που ακολουθεί και, στη συνέχεια, επικολλήστε τα στο κελί A1 ενός νέου φύλλου εργασίας του Excel. Για εμφανιστούν τα αποτελέσματα των τύπων, επιλέξτε τους, πατήστε το πλήκτρο F2 και, στη συνέχεια, πατήστε το πλήκτρο Enter. Εάν χρειαστεί, ρυθμίστε το πλάτος των στηλών για να βλέπετε όλα τα δεδομένα.
Γνωστό y |
Γνωστό x |
---|---|
1 |
0 |
9 |
4 |
5 |
2 |
7 |
3 |
Αποτέλεσμα (κλίση) |
Αποτέλεσμα (σημείο τομής y) |
2 |
1 |
Τύπος (τύπος πίνακα στα κελιά A7:B7) |
|
=LINEST(A2:A5;B2:B5;;FALSE) |
Παράδειγμα 2 - Απλή γραμμική παλινδρόμηση
Αντιγράψτε τα δεδομένα του παραδείγματος στον πίνακα που ακολουθεί και, στη συνέχεια, επικολλήστε τα στο κελί A1 ενός νέου φύλλου εργασίας του Excel. Για εμφανιστούν τα αποτελέσματα των τύπων, επιλέξτε τους, πατήστε το πλήκτρο F2 και, στη συνέχεια, πατήστε το πλήκτρο Enter. Εάν χρειαστεί, ρυθμίστε το πλάτος των στηλών για να βλέπετε όλα τα δεδομένα.
Μήνας |
Πωλήσεις |
---|---|
1 |
3.100 € |
2 |
4.500 € |
3 |
4.400 € |
4 |
5.400 € |
5 |
7.500 € |
6 |
8.100 € |
Τύπος |
Αποτέλεσμα |
=SUM(LINEST(B1:B6; A1:A6)*{9\1}) |
11.000 € |
Υπολογίζει τις εκτιμώμενες πωλήσεις τον ένατο μήνα, με βάση τις πωλήσεις των μηνών 1 έως 6. |
Παράδειγμα 3 - Πολλαπλή γραμμική παλινδρόμηση
Αντιγράψτε τα δεδομένα του παραδείγματος στον πίνακα που ακολουθεί και, στη συνέχεια, επικολλήστε τα στο κελί A1 ενός νέου φύλλου εργασίας του Excel. Για εμφανιστούν τα αποτελέσματα των τύπων, επιλέξτε τους, πατήστε το πλήκτρο F2 και, στη συνέχεια, πατήστε το πλήκτρο Enter. Εάν χρειαστεί, μπορείτε να ρυθμίσετε το πλάτος των στηλών για να βλέπετε όλα τα δεδομένα.
Έκταση ορόφου (x1) |
Γραφεία (x2) |
Είσοδοι (x3) |
Παλαιότητα (x4) |
Εκτιμώμενη αξία (y) |
---|---|---|---|---|
2310 |
2 |
2 |
20 |
142.000 € |
2333 |
2 |
2 |
12 |
144.000 € |
2356 |
3 |
1,5 |
33 |
151.000 € |
2379 |
3 |
2 |
43 |
150.000 € |
2402 |
2 |
3 |
53 |
139.000 € |
2425 |
4 |
2 |
23 |
169.000 € |
2448 |
2 |
1,5 |
99 |
126.000 € |
2471 |
2 |
2 |
34 |
142.900 € |
2494 |
3 |
3 |
23 |
163.000 € |
2517 |
4 |
4 |
55 |
169.000 € |
2540 |
2 |
3 |
22 |
149.000 € |
-234,2371645 |
||||
13,26801148 |
||||
0,996747993 |
||||
459,7536742 |
||||
1732393319 |
||||
Τύπος (τύπος δυναμικού πίνακα που καταχωρήθηκε στο A19) |
||||
=LINEST(E2:E12;A2:D12;TRUE;TRUE) |
Παράδειγμα 4 - Χρήση των στατιστικών στοιχείων F και r2
Στο προηγούμενο παράδειγμα, ο συντελεστής προσδιορισμού r2 είναι 0,99675 (βλέπε κελί A17 στο αποτέλεσμα της συνάρτησης LINEST), που θα μπορούσε να υποδηλώνει ισχυρή σχέση μεταξύ των ανεξάρτητων μεταβλητών και της τιμής πώλησης. Μπορείτε να χρησιμοποιήσετε τη στατιστική τιμή F για να προσδιορίσετε αν προέκυψε τυχαία ένα τέτοιο αποτέλεσμα με τόσο υψηλή τιμή του r2.
Ας υποθέσουμε, προς το παρόν, ότι δεν υπάρχει πραγματική σχέση μεταξύ των μεταβλητών, αλλά έχετε επιλέξει ένα σπάνιο δείγμα 11 κτιρίων γραφείων που έχει ως αποτέλεσμα η στατιστική ανάλυση να παρουσιάζει ισχυρό συσχετισμό. Ο όρος "Άλφα" χρησιμοποιείται για την πιθανότητα του εσφαλμένου συμπεράσματος ότι υπάρχει συσχετισμός.
Οι τιμές F και df που προκύπτουν από τη συνάρτηση LINEST μπορούν να χρησιμοποιηθούν για την εκτίμηση της πιθανότητας τυχαίας εμφάνισης υψηλότερης τιμής F. Η συνάρτηση F μπορεί να συγκριθεί με τις κρίσιμες τιμές σε δημοσιευμένους πίνακες κατανομής F ή η συνάρτηση FDIST στο Excel μπορεί να χρησιμοποιηθεί για τον υπολογισμό της πιθανότητας τυχαίας μεγαλύτερης τιμής F. Η κατάλληλη κατανομή F έχει βαθμούς ελευθερίας v1 και v2. Εάν n είναι ο αριθμός των σημείων δεδομένων και σταθερά = TRUE ή παραλείπεται, τότε v1 = n – df – 1 και v2 = df. (Εάν σταθερά = FALSE, τότε v1 = n – df και v2 = df.) Η συνάρτηση FDIST — με τη σύνταξη FDIST(F;v1;v2) — θα επιστρέψει τυχαία την πιθανότητα εμφάνισης υψηλότερης τιμής F. Σε αυτό το παράδειγμα, df = 6 (κελί B18) και F = 459,753674 (κελί A18).
Με την προϋπόθεση ότι η τιμή άλφα είναι 0,05, v1 = 11 – 6 – 1 = 4 και v2 = 6, το κρίσιμο επίπεδο της F είναι 4,53. Δεδομένου ότι F = 459,753674 είναι πολύ υψηλότερη από 4,53, είναι εξαιρετικά απίθανο ότι μια τιμή F αυτό το υψηλό συνέβη τυχαία. (Με άλφα = 0,05, η υπόθεση ότι δεν υπάρχει σχέση μεταξύ του known_y και του known_x είναι να απορριφθεί όταν το F υπερβαίνει το κρίσιμο επίπεδο, 4,53.) Μπορείτε να χρησιμοποιήσετε τη συνάρτηση FDIST στο Excel για να λάβετε την πιθανότητα να προκύψει τυχαία μια τόσο υψηλή τιμή F. Για παράδειγμα, FDIST(459,753674; 4; 6) = 1,37E-7, μια εξαιρετικά μικρή πιθανότητα. Μπορείτε να συμπεράνετε, είτε βρίσκοντας το κρίσιμο επίπεδο F σε έναν πίνακα είτε χρησιμοποιώντας τη συνάρτηση FDIST , ότι η εξίσωση παλινδρόμησης είναι χρήσιμη για την πρόβλεψη της εκτιμώμενης αξίας των κτιρίων γραφείων στην περιοχή αυτή. Να θυμάστε ότι είναι σημαντικό να χρησιμοποιήσετε τις σωστές τιμές των v1 και v2 που υπολογίστηκαν στην προηγούμενη παράγραφο.
Παράδειγμα 5 - Υπολογισμός της στατιστικής τιμής t
Ένας άλλος έλεγχος υποθέσεων θα καθορίσει κατά πόσο στον υπολογισμό της εκτιμώμενης αξίας του κτιρίου γραφείων στο παράδειγμα 3, είναι χρήσιμος κάθε συντελεστής κλίσης. Για παράδειγμα, για να ελέγξετε το συντελεστή παλαιότητας για τη στατιστική σημασία του, διαιρέστε την τιμή -234,24 (συντελεστής κλίσης παλαιότητας) με την τιμή 13,268 (το εκτιμώμενο τυπικό σφάλμα για τον συντελεστή παλαιότητας στο κελί A15). Η ακόλουθη είναι η παρατηρούμενη στατιστική τιμή t:
t = m4 ÷ se4 = -234,24 ÷ 13,268 = -17,7
Εάν η απόλυτη τιμή t είναι αρκετά υψηλή, μπορείτε να συμπεράνετε ότι ο συντελεστής κλίσης είναι χρήσιμος για τον υπολογισμό της εκτιμώμενης αξίας ενός κτιρίου γραφείων στο παράδειγμα 3. Στον παρακάτω πίνακα εμφανίζονται οι απόλυτες τιμές των 4 παρατηρούμενων τιμών t.
Εάν συμβουλευτείτε έναν πίνακα σε ένα εγχειρίδιο στατιστικής, θα βρείτε ότι η αμφίπλευρη κρίσιμη τιμή t, με 6 βαθμούς ελευθερίας και Άλφα = 0,05, είναι 2,447. Αυτή η κρίσιμη τιμή μπορεί επίσης να ληφθεί χρησιμοποιώντας τη συνάρτηση TINV του Excel. TINV(0,05;6) = 2,447. Επειδή η απόλυτη τιμή του t (17,7) είναι μεγαλύτερη από την κρίσιμη τιμή 2,447, η παλαιότητα είναι σημαντική για τον υπολογισμό της εκτιμώμενης αξίας του κτιρίου. Κάθε μια από τις υπόλοιπες ανεξάρτητες μεταβλητές μπορεί να ελεγχθεί, με ανάλογο τρόπο, για τη στατιστική σημασία της. Ακολουθούν οι παρατηρούμενες τιμές t για κάθε μια ανεξάρτητη μεταβλητή.
Μεταβλητή |
Παρατηρούμενη τιμή t |
---|---|
Έκταση ορόφου |
5,1 |
Αριθμός γραφείων |
31,3 |
Αριθμός εισόδων |
4,8 |
Παλαιότητα |
17,7 |
Οι τιμές αυτές έχουν όλες απόλυτη τιμή μεγαλύτερη από 2,447, επομένως, όλες οι μεταβλητές που χρησιμοποιούνται στην εξίσωση παλινδρόμησης είναι χρήσιμες για την πρόβλεψη της εκτιμώμενης αξίας των κτιρίων γραφείων στην περιοχή αυτή.