Variance vs Covariance
Η διακύμανση και η συνδιακύμανση είναι δύο μέτρα που χρησιμοποιούνται στις στατιστικές. Η διακύμανση είναι ένα μέτρο της διασποράς των δεδομένων και η συνδιακύμανση υποδεικνύει το βαθμό μεταβολής δύο τυχαίων μεταβλητών μαζί. Η διακύμανση είναι μάλλον μια διαισθητική έννοια, αλλά η συνδιακύμανση ορίζεται μαθηματικά με όχι τόσο διαισθητικό στην αρχή.
Περισσότερα για το Variance
Η διακύμανση είναι ένα μέτρο διασποράς των δεδομένων από τη μέση τιμή της κατανομής. Λέει πόσο μακριά βρίσκονται τα σημεία δεδομένων από τον μέσο όρο της κατανομής. Είναι ένας από τους κύριους περιγραφείς της κατανομής πιθανοτήτων και μία από τις στιγμές της κατανομής. Επίσης, η διακύμανση είναι μια παράμετρος του πληθυσμού και η διακύμανση ενός δείγματος από τον πληθυσμό λειτουργεί ως εκτιμητής για τη διακύμανση του πληθυσμού. Από μια άποψη, ορίζεται ως το τετράγωνο της τυπικής απόκλισης.
Σε απλή γλώσσα, μπορεί να περιγραφεί ως ο μέσος όρος των τετραγώνων της απόστασης μεταξύ κάθε σημείου δεδομένων και του μέσου όρου της κατανομής. Ο παρακάτω τύπος χρησιμοποιείται για τον υπολογισμό της διακύμανσης.
Var(X)=E[(X-μ)2] για έναν πληθυσμό και
Var(X)=E[(X-‾x)2] για ένα δείγμα
Μπορεί να απλοποιηθεί περαιτέρω για να δώσει Var(X)=E[X2]-(E[X])2.
Το Variance έχει ορισμένες ιδιότητες υπογραφής και χρησιμοποιείται συχνά στα στατιστικά στοιχεία για να απλοποιήσει τη χρήση. Η διακύμανση είναι μη αρνητική γιατί είναι το τετράγωνο των αποστάσεων. Ωστόσο, το εύρος της διακύμανσης δεν περιορίζεται και εξαρτάται από τη συγκεκριμένη κατανομή. Η διακύμανση μιας σταθερής τυχαίας μεταβλητής είναι μηδέν και η διακύμανση δεν αλλάζει σε σχέση με μια παράμετρο τοποθεσίας.
Περισσότερα για τη Συνδιακύμανση
Στη στατιστική θεωρία, η συνδιακύμανση είναι ένα μέτρο του πόσο αλλάζουν δύο τυχαίες μεταβλητές μαζί. Με άλλα λόγια, η συνδιακύμανση είναι ένα μέτρο της ισχύος της συσχέτισης μεταξύ δύο τυχαίων μεταβλητών. Επίσης, μπορεί να θεωρηθεί ως γενίκευση της έννοιας της διακύμανσης δύο τυχαίων μεταβλητών.
Η συνδιακύμανση δύο τυχαίων μεταβλητών X και Y, οι οποίες κατανέμονται από κοινού με πεπερασμένη δεύτερη ορμή, είναι γνωστή ως σXY=E[(X-E[X])(Y-E[Υ])]. Από αυτό, η διακύμανση μπορεί να θεωρηθεί ως μια ειδική περίπτωση συνδιακύμανσης, όπου δύο μεταβλητές είναι ίδιες. Cov(X, X)=Var(X)
Με την κανονικοποίηση της συνδιακύμανσης, μπορεί να ληφθεί ο συντελεστής γραμμικής συσχέτισης ή ο συντελεστής συσχέτισης Pearson, ο οποίος ορίζεται ως ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Γραφικά, η συνδιακύμανση μεταξύ ενός ζεύγους σημείων δεδομένων μπορεί να θεωρηθεί ως η περιοχή του ορθογωνίου με τα σημεία δεδομένων στις απέναντι κορυφές. Μπορεί να ερμηνευθεί ως μέτρο του μεγέθους του διαχωρισμού μεταξύ των δύο σημείων δεδομένων. Λαμβάνοντας υπόψη τα ορθογώνια για ολόκληρο τον πληθυσμό, η επικάλυψη των ορθογωνίων που αντιστοιχούν σε όλα τα σημεία δεδομένων μπορεί να θεωρηθεί ως η ισχύς του διαχωρισμού. διακύμανση των δύο μεταβλητών. Η συνδιακύμανση είναι σε δύο διαστάσεις, λόγω δύο μεταβλητών, αλλά η απλοποίησή της σε μία μεταβλητή δίνει τη διακύμανση μιας μοναδικής ως διαχωρισμό σε μία διάσταση.
Ποια είναι η διαφορά μεταξύ Διακύμανσης και Συνδιακύμανσης;
• Η διακύμανση είναι το μέτρο της διασποράς/διασποράς σε έναν πληθυσμό ενώ η συνδιακύμανση θεωρείται ως μέτρο διακύμανσης δύο τυχαίων μεταβλητών ή η ισχύς της συσχέτισης.
• Η διακύμανση μπορεί να θεωρηθεί ως ειδική περίπτωση συνδιακύμανσης.
• Η διακύμανση και η συνδιακύμανση εξαρτώνται από το μέγεθος των τιμών των δεδομένων και δεν μπορούν να συγκριθούν. ως εκ τούτου, κανονικοποιούνται. Η συνδιακύμανση κανονικοποιείται στον συντελεστή συσχέτισης (διαιρείται με το γινόμενο των τυπικών αποκλίσεων των δύο τυχαίων μεταβλητών) και η διακύμανση κανονικοποιείται στην τυπική απόκλιση (λαμβάνοντας την τετραγωνική ρίζα)