Μέση vs Μέση vs Κατάσταση
Ο μέσος όρος, ο διάμεσος και ο τρόπος είναι τα κύρια μέτρα μέτρησης της κεντρικής τάσης που χρησιμοποιούνται στην περιγραφική στατιστική. Είναι εντελώς διαφορετικά μεταξύ τους και οι περιπτώσεις στις οποίες χρησιμοποιούνται για τη σύνοψη των δεδομένων είναι επίσης διαφορετικές.
Μέση
Ο αριθμητικός μέσος όρος είναι το άθροισμα των τιμών δεδομένων διαιρεμένο με τον αριθμό των τιμών δεδομένων, π.χ.
[latex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Αν τα δεδομένα προέρχονται από ένα χώρο δειγμάτων, ονομάζεται μέσος όρος δείγματος ([latex]\bar{x} [/latex]), που είναι μια περιγραφική στατιστική του δείγματος. Αν και είναι το πιο συχνά χρησιμοποιούμενο περιγραφικό μέτρο για ένα δείγμα, δεν είναι ένα ισχυρό στατιστικό. Είναι πολύ ευαίσθητο στις ακραίες τιμές και τις ταλαντώσεις.
Για παράδειγμα, λάβετε υπόψη το μέσο εισόδημα των πολιτών μιας συγκεκριμένης πόλης. Δεδομένου ότι όλες οι τιμές δεδομένων αθροίζονται και στη συνέχεια διαιρούνται, το εισόδημα ενός εξαιρετικά πλούσιου ατόμου επηρεάζει σημαντικά τον μέσο όρο. Επομένως, οι μέσες τιμές δεν είναι πάντα καλή αναπαράσταση των δεδομένων.
Επίσης, στην περίπτωση ενός εναλλασσόμενου σήματος, το ρεύμα που διέρχεται από ένα στοιχείο ποικίλλει περιοδικά από τη θετική κατεύθυνση στην αρνητική κατεύθυνση και αντίστροφα. Αν πάρουμε το μέσο ρεύμα που διέρχεται από το στοιχείο σε μία μόνο περίοδο, θα δώσει 0, που σημαίνει ότι δεν έχει περάσει ρεύμα από το στοιχείο, κάτι που προφανώς δεν είναι αλήθεια. Επομένως, και σε αυτήν την περίπτωση, ο αριθμητικός μέσος όρος δεν είναι καλό μέτρο.
Ο αριθμητικός μέσος όρος είναι ένας καλός δείκτης όταν τα δεδομένα είναι ομοιόμορφα κατανεμημένα. Για μια κανονική κατανομή, ο μέσος όρος είναι ίσος με τον τρόπο και τον διάμεσο. Έχει επίσης τα χαμηλότερα υπολείμματα κατά την εξέταση του ριζικού μέσου τετραγώνου σφάλματος. ως εκ τούτου, το καλύτερο περιγραφικό μέτρο όταν απαιτείται η αναπαράσταση ενός συνόλου δεδομένων με έναν μόνο αριθμό.
Μέσος
Οι τιμές του μεσαίου σημείου δεδομένων μετά την ταξινόμηση όλων των τιμών δεδομένων σε αύξουσα σειρά ορίζονται ως η διάμεσος του συνόλου δεδομένων. Η διάμεσος είναι το 2ο τεταρτημόριο, το 5ο δεκαδικό και το 50ο εκατοστημόριο.
• Εάν ο αριθμός των παρατηρήσεων (σημεία δεδομένων) είναι μονός, τότε η διάμεσος είναι η παρατήρηση ακριβώς στη μέση της ταξινομημένης λίστας.
• Εάν ο αριθμός των παρατηρήσεων (σημεία δεδομένων) είναι άρτιος, τότε η διάμεσος είναι ο μέσος όρος των δύο μεσαίων παρατηρήσεων στη διατεταγμένη λίστα.
Η Η διάμεσος χωρίζει την παρατήρηση σε δύο ομάδες. δηλαδή μια ομάδα (50%) τιμών υψηλότερες και μια ομάδα (50%) τιμών χαμηλότερων από τη διάμεσο. Οι διάμεσοι χρησιμοποιούνται ειδικά σε λοξές κατανομές και αντιπροσωπεύουν δεδομένα αρκετά καλύτερα από τον αριθμητικό μέσο όρο.
Λειτουργία
Η λειτουργία είναι ο αριθμός που εμφανίζεται περισσότερο σε ένα σύνολο παρατηρήσεων. Η λειτουργία ενός συνόλου δεδομένων υπολογίζεται βρίσκοντας τη συχνότητα κάθε στοιχείου μέσα στο σύνολο.
• Εάν καμία τιμή δεν εμφανίζεται περισσότερες από μία φορές, τότε το σύνολο δεδομένων δεν έχει λειτουργία.
• Διαφορετικά, οποιαδήποτε τιμή εμφανίζεται με τη μεγαλύτερη συχνότητα είναι μια λειτουργία του συνόλου δεδομένων.
Μπορεί να υπάρχουν περισσότερες από 1 λειτουργίες σε ένα σύνολο. Επομένως, η λειτουργία δεν είναι ένα μοναδικό στατιστικό στοιχείο ενός συνόλου δεδομένων. Σε μια ομοιόμορφη κατανομή, υπάρχει ένας τρόπος. Ο τρόπος μιας διακριτής κατανομής πιθανότητας είναι το σημείο όπου η συνάρτηση μάζας πιθανότητας φτάνει στο υψηλότερο σημείο της. Αποδίδοντας από τις παραπάνω ερμηνείες, μπορούμε να πούμε ότι τα καθολικά μέγιστα είναι τρόποι.
Σκεφτείτε την εφαρμογή και των τριών μέτρων στο ακόλουθο σύνολο δεδομένων.
ΔΕΔΟΜΕΝΑ: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Μέσος όρος=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Διάμεσος=9 (13ο στοιχείο)
Λειτουργία=9 (συχνότητα 9=5)
Ποια είναι η διαφορά μεταξύ της μέσης τιμής, της διάμεσης και της λειτουργίας;
• Αριθμητικός μέσος όρος είναι το άθροισμα των τιμών (παρατηρήσεων) διαιρεμένο με τον αριθμό των παρατηρήσεων. Δεν είναι ένα ισχυρό στατιστικό στοιχείο και εξαρτάται σε μεγάλο βαθμό από τη φύση της κανονικής κατανομής εντός της εξεταζόμενης κατανομής. Ένα μόνο ακραίο στοιχείο μπορεί να προκαλέσει σημαντική μετατόπιση στη μέση τιμή που δίνει σχετικά παραπλανητικές τιμές. Η έννοια μπορεί να επεκταθεί σε γεωμετρικό μέσο, αρμονικό μέσο, σταθμισμένο μέσο και ούτω καθεξής.
• Η διάμεσος είναι οι μεσαίες τιμές του συνόλου των παρατηρήσεων και επηρεάζεται σχετικά λιγότερο από ακραίες τιμές. Μπορεί να δώσει μια καλή εκτίμηση ως συνοπτικό στατιστικό στοιχείο σε πολύ λοξές περιπτώσεις.
• Η λειτουργία είναι οι πιο κοινές τιμές παρατήρησης στο σύνολο δεδομένων. Εάν η κατανομή είναι θετική λοξή, η λειτουργία βρίσκεται αριστερά στη διάμεσο και, εάν είναι αρνητικά, η λειτουργία βρίσκεται ακριβώς στη διάμεσο.
• Εάν έχει θετική λοξή, ο μέσος όρος είναι ακριβώς στη διάμεσο. αν είναι αρνητικά λοξός ο μέσος όρος είναι στα αριστερά της διάμεσης.
• Στην κανονική κατανομή, και οι τρεις, ο μέσος όρος, ο τρόπος και ο διάμεσος είναι ίσοι.