Σπίτι · Συσκευές · Ο τύπος για τη διασπορά μιας τυχαίας μεταβλητής. Διακύμανση και τυπική απόκλιση

Ο τύπος για τη διασπορά μιας τυχαίας μεταβλητής. Διακύμανση και τυπική απόκλιση

Η διασπορά μιας τυχαίας μεταβλητής είναι ένα μέτρο της εξάπλωσης των τιμών αυτής της μεταβλητής. Μικρή διακύμανση σημαίνει ότι οι τιμές συγκεντρώνονται κοντά η μία στην άλλη. Μια μεγάλη διακύμανση υποδηλώνει έντονη διασπορά τιμών. Η έννοια της διασποράς μιας τυχαίας μεταβλητής χρησιμοποιείται στη στατιστική. Για παράδειγμα, εάν συγκρίνετε τη διακύμανση των τιμών δύο ποσοτήτων (όπως τα αποτελέσματα των παρατηρήσεων ανδρών και γυναικών ασθενών), μπορείτε να ελέγξετε τη σημασία κάποιας μεταβλητής. Η διακύμανση χρησιμοποιείται επίσης κατά τη δημιουργία στατιστικών μοντέλων, καθώς η μικρή διακύμανση μπορεί να είναι σημάδι ότι προσαρμόζετε υπερβολικά τις τιμές.

Βήματα

Δείγμα Υπολογισμός Διακύμανσης

  1. Καταγράψτε τις τιμές του δείγματος.Στις περισσότερες περιπτώσεις, μόνο δείγματα ορισμένων πληθυσμών είναι διαθέσιμα στους στατιστικολόγους. Για παράδειγμα, κατά κανόνα, οι στατιστικολόγοι δεν αναλύουν το κόστος διατήρησης του πληθυσμού όλων των αυτοκινήτων στη Ρωσία - αναλύουν ένα τυχαίο δείγμα πολλών χιλιάδων αυτοκινήτων. Ένα τέτοιο δείγμα θα βοηθήσει στον προσδιορισμό του μέσου κόστους ανά αυτοκίνητο, αλλά πιθανότατα η προκύπτουσα τιμή θα απέχει πολύ από την πραγματική.

    • Για παράδειγμα, ας αναλύσουμε τον αριθμό των ψωμιών που πωλούνται σε ένα καφέ σε 6 ημέρες, με τυχαία σειρά. Το δείγμα έχει την ακόλουθη μορφή: 17, 15, 23, 7, 9, 13. Αυτό είναι δείγμα, όχι πληθυσμός, επειδή δεν έχουμε δεδομένα για ψωμάκια που πωλούνται για κάθε μέρα που είναι ανοιχτό το καφέ.
    • Εάν σας δοθεί ένας πληθυσμός και όχι ένα δείγμα τιμών, μεταβείτε στην επόμενη ενότητα.
  2. Γράψτε τον τύπο για τον υπολογισμό της διακύμανσης του δείγματος.Η διασπορά είναι ένα μέτρο της διασποράς των τιμών κάποιας ποσότητας. Όσο πιο κοντά είναι η τιμή διασποράς στο μηδέν, τόσο πιο κοντά ομαδοποιούνται οι τιμές. Όταν εργάζεστε με ένα δείγμα τιμών, χρησιμοποιήστε τον ακόλουθο τύπο για να υπολογίσετε τη διακύμανση:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))-Χ) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2))είναι η διασπορά. Η διασπορά μετριέται σε τετράγωνες μονάδες.
    • x i (\displaystyle x_(i))- κάθε τιμή στο δείγμα.
    • x i (\displaystyle x_(i))πρέπει να αφαιρέσετε το x, να το τετραγωνίσετε και μετά να προσθέσετε τα αποτελέσματα.
    • x̅ – μέσος όρος δείγματος (μέσος όρος δείγματος).
    • n είναι ο αριθμός των τιμών στο δείγμα.
  3. Υπολογίστε τη μέση τιμή του δείγματος.Συμβολίζεται ως x̅. Ο μέσος όρος του δείγματος υπολογίζεται όπως ένας κανονικός αριθμητικός μέσος όρος: αθροίστε όλες τις τιμές στο δείγμα και, στη συνέχεια, διαιρέστε το αποτέλεσμα με τον αριθμό των τιμών στο δείγμα.

    • Στο παράδειγμά μας, προσθέστε τις τιμές στο δείγμα: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Τώρα διαιρέστε το αποτέλεσμα με τον αριθμό των τιμών στο δείγμα (στο παράδειγμά μας υπάρχουν 6): 84 ÷ 6 = 14.
      Μέσος όρος δείγματος x = 14.
    • Ο μέσος όρος του δείγματος είναι η κεντρική τιμή γύρω από την οποία κατανέμονται οι τιμές στο δείγμα. Εάν οι τιμές στο δείγμα συγκεντρώνονται γύρω από τη μέση τιμή του δείγματος, τότε η απόκλιση είναι μικρή. Διαφορετικά, η διασπορά είναι μεγάλη.
  4. Αφαιρέστε τη μέση τιμή του δείγματος από κάθε τιμή στο δείγμα.Τώρα υπολογίστε τη διαφορά x i (\displaystyle x_(i))- x̅, όπου x i (\displaystyle x_(i))- κάθε τιμή στο δείγμα. Κάθε αποτέλεσμα που προκύπτει υποδεικνύει τον βαθμό στον οποίο μια συγκεκριμένη τιμή αποκλίνει από τη μέση τιμή του δείγματος, δηλαδή πόσο απέχει αυτή η τιμή από τη μέση τιμή του δείγματος.

    • Στο παράδειγμά μας:
      x 1 (\displaystyle x_(1))- x̅ = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x̅ = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Η ορθότητα των αποτελεσμάτων που λαμβάνονται είναι εύκολο να επαληθευτεί, αφού το άθροισμά τους πρέπει να είναι ίσο με μηδέν. Αυτό σχετίζεται με τον προσδιορισμό της μέσης τιμής, καθώς οι αρνητικές τιμές (αποστάσεις από τη μέση τιμή σε μικρότερες τιμές) αντισταθμίζονται πλήρως από θετικές τιμές (αποστάσεις από τη μέση τιμή σε μεγαλύτερες τιμές).
  5. Όπως σημειώθηκε παραπάνω, το άθροισμα των διαφορών x i (\displaystyle x_(i))- Το x πρέπει να είναι ίσο με μηδέν. Αυτό σημαίνει ότι η μέση διακύμανση είναι πάντα μηδέν, κάτι που δεν δίνει καμία ιδέα για την εξάπλωση των τιμών κάποιας ποσότητας. Για να λύσετε αυτό το πρόβλημα, τετραγωνίστε κάθε διαφορά x i (\displaystyle x_(i))- Χ. Αυτό θα έχει ως αποτέλεσμα να λαμβάνετε μόνο θετικούς αριθμούς οι οποίοι, όταν προστεθούν μαζί, δεν θα αθροιστούν ποτέ μέχρι το 0.

    • Στο παράδειγμά μας:
      (x 1 (\displaystyle x_(1))-Χ) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))-Χ) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Βρήκατε το τετράγωνο της διαφοράς - x̅) 2 (\displaystyle ^(2))για κάθε τιμή στο δείγμα.
  6. Υπολογίστε το άθροισμα των τετραγωνικών διαφορών.Δηλαδή, βρείτε το μέρος του τύπου που γράφεται ως εξής: ∑[( x i (\displaystyle x_(i))-Χ) 2 (\displaystyle ^(2))]. Εδώ το πρόσημο Σ σημαίνει το άθροισμα των τετραγωνικών διαφορών για κάθε τιμή x i (\displaystyle x_(i))στο δείγμα. Έχετε ήδη βρει τις τετραγωνισμένες διαφορές (x i (\displaystyle (x_(i))-Χ) 2 (\displaystyle ^(2))για κάθε τιμή x i (\displaystyle x_(i))στο δείγμα? τώρα απλά προσθέστε αυτά τα τετράγωνα.

    • Στο παράδειγμά μας: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Διαιρέστε το αποτέλεσμα με n - 1, όπου n είναι ο αριθμός των τιμών στο δείγμα.Πριν από λίγο καιρό, για να υπολογίσουν τη διακύμανση του δείγματος, οι στατιστικολόγοι απλώς διαίρεσαν το αποτέλεσμα με το n. Σε αυτή την περίπτωση, θα λάβετε τον μέσο όρο της τετραγωνικής διακύμανσης, ο οποίος είναι ιδανικός για την περιγραφή της διακύμανσης ενός δεδομένου δείγματος. Αλλά να θυμάστε ότι οποιοδήποτε δείγμα είναι μόνο ένα μικρό μέρος του γενικού πληθυσμού των αξιών. Εάν πάρετε διαφορετικό δείγμα και κάνετε τους ίδιους υπολογισμούς, θα έχετε διαφορετικό αποτέλεσμα. Όπως αποδεικνύεται, η διαίρεση με το n - 1 (και όχι μόνο με το n) δίνει μια καλύτερη εκτίμηση της διακύμανσης του πληθυσμού, που είναι αυτό που αναζητάτε. Η διαίρεση με n - 1 έχει γίνει συνηθισμένη, επομένως περιλαμβάνεται στον τύπο για τον υπολογισμό της διακύμανσης του δείγματος.

    • Στο παράδειγμά μας, το δείγμα περιλαμβάνει 6 τιμές, δηλαδή n = 6.
      Διακύμανση δείγματος = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Η διαφορά μεταξύ της διακύμανσης και της τυπικής απόκλισης.Σημειώστε ότι ο τύπος περιέχει έναν εκθέτη, επομένως η διακύμανση μετράται σε τετραγωνικές μονάδες της αναλυόμενης τιμής. Μερικές φορές μια τέτοια τιμή είναι αρκετά δύσκολο να λειτουργήσει. Σε τέτοιες περιπτώσεις, χρησιμοποιείται η τυπική απόκλιση, η οποία είναι ίση με την τετραγωνική ρίζα της διακύμανσης. Αυτός είναι ο λόγος για τον οποίο η διακύμανση του δείγματος συμβολίζεται ως s 2 (\displaystyle s^(2)), και η τυπική απόκλιση του δείγματος ως s (\displaystyle s).

    • Στο παράδειγμά μας, η τυπική απόκλιση του δείγματος είναι: s = √33,2 = 5,76.

    Υπολογισμός διασποράς πληθυσμού

    1. Αναλύστε κάποιο σύνολο τιμών.Το σετ περιλαμβάνει όλες τις αξίες της υπό εξέταση ποσότητας. Για παράδειγμα, εάν μελετάτε την ηλικία των κατοίκων της περιοχής του Λένινγκραντ, τότε ο πληθυσμός περιλαμβάνει την ηλικία όλων των κατοίκων αυτής της περιοχής. Σε περίπτωση εργασίας με ένα σύνολο, συνιστάται να δημιουργήσετε έναν πίνακα και να εισαγάγετε τις τιμές του αθροίσματος σε αυτόν. Εξετάστε το ακόλουθο παράδειγμα:

      • Υπάρχουν 6 ενυδρεία σε ένα συγκεκριμένο δωμάτιο. Κάθε ενυδρείο περιέχει τον ακόλουθο αριθμό ψαριών:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Γράψτε τον τύπο για τον υπολογισμό της διακύμανσης του πληθυσμού.Δεδομένου ότι ο πληθυσμός περιλαμβάνει όλες τις τιμές μιας συγκεκριμένης ποσότητας, ο ακόλουθος τύπος σας επιτρέπει να λάβετε την ακριβή τιμή της διακύμανσης του πληθυσμού. Για να διακρίνουν τη διακύμανση του πληθυσμού από τη διακύμανση του δείγματος (η οποία είναι μόνο μια εκτίμηση), οι στατιστικολόγοι χρησιμοποιούν διάφορες μεταβλητές:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n
      • σ 2 (\displaystyle ^(2))- διακύμανση πληθυσμού (διαβάζεται ως "Sigma Squared"). Η διασπορά μετριέται σε τετράγωνες μονάδες.
      • x i (\displaystyle x_(i))- κάθε τιμή στο σύνολο.
      • Το Σ είναι το πρόσημο του αθροίσματος. Δηλαδή για κάθε τιμή x i (\displaystyle x_(i))αφαιρέστε το μ, το τετραγωνίστε και μετά προσθέστε τα αποτελέσματα.
      • μ είναι ο μέσος όρος του πληθυσμού.
      • n είναι ο αριθμός των τιμών στο γενικό πληθυσμό.
    3. Υπολογίστε τον μέσο πληθυσμό.Όταν εργάζεστε με τον γενικό πληθυσμό, η μέση τιμή του συμβολίζεται ως μ (mu). Ο μέσος όρος πληθυσμού υπολογίζεται ως ο συνηθισμένος αριθμητικός μέσος όρος: αθροίστε όλες τις τιμές στον πληθυσμό και, στη συνέχεια, διαιρέστε το αποτέλεσμα με τον αριθμό των τιμών στον πληθυσμό.

      • Λάβετε υπόψη ότι οι μέσοι όροι δεν υπολογίζονται πάντα ως αριθμητικός μέσος όρος.
      • Στο παράδειγμά μας, η μέση τιμή πληθυσμού: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Αφαιρέστε τη μέση τιμή του πληθυσμού από κάθε τιμή του πληθυσμού.Όσο πιο κοντά είναι η τιμή της διαφοράς στο μηδέν, τόσο πιο κοντά είναι η συγκεκριμένη τιμή στη μέση τιμή του πληθυσμού. Βρείτε τη διαφορά μεταξύ κάθε τιμής στον πληθυσμό και του μέσου όρου της και θα ρίξετε μια πρώτη ματιά στην κατανομή των τιμών.

      • Στο παράδειγμά μας:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Τετράγωνο κάθε αποτέλεσμα που παίρνετε.Οι τιμές διαφοράς θα είναι θετικές και αρνητικές. αν βάλετε αυτές τις τιμές σε μια αριθμητική γραμμή, τότε θα βρίσκονται δεξιά και αριστερά του μέσου όρου του πληθυσμού. Αυτό δεν είναι καλό για τον υπολογισμό της διακύμανσης, καθώς οι θετικοί και οι αρνητικοί αριθμοί αλληλοεξουδετερώνονται. Επομένως, τετραγωνίστε κάθε διαφορά για να λάβετε αποκλειστικά θετικούς αριθμούς.

      • Στο παράδειγμά μας:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))για κάθε τιμή πληθυσμού (από i = 1 έως i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Οπου x n (\displaystyle x_(n))είναι η τελευταία τιμή στον πληθυσμό.
      • Για να υπολογίσετε τη μέση τιμή των αποτελεσμάτων που προέκυψαν, πρέπει να βρείτε το άθροισμά τους και να το διαιρέσετε με το n: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Τώρα ας γράψουμε την παραπάνω εξήγηση χρησιμοποιώντας μεταβλητές: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n και λάβετε έναν τύπο για τον υπολογισμό της διακύμανσης του πληθυσμού.

Εύρος παραλλαγής (ή εύρος παραλλαγής) -είναι η διαφορά μεταξύ της μέγιστης και της ελάχιστης τιμής του χαρακτηριστικού:

Στο παράδειγμά μας, το εύρος διακύμανσης της παραγωγής εργαζομένων με βάρδια είναι: στην πρώτη ταξιαρχία R=105-95=10 παιδιά, στη δεύτερη ταξιαρχία R=125-75=50 παιδιά. (5 φορές περισσότερο). Αυτό υποδηλώνει ότι η παραγωγή της 1ης ταξιαρχίας είναι πιο «σταθερή», αλλά η δεύτερη ταξιαρχία έχει περισσότερα αποθέματα για την αύξηση της παραγωγής, επειδή. εάν όλοι οι εργαζόμενοι φτάσουν τη μέγιστη απόδοση για αυτήν την ταξιαρχία, μπορεί να παράγει 3 * 125 = 375 εξαρτήματα και στην 1η ταξιαρχία μόνο 105 * 3 = 315 μέρη.
Εάν οι ακραίες τιμές του χαρακτηριστικού δεν είναι τυπικές για τον πληθυσμό, τότε χρησιμοποιούνται τεταρτημόρια ή δεκαδικά εύρη. Το εύρος τεταρτημορίων RQ= Q3-Q1 καλύπτει το 50% του πληθυσμού, το πρώτο εύρος δεκατιανών RD1 = D9-D1 καλύπτει το 80% των δεδομένων, το δεύτερο εύρος δεκατιανών RD2= D8-D2 καλύπτει το 60%.
Το μειονέκτημα του δείκτη εύρους διακύμανσης είναι, αλλά ότι η τιμή του δεν αντικατοπτρίζει όλες τις διακυμάνσεις του χαρακτηριστικού.
Ο απλούστερος γενικευτικός δείκτης που αντανακλά όλες τις διακυμάνσεις ενός χαρακτηριστικού είναι μέση γραμμική απόκλιση, που είναι ο αριθμητικός μέσος όρος των απόλυτων αποκλίσεων των επιμέρους επιλογών από τη μέση τιμή τους:

,
για ομαδοποιημένα δεδομένα
,
όπου хi είναι η τιμή ενός χαρακτηριστικού σε μια διακριτή σειρά ή το μέσο ενός διαστήματος σε μια κατανομή διαστήματος.
Στους παραπάνω τύπους, οι διαφορές στον αριθμητή λαμβάνονται modulo, διαφορετικά, σύμφωνα με την ιδιότητα του αριθμητικού μέσου όρου, ο αριθμητής θα είναι πάντα ίσος με μηδέν. Επομένως, η μέση γραμμική απόκλιση χρησιμοποιείται σπάνια στη στατιστική πρακτική, μόνο σε εκείνες τις περιπτώσεις όπου η άθροιση των δεικτών χωρίς να ληφθεί υπόψη το πρόσημο έχει οικονομική λογική. Με τη βοήθειά του, για παράδειγμα, αναλύεται η σύνθεση των εργαζομένων, η κερδοφορία της παραγωγής και ο κύκλος εργασιών του εξωτερικού εμπορίου.
Διακύμανση χαρακτηριστικώνείναι το μέσο τετράγωνο των αποκλίσεων της παραλλαγής από τη μέση τιμή τους:
απλή διακύμανση
,
σταθμισμένη διακύμανση
.
Ο τύπος για τον υπολογισμό της διακύμανσης μπορεί να απλοποιηθεί:

Έτσι, η διακύμανση είναι ίση με τη διαφορά μεταξύ του μέσου όρου των τετραγώνων της παραλλαγής και του τετραγώνου του μέσου όρου της παραλλαγής του πληθυσμού:
.
Ωστόσο, λόγω του αθροίσματος των τετραγωνικών αποκλίσεων, η διακύμανση δίνει μια παραμορφωμένη ιδέα των αποκλίσεων, επομένως ο μέσος όρος υπολογίζεται από αυτήν. τυπική απόκλιση, το οποίο δείχνει πόσο οι συγκεκριμένες παραλλαγές του χαρακτηριστικού αποκλίνουν κατά μέσο όρο από τη μέση τιμή τους. Υπολογίζεται λαμβάνοντας την τετραγωνική ρίζα της διακύμανσης:
για μη ομαδοποιημένα δεδομένα
,
για τη σειρά παραλλαγής

Όσο μικρότερη είναι η τιμή της διακύμανσης και η τυπική απόκλιση, όσο πιο ομοιογενής είναι ο πληθυσμός, τόσο πιο αξιόπιστη (τυπική) θα είναι η μέση τιμή.
Η μέση γραμμική και η μέση τετραγωνική απόκλιση ονομάζονται αριθμοί, δηλ. εκφράζονται σε μονάδες μέτρησης του χαρακτηριστικού, είναι πανομοιότυπα ως προς το περιεχόμενο και κοντά σε τιμή.
Συνιστάται ο υπολογισμός των απόλυτων δεικτών διακύμανσης χρησιμοποιώντας πίνακες.
Πίνακας 3 - Υπολογισμός των χαρακτηριστικών διακύμανσης (στο παράδειγμα της περιόδου δεδομένων για την παραγωγή βάρδιας των ομάδων εργασίας)


Αριθμός εργαζομένων

Το μέσο του διαστήματος

Εκτιμώμενες τιμές

Σύνολο:

Μέση μετατόπιση παραγωγής εργαζομένων:

Μέση γραμμική απόκλιση:

Διασπορά εξόδου:

Η τυπική απόκλιση της παραγωγής μεμονωμένων εργαζομένων από τη μέση παραγωγή:
.

1 Υπολογισμός της διασποράς με τη μέθοδο των ροπών

Ο υπολογισμός των αποκλίσεων σχετίζεται με δυσκίνητους υπολογισμούς (ειδικά αν ο μέσος όρος εκφράζεται ως μεγάλος αριθμός με πολλά δεκαδικά ψηφία). Οι υπολογισμοί μπορούν να απλοποιηθούν χρησιμοποιώντας έναν απλοποιημένο τύπο και ιδιότητες διασποράς.
Η διασπορά έχει τις ακόλουθες ιδιότητες:

  1. εάν όλες οι τιμές του χαρακτηριστικού μειωθούν ή αυξηθούν κατά την ίδια τιμή Α, τότε η διακύμανση δεν θα μειωθεί από αυτό:

,

, τότε ή
Χρησιμοποιώντας τις ιδιότητες της διακύμανσης και πρώτα μειώνοντας όλες τις παραλλαγές του πληθυσμού με την τιμή A και στη συνέχεια διαιρώντας με την τιμή του διαστήματος h, λαμβάνουμε έναν τύπο για τον υπολογισμό της διακύμανσης σε μεταβλητές σειρές με ίσα διαστήματα τρόπος στιγμών:
,
πού υπολογίζεται η διασπορά με τη μέθοδο των ροπών;
h είναι η τιμή του διαστήματος της σειράς μεταβολών.
– νέες (μετασχηματισμένες) τιμές παραλλαγής.
Το A είναι μια σταθερή τιμή, η οποία χρησιμοποιείται ως το μέσο του διαστήματος με την υψηλότερη συχνότητα. ή την παραλλαγή με την υψηλότερη συχνότητα.
είναι το τετράγωνο της στιγμής της πρώτης τάξης.
είναι μια στιγμή δεύτερης τάξης.
Ας υπολογίσουμε τη διακύμανση με τη μέθοδο των ροπών με βάση τα δεδομένα για την έξοδο μετατόπισης της ομάδας εργασίας.
Πίνακας 4 - Υπολογισμός διασποράς με τη μέθοδο των ροπών


Ομάδες εργατών παραγωγής, τεμ.

Αριθμός εργαζομένων

Το μέσο του διαστήματος

Εκτιμώμενες τιμές

Διαδικασία υπολογισμού:


  1. υπολογίστε τη διακύμανση:

2 Υπολογισμός της διακύμανσης ενός εναλλακτικού χαρακτηριστικού

Μεταξύ των ζωδίων που μελετήθηκαν από τις στατιστικές, υπάρχουν εκείνα που έχουν μόνο δύο αμοιβαία αποκλειστικές έννοιες. Αυτά είναι εναλλακτικά σημάδια. Τους δίνονται δύο ποσοτικές τιμές, αντίστοιχα: επιλογές 1 και 0. Η συχνότητα των επιλογών 1, που συμβολίζεται με p, είναι η αναλογία των μονάδων που έχουν αυτό το χαρακτηριστικό. Η διαφορά 1-p=q είναι η συχνότητα των επιλογών 0. Έτσι,


xi

Αριθμητικός μέσος όρος εναλλακτικού χαρακτηριστικού
, αφού p+q=1.

Διακύμανση χαρακτηριστικών
, επειδή 1-p=q
Έτσι, η διακύμανση ενός εναλλακτικού χαρακτηριστικού είναι ίση με το γινόμενο της αναλογίας των μονάδων που έχουν αυτό το χαρακτηριστικό και του ποσοστού των μονάδων που δεν έχουν αυτό το χαρακτηριστικό.
Εάν οι τιμές 1 και 0 είναι εξίσου συχνές, δηλαδή p=q, η διακύμανση φτάνει στο μέγιστο pq=0,25.
Η μεταβλητή διακύμανσης χρησιμοποιείται σε δειγματοληπτικές έρευνες, για παράδειγμα, η ποιότητα του προϊόντος.

3 Διασπορά μεταξύ ομάδων. Κανόνας προσθήκης διακύμανσης

Η διασπορά, σε αντίθεση με άλλα χαρακτηριστικά παραλλαγής, είναι μια αθροιστική ποσότητα. Δηλαδή στο άθροισμα, το οποίο χωρίζεται σε ομάδες σύμφωνα με το κριτήριο του παράγοντα Χ , προκύπτουσα διακύμανση yμπορεί να αποσυντεθεί σε διακύμανση εντός κάθε ομάδας (εντός ομάδας) και διακύμανση μεταξύ ομάδων (μεταξύ ομάδας). Στη συνέχεια, παράλληλα με τη μελέτη της διακύμανσης του χαρακτηριστικού σε ολόκληρο τον πληθυσμό ως σύνολο, καθίσταται δυνατή η μελέτη της παραλλαγής σε κάθε ομάδα, καθώς και μεταξύ αυτών των ομάδων.

Συνολική διακύμανσημετρά την παραλλαγή ενός χαρακτηριστικού στοσε ολόκληρο τον πληθυσμό υπό την επίδραση όλων των παραγόντων που προκάλεσαν αυτή τη διακύμανση (αποκλίσεις). Είναι ίσο με το μέσο τετράγωνο των αποκλίσεων των επιμέρους τιμών του χαρακτηριστικού στοτου συνολικού μέσου όρου και μπορεί να υπολογιστεί ως απλή ή σταθμισμένη διακύμανση.
Διαομαδική διακύμανσηχαρακτηρίζει την παραλλαγή του αποτελεσματικού χαρακτηριστικού στο, που προκαλείται από την επιρροή του παράγοντα πρόσημου Χκάτω από την ομαδοποίηση. Χαρακτηρίζει τη διακύμανση των μέσων της ομάδας και ισούται με το μέσο τετράγωνο των αποκλίσεων των μέσων της ομάδας από το συνολικό μέσο όρο:
,
πού είναι ο αριθμητικός μέσος όρος της i-ης ομάδας;
– αριθμός μονάδων της i-ης ομάδας (συχνότητα της i-ης ομάδας).
είναι ο συνολικός μέσος όρος του πληθυσμού.
Διακύμανση εντός ομάδαςαντικατοπτρίζει την τυχαία διακύμανση, δηλαδή εκείνο το μέρος της παραλλαγής που προκαλείται από την επίδραση μη λογιστικών παραγόντων και δεν εξαρτάται από το χαρακτηριστικό-παράγοντα που βρίσκεται κάτω από την ομαδοποίηση. Χαρακτηρίζει τη διακύμανση των μεμονωμένων τιμών σε σχέση με τους μέσους όρους της ομάδας, είναι ίσος με το μέσο τετράγωνο των αποκλίσεων των μεμονωμένων τιμών του χαρακτηριστικού στοεντός μιας ομάδας από τον αριθμητικό μέσο όρο αυτής της ομάδας (μέσος όρος ομάδας) και υπολογίζεται ως απλή ή σταθμισμένη διακύμανση για κάθε ομάδα:
ή ,
πού είναι ο αριθμός των μονάδων στην ομάδα.
Με βάση τις διακυμάνσεις εντός της ομάδας για κάθε ομάδα, είναι δυνατός ο προσδιορισμός ο συνολικός μέσος όρος των διακυμάνσεων εντός της ομάδας:
.
Η σχέση μεταξύ των τριών διακυμάνσεων ονομάζεται κανόνες προσθήκης διακύμανσης, σύμφωνα με την οποία η συνολική διακύμανση ισούται με το άθροισμα της διαομαδικής διακύμανσης και του μέσου όρου των ενδοομαδικών διακυμάνσεων:

Παράδειγμα. Κατά τη μελέτη της επιρροής της δασμολογικής κατηγορίας (προσόντα) των εργαζομένων στο επίπεδο παραγωγικότητας της εργασίας τους, προέκυψαν τα ακόλουθα δεδομένα.
Πίνακας 5 - Κατανομή εργαζομένων κατά μέση ωριαία παραγωγή.



p/p

Εργάτες 4ης κατηγορίας

Εργάτες 5ης κατηγορίας

Εκτέλεση
εργάτης, τεμ.,

Εκτέλεση
εργάτης, τεμ.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

Σε αυτό το παράδειγμα, οι εργαζόμενοι χωρίζονται σε δύο ομάδες ανάλογα με τον παράγοντα Χ- προσόντα, τα οποία χαρακτηρίζονται από τον βαθμό τους. Το αποτελεσματικό χαρακτηριστικό - παραγωγή - ποικίλλει τόσο υπό την επιρροή του (intergroup variation) όσο και λόγω άλλων τυχαίων παραγόντων (intragroup variation). Η πρόκληση είναι να μετρηθούν αυτές οι παραλλαγές χρησιμοποιώντας τρεις διακυμάνσεις: σύνολο, μεταξύ ομάδας και εντός ομάδας. Ο εμπειρικός συντελεστής προσδιορισμού δείχνει την αναλογία της διακύμανσης του προκύπτοντος χαρακτηριστικού στουπό την επίδραση ενός παραγοντικού σημείου Χ. Η υπόλοιπη συνολική παραλλαγή στοπροκαλείται από αλλαγές σε άλλους παράγοντες.
Στο παράδειγμα, ο εμπειρικός συντελεστής προσδιορισμού είναι:
ή 66,7%,
Αυτό σημαίνει ότι το 66,7% της διακύμανσης στην παραγωγικότητα της εργασίας των εργαζομένων οφείλεται σε διαφορές στα προσόντα και το 33,3% στην επίδραση άλλων παραγόντων.
Εμπειρική σχέση συσχέτισηςδείχνει τη στενότητα της σχέσης μεταξύ της ομαδοποίησης και των αποτελεσματικών χαρακτηριστικών. Υπολογίζεται ως η τετραγωνική ρίζα του εμπειρικού συντελεστή προσδιορισμού:

Η εμπειρική αναλογία συσχέτισης, καθώς και το , μπορεί να πάρει τιμές από 0 έως 1.
Εάν δεν υπάρχει σύνδεση, τότε =0. Σε αυτήν την περίπτωση, =0, δηλαδή, τα μέσα της ομάδας είναι ίσα μεταξύ τους και δεν υπάρχει διαομαδική παραλλαγή. Αυτό σημαίνει ότι το σύμβολο ομαδοποίησης - ο παράγοντας δεν επηρεάζει το σχηματισμό της γενικής παραλλαγής.
Εάν η σχέση είναι λειτουργική, τότε =1. Σε αυτήν την περίπτωση, η διακύμανση των μέσων της ομάδας είναι ίση με τη συνολική διακύμανση (), δηλαδή, δεν υπάρχει διακύμανση εντός της ομάδας. Αυτό σημαίνει ότι το χαρακτηριστικό ομαδοποίησης καθορίζει πλήρως την παραλλαγή του προκύπτοντος χαρακτηριστικού που μελετάται.
Όσο πιο κοντά είναι η τιμή της σχέσης συσχέτισης στο ένα, τόσο πιο κοντά, πιο κοντά στη λειτουργική εξάρτηση, η σχέση μεταξύ των χαρακτηριστικών.
Για μια ποιοτική αξιολόγηση της εγγύτητας της σύνδεσης μεταξύ των ζωδίων, χρησιμοποιούνται οι σχέσεις Chaddock.

Στο παράδειγμα , που υποδηλώνει στενή σχέση μεταξύ της παραγωγικότητας των εργαζομένων και των προσόντων τους.

Η μαθηματική προσδοκία και η διακύμανση είναι τα πιο συχνά χρησιμοποιούμενα αριθμητικά χαρακτηριστικά μιας τυχαίας μεταβλητής. Χαρακτηρίζουν τα πιο σημαντικά χαρακτηριστικά της κατανομής: τη θέση και τον βαθμό διασποράς της. Σε πολλά προβλήματα πρακτικής, μια πλήρης, εξαντλητική περιγραφή μιας τυχαίας μεταβλητής - ο νόμος της κατανομής - είτε δεν μπορεί να ληφθεί καθόλου, είτε δεν χρειάζεται καθόλου. Σε αυτές τις περιπτώσεις, περιορίζονται σε μια κατά προσέγγιση περιγραφή μιας τυχαίας μεταβλητής χρησιμοποιώντας αριθμητικά χαρακτηριστικά.

Η μαθηματική προσδοκία συχνά αναφέρεται απλώς ως η μέση τιμή μιας τυχαίας μεταβλητής. Η διασπορά μιας τυχαίας μεταβλητής είναι ένα χαρακτηριστικό της διασποράς, η διασπορά μιας τυχαίας μεταβλητής γύρω από τις μαθηματικές προσδοκίες της.

Μαθηματική προσδοκία μιας διακριτής τυχαίας μεταβλητής

Ας προσεγγίσουμε την έννοια της μαθηματικής προσδοκίας, προχωρώντας πρώτα από τη μηχανική ερμηνεία της κατανομής μιας διακριτής τυχαίας μεταβλητής. Αφήστε τη μοναδιαία μάζα να κατανεμηθεί μεταξύ των σημείων του άξονα x Χ1 , Χ 2 , ..., Χ n, και κάθε υλικό σημείο έχει μια μάζα που αντιστοιχεί σε αυτό από Π1 , Π 2 , ..., Π n. Απαιτείται η επιλογή ενός σημείου στον άξονα x, το οποίο χαρακτηρίζει τη θέση ολόκληρου του συστήματος των υλικών σημείων, λαμβάνοντας υπόψη τις μάζες τους. Είναι φυσικό να λαμβάνεται ως τέτοιο σημείο το κέντρο μάζας του συστήματος των υλικών σημείων. Αυτός είναι ο σταθμισμένος μέσος όρος της τυχαίας μεταβλητής Χ, στην οποία η τετμημένη κάθε σημείου ΧΕγώμπαίνει με «βάρος» ίσο με την αντίστοιχη πιθανότητα. Η μέση τιμή της τυχαίας μεταβλητής που προκύπτει έτσι Χονομάζεται μαθηματική προσδοκία του.

Η μαθηματική προσδοκία μιας διακριτής τυχαίας μεταβλητής είναι το άθροισμα των γινομένων όλων των πιθανών τιμών της και οι πιθανότητες αυτών των τιμών:

Παράδειγμα 1Διοργανώθηκε κλήρωση win-win. Υπάρχουν 1000 κέρδη, 400 από τα οποία είναι 10 ρούβλια το καθένα. 300 - 20 ρούβλια το καθένα 200 - 100 ρούβλια το καθένα. και 100 - 200 ρούβλια το καθένα. Ποιος είναι ο μέσος όρος των κερδών για ένα άτομο που αγοράζει ένα εισιτήριο;

Λύση. Θα βρούμε τη μέση νίκη αν το συνολικό ποσό των κερδών, που είναι ίσο με 10*400 + 20*300 + 100*200 + 200*100 = 50.000 ρούβλια, διαιρεθεί με το 1000 (το συνολικό ποσό των κερδών). Στη συνέχεια παίρνουμε 50000/1000 = 50 ρούβλια. Αλλά η έκφραση για τον υπολογισμό του μέσου κέρδους μπορεί επίσης να αναπαρασταθεί με την ακόλουθη μορφή:

Από την άλλη πλευρά, υπό αυτές τις συνθήκες, το ποσό των κερδών είναι μια τυχαία μεταβλητή που μπορεί να λάβει τις τιμές των 10, 20, 100 και 200 ​​ρούβλια. με πιθανότητες ίσες με 0,4, αντίστοιχα. 0,3; 0,2; 0.1. Επομένως, η αναμενόμενη μέση απόδοση ισούται με το άθροισμα των προϊόντων του μεγέθους των πληρωμών και της πιθανότητας λήψης τους.

Παράδειγμα 2Ο εκδότης αποφάσισε να εκδώσει ένα νέο βιβλίο. Πρόκειται να πουλήσει το βιβλίο για 280 ρούβλια, από τα οποία τα 200 θα του δοθούν, τα 50 στο βιβλιοπωλείο και τα 30 στον συγγραφέα. Ο πίνακας παρέχει πληροφορίες σχετικά με το κόστος έκδοσης ενός βιβλίου και την πιθανότητα πώλησης ενός συγκεκριμένου αριθμού αντιτύπων του βιβλίου.

Βρείτε το αναμενόμενο κέρδος του εκδότη.

Λύση. Η τυχαία μεταβλητή «κέρδος» ισούται με τη διαφορά μεταξύ των εσόδων από την πώληση και του κόστους των δαπανών. Για παράδειγμα, εάν πωληθούν 500 αντίτυπα ενός βιβλίου, τότε τα έσοδα από την πώληση είναι 200 ​​* 500 = 100.000 και το κόστος έκδοσης είναι 225.000 ρούβλια. Έτσι, ο εκδότης αντιμετωπίζει απώλεια 125.000 ρούβλια. Ο παρακάτω πίνακας συνοψίζει τις αναμενόμενες τιμές της τυχαίας μεταβλητής - κέρδος:

ΑριθμόςΚέρδος ΧΕγώ Πιθανότητα ΠΕγώ ΧΕγώ ΠΕγώ
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Σύνολο: 1,00 25000

Έτσι, λαμβάνουμε τη μαθηματική προσδοκία του κέρδους του εκδότη:

.

Παράδειγμα 3Ευκαιρία να χτυπήσει με ένα σουτ Π= 0,2. Προσδιορίστε την κατανάλωση κελύφους που παρέχουν τη μαθηματική προσδοκία του αριθμού των χτυπημάτων ίσο με 5.

Λύση. Από τον ίδιο τύπο προσδοκίας που χρησιμοποιήσαμε μέχρι τώρα, εκφραζόμαστε Χ- κατανάλωση κοχυλιών:

.

Παράδειγμα 4Προσδιορίστε τη μαθηματική προσδοκία μιας τυχαίας μεταβλητής Χαριθμός χτυπημάτων με τρεις βολές, εάν η πιθανότητα να χτυπηθεί με κάθε βολή Π = 0,4 .

Συμβουλή: βρείτε την πιθανότητα των τιμών μιας τυχαίας μεταβλητής κατά Φόρμουλα Bernoulli .

Ιδιότητες προσδοκίας

Εξετάστε τις ιδιότητες της μαθηματικής προσδοκίας.

Ιδιοκτησία 1.Η μαθηματική προσδοκία μιας σταθερής τιμής είναι ίση με αυτήν τη σταθερά:

Ιδιοκτησία 2.Ο σταθερός παράγοντας μπορεί να αφαιρεθεί από το σημάδι της προσδοκίας:

Ιδιοκτησία 3.Η μαθηματική προσδοκία του αθροίσματος (διαφορά) των τυχαίων μεταβλητών είναι ίση με το άθροισμα (διαφορά) των μαθηματικών προσδοκιών τους:

Ιδιοκτησία 4.Η μαθηματική προσδοκία του γινομένου των τυχαίων μεταβλητών είναι ίση με το γινόμενο των μαθηματικών προσδοκιών τους:

Ιδιοκτησία 5.Εάν όλες οι τιμές της τυχαίας μεταβλητής Χμείωση (αύξηση) κατά τον ίδιο αριθμό ΜΕ, τότε η μαθηματική του προσδοκία θα μειωθεί (αυξηθεί) κατά τον ίδιο αριθμό:

Όταν δεν μπορείς να περιοριστείς μόνο στη μαθηματική προσδοκία

Στις περισσότερες περιπτώσεις, μόνο η μαθηματική προσδοκία δεν μπορεί να χαρακτηρίσει επαρκώς μια τυχαία μεταβλητή.

Έστω τυχαίες μεταβλητές ΧΚαι Υδίνονται από τους ακόλουθους νόμους διανομής:

Εννοια Χ Πιθανότητα
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Εννοια Υ Πιθανότητα
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Οι μαθηματικές προσδοκίες αυτών των μεγεθών είναι οι ίδιες - ίσες με μηδέν:

Ωστόσο, η κατανομή τους είναι διαφορετική. Τυχαία τιμή Χμπορεί να λάβει μόνο τιμές που διαφέρουν ελάχιστα από τη μαθηματική προσδοκία και την τυχαία μεταβλητή Υμπορεί να λάβει τιμές που αποκλίνουν σημαντικά από τις μαθηματικές προσδοκίες. Παρόμοιο παράδειγμα: ο μέσος μισθός δεν επιτρέπει να κριθεί η αναλογία των εργαζομένων με υψηλή και χαμηλή αμοιβή. Με άλλα λόγια, με μαθηματική προσδοκία δεν μπορεί κανείς να κρίνει ποιες αποκλίσεις από αυτήν, τουλάχιστον κατά μέσο όρο, είναι δυνατές. Για να γίνει αυτό, πρέπει να βρείτε τη διακύμανση μιας τυχαίας μεταβλητής.

Διασπορά μιας διακριτής τυχαίας μεταβλητής

διασποράδιακριτή τυχαία μεταβλητή Χονομάζεται μαθηματική προσδοκία του τετραγώνου της απόκλισής του από τη μαθηματική προσδοκία:

Η τυπική απόκλιση μιας τυχαίας μεταβλητής Χείναι η αριθμητική τιμή της τετραγωνικής ρίζας της διακύμανσής της:

.

Παράδειγμα 5Υπολογίστε τις διακυμάνσεις και τις τυπικές αποκλίσεις τυχαίων μεταβλητών ΧΚαι Υ, του οποίου οι νόμοι κατανομής δίνονται στους παραπάνω πίνακες.

Λύση. Μαθηματικές προσδοκίες τυχαίων μεταβλητών ΧΚαι Υ, όπως βρέθηκε παραπάνω, ισούνται με μηδέν. Σύμφωνα με τον τύπο διασποράς για μι(Χ)=μι(y)=0 παίρνουμε:

Στη συνέχεια οι τυπικές αποκλίσεις των τυχαίων μεταβλητών ΧΚαι Υαπαρτίζω

.

Έτσι, με τις ίδιες μαθηματικές προσδοκίες, η διακύμανση της τυχαίας μεταβλητής Χπολύ μικρό και τυχαίο Υ- σημαντική. Αυτό είναι συνέπεια της διαφοράς στην κατανομή τους.

Παράδειγμα 6Ο επενδυτής έχει 4 εναλλακτικά επενδυτικά σχέδια. Ο πίνακας συνοψίζει τα στοιχεία για το αναμενόμενο κέρδος σε αυτά τα έργα με την αντίστοιχη πιθανότητα.

Έργο 1Έργο 2Έργο 3Έργο 4
500, Π=1 1000, Π=0,5 500, Π=0,5 500, Π=0,5
0, Π=0,5 1000, Π=0,25 10500, Π=0,25
0, Π=0,25 9500, Π=0,25

Βρείτε για κάθε εναλλακτική τη μαθηματική προσδοκία, τη διακύμανση και την τυπική απόκλιση.

Λύση. Ας δείξουμε πώς υπολογίζονται αυτές οι ποσότητες για την 3η εναλλακτική:

Ο πίνακας συνοψίζει τις τιμές που βρέθηκαν για όλες τις εναλλακτικές.

Όλες οι εναλλακτικές έχουν την ίδια μαθηματική προσδοκία. Αυτό σημαίνει ότι μακροπρόθεσμα όλοι έχουν το ίδιο εισόδημα. Η τυπική απόκλιση μπορεί να ερμηνευθεί ως μέτρο κινδύνου - όσο μεγαλύτερη είναι, τόσο μεγαλύτερος είναι ο κίνδυνος της επένδυσης. Ένας επενδυτής που δεν θέλει πολύ ρίσκο θα επιλέξει το έργο 1 επειδή έχει τη μικρότερη τυπική απόκλιση (0). Εάν ο επενδυτής προτιμά τον κίνδυνο και τις υψηλές αποδόσεις σε σύντομο χρονικό διάστημα, τότε θα επιλέξει το έργο με τη μεγαλύτερη τυπική απόκλιση - έργο 4.

Ιδιότητες διασποράς

Ας παρουσιάσουμε τις ιδιότητες της διασποράς.

Ιδιοκτησία 1.Η διασπορά μιας σταθερής τιμής είναι μηδέν:

Ιδιοκτησία 2.Ο σταθερός παράγοντας μπορεί να αφαιρεθεί από το πρόσημο διασποράς τετραγωνίζοντάς τον:

.

Ιδιοκτησία 3.Η διακύμανση μιας τυχαίας μεταβλητής είναι ίση με τη μαθηματική προσδοκία του τετραγώνου αυτής της τιμής, από την οποία αφαιρείται το τετράγωνο της μαθηματικής προσδοκίας της ίδιας της τιμής:

,

Οπου .

Ιδιοκτησία 4.Η διακύμανση του αθροίσματος (διαφορά) των τυχαίων μεταβλητών είναι ίση με το άθροισμα (διαφορά) των διακυμάνσεων τους:

Παράδειγμα 7Είναι γνωστό ότι μια διακριτή τυχαία μεταβλητή Χπαίρνει μόνο δύο τιμές: −3 και 7. Επιπλέον, η μαθηματική προσδοκία είναι γνωστή: μι(Χ) = 4 . Βρείτε τη διακύμανση μιας διακριτής τυχαίας μεταβλητής.

Λύση. Σημειώστε με Πτην πιθανότητα με την οποία μια τυχαία μεταβλητή παίρνει μια τιμή Χ1 = −3 . Τότε η πιθανότητα της τιμής Χ2 = 7 θα είναι 1 − Π. Ας εξαγάγουμε την εξίσωση για τη μαθηματική προσδοκία:

μι(Χ) = Χ 1 Π + Χ 2 (1 − Π) = −3Π + 7(1 − Π) = 4 ,

όπου παίρνουμε τις πιθανότητες: Π= 0,3 και 1 − Π = 0,7 .

Ο νόμος της κατανομής μιας τυχαίας μεταβλητής:

Χ −3 7
Π 0,3 0,7

Υπολογίζουμε τη διακύμανση αυτής της τυχαίας μεταβλητής χρησιμοποιώντας τον τύπο από την ιδιότητα 3 της διακύμανσης:

ρε(Χ) = 2,7 + 34,3 − 16 = 21 .

Βρείτε μόνοι σας τη μαθηματική προσδοκία μιας τυχαίας μεταβλητής και μετά δείτε τη λύση

Παράδειγμα 8Διακριτή τυχαία μεταβλητή Χπαίρνει μόνο δύο τιμές. Παίρνει τη μεγαλύτερη τιμή του 3 με πιθανότητα 0,4. Επιπλέον, η διακύμανση της τυχαίας μεταβλητής είναι γνωστή ρε(Χ) = 6 . Βρείτε τη μαθηματική προσδοκία μιας τυχαίας μεταβλητής.

Παράδειγμα 9Ένα δοχείο περιέχει 6 άσπρες και 4 μαύρες μπάλες. Λαμβάνονται 3 μπάλες από το δοχείο. Ο αριθμός των λευκών σφαιρών μεταξύ των συρόμενων σφαιρών είναι μια διακριτή τυχαία μεταβλητή Χ. Βρείτε τη μαθηματική προσδοκία και τη διακύμανση αυτής της τυχαίας μεταβλητής.

Λύση. Τυχαία τιμή Χμπορεί να πάρει τις τιμές 0, 1, 2, 3. Οι αντίστοιχες πιθανότητες μπορούν να υπολογιστούν από κανόνας πολλαπλασιασμού των πιθανοτήτων. Ο νόμος της κατανομής μιας τυχαίας μεταβλητής:

Χ 0 1 2 3
Π 1/30 3/10 1/2 1/6

Εξ ου και η μαθηματική προσδοκία αυτής της τυχαίας μεταβλητής:

Μ(Χ) = 3/10 + 1 + 1/2 = 1,8 .

Η διακύμανση μιας δεδομένης τυχαίας μεταβλητής είναι:

ρε(Χ) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Μαθηματική προσδοκία και διασπορά συνεχούς τυχαίας μεταβλητής

Για μια συνεχή τυχαία μεταβλητή, η μηχανική ερμηνεία της μαθηματικής προσδοκίας θα διατηρήσει την ίδια σημασία: το κέντρο μάζας για μια μονάδα μάζας που κατανέμεται συνεχώς στον άξονα x με πυκνότητα φά(Χ). Σε αντίθεση με μια διακριτή τυχαία μεταβλητή, για την οποία το όρισμα συνάρτησης ΧΕγώαλλάζει απότομα, για μια συνεχή τυχαία μεταβλητή, το όρισμα αλλάζει συνεχώς. Αλλά η μαθηματική προσδοκία μιας συνεχούς τυχαίας μεταβλητής σχετίζεται επίσης με τη μέση τιμή της.

Για να βρείτε τη μαθηματική προσδοκία και διακύμανση μιας συνεχούς τυχαίας μεταβλητής, πρέπει να βρείτε καθορισμένα ολοκληρώματα . Εάν δοθεί μια συνάρτηση πυκνότητας μιας συνεχούς τυχαίας μεταβλητής, τότε αυτή μπαίνει απευθείας στο ολοκλήρωμα. Εάν δοθεί μια συνάρτηση κατανομής πιθανότητας, τότε διαφοροποιώντας την, πρέπει να βρείτε τη συνάρτηση πυκνότητας.

Ο αριθμητικός μέσος όρος όλων των πιθανών τιμών μιας συνεχούς τυχαίας μεταβλητής ονομάζεται δικός του μαθηματική προσδοκία, που συμβολίζεται με ή .

Οι κύριοι γενικευτικοί δείκτες διακύμανσης των στατιστικών είναι η διασπορά και η τυπική απόκλιση.

Διασπορά αυτό αριθμητικός μέσος όρος τετράγωνες αποκλίσεις κάθε τιμής χαρακτηριστικού από τον συνολικό μέσο όρο. Η διακύμανση συνήθως ονομάζεται μέσο τετράγωνο των αποκλίσεων και συμβολίζεται με  2 . Ανάλογα με τα αρχικά δεδομένα, η απόκλιση μπορεί να υπολογιστεί από τον αριθμητικό μέσο όρο, απλό ή σταθμισμένο:

 μη ζυγισμένη (απλή) διασπορά.

 σταθμισμένη διακύμανση.

Τυπική απόκλιση είναι γενικευτικό χαρακτηριστικό των απόλυτων διαστάσεων παραλλαγές χαρακτηριστικό στο σύνολο. Εκφράζεται στις ίδιες μονάδες με το πρόσημο (σε μέτρα, τόνους, τοις εκατό, εκτάρια κ.λπ.).

Η τυπική απόκλιση είναι η τετραγωνική ρίζα της διακύμανσης και συμβολίζεται με :

 μη σταθμισμένη τυπική απόκλιση.

 σταθμισμένη τυπική απόκλιση.

Η τυπική απόκλιση είναι ένα μέτρο της αξιοπιστίας του μέσου όρου. Όσο μικρότερη είναι η τυπική απόκλιση, τόσο καλύτερα ο αριθμητικός μέσος όρος αντικατοπτρίζει ολόκληρο τον αντιπροσωπευόμενο πληθυσμό.

Προηγείται ο υπολογισμός της τυπικής απόκλισης από τον υπολογισμό της διακύμανσης.

Η διαδικασία για τον υπολογισμό της σταθμισμένης διακύμανσης έχει ως εξής:

1) προσδιορίστε τον αριθμητικό σταθμισμένο μέσο όρο:

2) Υπολογίστε τις αποκλίσεις των επιλογών από τον μέσο όρο:

3) τετράγωνο της απόκλισης κάθε επιλογής από το μέσο όρο:

4) πολλαπλασιάστε τις αποκλίσεις στο τετράγωνο με τα βάρη (συχνότητες):

5) συνοψίστε τις ληφθείσες εργασίες:

6) το ποσό που προκύπτει διαιρείται με το άθροισμα των βαρών:

Παράδειγμα 2.1

Υπολογίστε τον αριθμητικό σταθμισμένο μέσο όρο:

Οι τιμές των αποκλίσεων από τον μέσο όρο και τα τετράγωνά τους παρουσιάζονται στον πίνακα. Ας ορίσουμε τη διακύμανση:

Η τυπική απόκλιση θα είναι ίση με:

Εάν τα δεδομένα πηγής παρουσιάζονται ως ένα διάστημα σειρά διανομής , τότε πρέπει πρώτα να προσδιορίσετε τη διακριτή τιμή της δυνατότητας και, στη συνέχεια, να εφαρμόσετε τη μέθοδο που περιγράφεται.

Παράδειγμα 2.2

Ας δείξουμε τον υπολογισμό της διακύμανσης για τις σειρές διαστήματος στα δεδομένα σχετικά με την κατανομή της σπαρμένης έκτασης του συλλογικού αγροκτήματος ανά απόδοση σιταριού.

Ο αριθμητικός μέσος όρος είναι:

Ας υπολογίσουμε τη διακύμανση:

6.3. Υπολογισμός της διασποράς σύμφωνα με τον τύπο για μεμονωμένα δεδομένα

Τεχνική υπολογισμού διασπορά πολύπλοκο και για μεγάλες τιμές επιλογών και συχνοτήτων μπορεί να είναι δυσκίνητο. Οι υπολογισμοί μπορούν να απλοποιηθούν χρησιμοποιώντας τις ιδιότητες διασποράς.

Η διασπορά έχει τις ακόλουθες ιδιότητες.

1. Μια μείωση ή αύξηση των βαρών (συχνοτήτων) ενός μεταβλητού χαρακτηριστικού κατά συγκεκριμένο αριθμό φορών δεν αλλάζει τη διασπορά.

2. Μείωση ή αύξηση κάθε τιμής χαρακτηριστικού κατά την ίδια σταθερή τιμή ΕΝΑη διασπορά δεν αλλάζει.

3. Μείωση ή αύξηση κάθε τιμής χαρακτηριστικού κατά συγκεκριμένο αριθμό φορές καντίστοιχα μειώνει ή αυξάνει τη διακύμανση σε κ 2 φορές τυπική απόκλιση  σε κμια φορά.

4. Η διακύμανση ενός χαρακτηριστικού σε σχέση με μια αυθαίρετη τιμή είναι πάντα μεγαλύτερη από τη διακύμανση σε σχέση με τον αριθμητικό μέσο όρο κατά το τετράγωνο της διαφοράς μεταξύ του μέσου όρου και των αυθαίρετων τιμών:

Αν ΕΝΑ 0, τότε καταλήγουμε στην ακόλουθη ισότητα:

δηλ. η διακύμανση ενός χαρακτηριστικού είναι ίση με τη διαφορά μεταξύ του μέσου τετραγώνου των τιμών των χαρακτηριστικών και του τετραγώνου του μέσου όρου.

Κάθε ιδιότητα μπορεί να χρησιμοποιηθεί μόνη της ή σε συνδυασμό με άλλες κατά τον υπολογισμό της διακύμανσης.

Η διαδικασία για τον υπολογισμό της διακύμανσης είναι απλή:

1) καθορίζει αριθμητικός μέσος όρος :

2) τετράγωνο του αριθμητικού μέσου όρου:

3) τετράγωνο της απόκλισης κάθε παραλλαγής της σειράς:

Χ Εγώ 2 .

4) βρείτε το άθροισμα των τετραγώνων των επιλογών:

5) διαιρέστε το άθροισμα των τετραγώνων των επιλογών με τον αριθμό τους, δηλαδή προσδιορίστε το μέσο τετράγωνο:

6) προσδιορίστε τη διαφορά μεταξύ του μέσου τετραγώνου του χαρακτηριστικού και του τετραγώνου του μέσου όρου:

Παράδειγμα 3.1Έχουμε τα ακόλουθα στοιχεία για την παραγωγικότητα των εργαζομένων:

Ας κάνουμε τους παρακάτω υπολογισμούς:

Σύμφωνα με τη δειγματοληπτική έρευνα, οι καταθέτες ομαδοποιήθηκαν ανάλογα με το μέγεθος της κατάθεσης στη Sberbank της πόλης:

Καθορίζω:

1) εύρος παραλλαγής.

2) μέσο ποσό κατάθεσης.

3) μέση γραμμική απόκλιση.

4) διασπορά?

5) τυπική απόκλιση.

6) συντελεστής διακύμανσης εισφορών.

Λύση:

Αυτή η σειρά διανομής περιέχει ανοιχτά διαστήματα. Σε τέτοιες σειρές, η τιμή του διαστήματος της πρώτης ομάδας θεωρείται συμβατικά ότι είναι ίση με την τιμή του διαστήματος της επόμενης και η τιμή του διαστήματος της τελευταίας ομάδας είναι ίση με την τιμή του διαστήματος της προηγούμενης ένας.

Η τιμή του διαστήματος της δεύτερης ομάδας είναι 200, επομένως, η τιμή της πρώτης ομάδας είναι επίσης 200. Η τιμή διαστήματος της προτελευταίας ομάδας είναι 200, που σημαίνει ότι και το τελευταίο διάστημα θα έχει τιμή ίση με 200.

1) Ορίστε το εύρος διακύμανσης ως τη διαφορά μεταξύ της μεγαλύτερης και της μικρότερης τιμής του χαρακτηριστικού:

Το εύρος διακύμανσης του μεγέθους της συνεισφοράς είναι 1000 ρούβλια.

2) Το μέσο μέγεθος της συνεισφοράς καθορίζεται από τον τύπο του αριθμητικού σταθμισμένου μέσου όρου.

Ας προσδιορίσουμε προκαταρκτικά τη διακριτή τιμή του χαρακτηριστικού σε κάθε διάστημα. Για να γίνει αυτό, χρησιμοποιώντας τον απλό αριθμητικό μέσο όρο, βρίσκουμε τα μέσα των διαστημάτων.

Η μέση τιμή του πρώτου διαστήματος θα είναι ίση με:

το δεύτερο - 500, κ.λπ.

Ας βάλουμε τα αποτελέσματα των υπολογισμών στον πίνακα:

Ποσό κατάθεσης, τρίψτε.Αριθμός συντελεστών, στΤο μέσο του διαστήματος, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Σύνολο 400 - 312000

Η μέση κατάθεση στην Sberbank της πόλης θα είναι 780 ρούβλια:

3) Η μέση γραμμική απόκλιση είναι ο αριθμητικός μέσος όρος των απόλυτων αποκλίσεων των επιμέρους τιμών του χαρακτηριστικού από τον συνολικό μέσο όρο:

Η διαδικασία για τον υπολογισμό της μέσης γραμμικής απόκλισης στη σειρά κατανομής διαστήματος έχει ως εξής:

1. Υπολογίζεται ο αριθμητικός σταθμισμένος μέσος όρος, όπως φαίνεται στην παράγραφο 2).

2. Προσδιορίζονται οι απόλυτες αποκλίσεις της παραλλαγής από το μέσο όρο:

3. Οι λαμβανόμενες αποκλίσεις πολλαπλασιάζονται με τις συχνότητες:

4. Το άθροισμα των σταθμισμένων αποκλίσεων βρίσκεται χωρίς να λαμβάνεται υπόψη το πρόσημο:

5. Το άθροισμα των σταθμισμένων αποκλίσεων διαιρείται με το άθροισμα των συχνοτήτων:

Είναι βολικό να χρησιμοποιήσετε τον πίνακα υπολογισμένων δεδομένων:

Ποσό κατάθεσης, τρίψτε.Αριθμός συντελεστών, στΤο μέσο του διαστήματος, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Σύνολο 400 - - - 81280

Η μέση γραμμική απόκλιση του μεγέθους της κατάθεσης των πελατών της Sberbank είναι 203,2 ρούβλια.

4) Διασπορά είναι ο αριθμητικός μέσος όρος των τετραγωνικών αποκλίσεων κάθε τιμής χαρακτηριστικού από τον αριθμητικό μέσο όρο.

Ο υπολογισμός της διακύμανσης στη σειρά κατανομής διαστήματος πραγματοποιείται σύμφωνα με τον τύπο:

Η διαδικασία για τον υπολογισμό της διακύμανσης σε αυτή την περίπτωση είναι η εξής:

1. Προσδιορίστε τον αριθμητικό σταθμισμένο μέσο όρο, όπως φαίνεται στην παράγραφο 2).

2. Βρείτε αποκλίσεις από τον μέσο όρο:

3. Τετραγωνισμός της απόκλισης κάθε επιλογής από τη μέση τιμή:

4. Πολλαπλασιάστε τις αποκλίσεις στο τετράγωνο με τα βάρη (συχνότητες):

5. Συνοψίστε τα έργα που ελήφθησαν:

6. Το ποσό που προκύπτει διαιρείται με το άθροισμα των βαρών (συχνότητες):

Ας βάλουμε τους υπολογισμούς σε έναν πίνακα:

Ποσό κατάθεσης, τρίψτε.Αριθμός συντελεστών, στΤο μέσο του διαστήματος, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Σύνολο 400 - - - 23040000