Σπίτι · Σε μια σημείωση · Περίληψη και ομαδοποίηση στατιστικών στοιχείων. Ας κατασκευάσουμε μια σειρά στατιστικής κατανομής

Περίληψη και ομαδοποίηση στατιστικών στοιχείων. Ας κατασκευάσουμε μια σειρά στατιστικής κατανομής

Εργαστηριακή εργασία Νο 1

Σύμφωνα με τα μαθηματικά στατιστικά

Θέμα: Πρωτογενής επεξεργασία πειραματικών δεδομένων

3. Βαθμολογήστε σε πόντους. 1

5. Ερωτήσεις τεστ.. 2

6. Μεθοδολογία για την εκτέλεση εργαστηριακών εργασιών.. 3

Στόχος της εργασίας

Απόκτηση δεξιοτήτων στην πρωτογενή επεξεργασία εμπειρικών δεδομένων με χρήση μεθόδων μαθηματικής στατιστικής.

Με βάση το σύνολο των πειραματικών δεδομένων, ολοκληρώστε τις ακόλουθες εργασίες:

Ασκηση 1.Κατασκευάστε μια σειρά κατανομής διαστημάτων παραλλαγής.

Εργασία 2.Κατασκευάστε ένα ιστόγραμμα συχνοτήτων μιας σειράς διαστημάτων μεταβολής.

Εργασία 3.Δημιουργήστε μια εμπειρική συνάρτηση κατανομής και σχεδιάστε ένα γράφημα.

α) τρόπος και διάμεσος·

β) υπό όρους αρχικές ροπές.

γ) μέσος όρος δείγματος.

δ) διακύμανση δείγματος, διορθωμένη διακύμανση πληθυσμού, διορθωμένη τυπική απόκλιση.

ε) συντελεστής διακύμανσης.

στ) ασυμμετρία.

ζ) κύρτωση.

Εργασία 5.Προσδιορίστε τα όρια των πραγματικών τιμών των αριθμητικών χαρακτηριστικών της τυχαίας μεταβλητής που μελετάται με δεδομένη αξιοπιστία.

Εργασία 6.Ερμηνεία με βάση το περιεχόμενο των αποτελεσμάτων της πρωτογενούς επεξεργασίας σύμφωνα με τις συνθήκες της εργασίας.

Σκορ σε πόντους

Εργασίες 1-56 βαθμοί

Εργασία 62 βαθμοί

Προστασία εργαστηριακών εργασιών(προφορική συνέντευξη για ερωτήσεις εξετάσεων και εργαστηριακές εργασίες) - 2 βαθμοί

Η εργασία πρέπει να υποβληθεί σε γραπτή μορφή σε φύλλα Α4 και περιλαμβάνει:

1) Σελίδα τίτλου (Παράρτημα 1)

2) Αρχικά στοιχεία.

3) Υποβολή εργασιών σύμφωνα με το καθορισμένο δείγμα.

4) Αποτελέσματα υπολογισμού (γίνονται χειροκίνητα ή/και χρησιμοποιώντας MS Excel) με την καθορισμένη σειρά.

5) Συμπεράσματα - ουσιαστική ερμηνεία των αποτελεσμάτων της πρωτογενούς επεξεργασίας σύμφωνα με τις συνθήκες του προβλήματος.

6) Προφορική συνέντευξη σε ερωτήσεις εργασίας και ελέγχου.



5. Ερωτήσεις τεστ


Μεθοδολογία για την εκτέλεση εργαστηριακών εργασιών

Εργασία 1. Κατασκευάστε μια σειρά μεταβλητής κατανομής διαστήματος

Προκειμένου να παρουσιαστούν στατιστικά δεδομένα με τη μορφή σειράς παραλλαγών με ίσες επιλογές, είναι απαραίτητο:

1.Στον αρχικό πίνακα δεδομένων, βρείτε τις μικρότερες και μεγαλύτερες τιμές.

2.Ορίστε εύρος παραλλαγής :

3. Προσδιορίστε το μήκος του διαστήματος h, εάν το δείγμα περιέχει έως και 1000 δεδομένα, χρησιμοποιήστε τον τύπο: , όπου n – μέγεθος δείγματος – η ποσότητα των δεδομένων στο δείγμα. για υπολογισμούς πάρτε lgn).

Ο υπολογισμένος λόγος στρογγυλοποιείται σε βολική ακέραια τιμή .

4. Για να προσδιορίσετε την αρχή του πρώτου διαστήματος για ζυγό αριθμό διαστημάτων, συνιστάται να λάβετε την τιμή ; και για περιττό αριθμό διαστημάτων .

5. Γράψτε τα διαστήματα ομαδοποίησης και τακτοποιήστε τα με αύξουσα σειρά ορίων

, ,………., ,

όπου είναι το κατώτερο όριο του πρώτου διαστήματος. Λαμβάνεται ένας βολικός αριθμός που δεν είναι μεγαλύτερος από , το ανώτερο όριο του τελευταίου διαστήματος δεν πρέπει να είναι μικρότερο από . Συνιστάται τα διαστήματα να περιέχουν τις αρχικές τιμές της τυχαίας μεταβλητής και να διαχωρίζονται από αυτά 5 έως 20διαστήματα.

6. Καταγράψτε τα αρχικά δεδομένα στα διαστήματα ομαδοποίησης, π.χ. χρησιμοποιήστε τον πίνακα πηγής για να υπολογίσετε τον αριθμό των τιμών τυχαίων μεταβλητών που εμπίπτουν στα καθορισμένα διαστήματα. Εάν ορισμένες τιμές συμπίπτουν με τα όρια των διαστημάτων, τότε αποδίδονται είτε μόνο στο προηγούμενο είτε μόνο στο επόμενο διάστημα.

Σημείωση 1.Τα διαστήματα δεν χρειάζεται να είναι ίσα σε μήκος. Σε περιοχές όπου οι τιμές είναι πιο πυκνές, είναι πιο βολικό να παίρνετε μικρότερα, σύντομα διαστήματα και όπου υπάρχουν λιγότερο συχνά, μεγαλύτερα.

Σημείωση 2.Εάν για ορισμένες τιμές προκύψουν τιμές "μηδέν" ή μικρές τιμές συχνότητας, τότε είναι απαραίτητο να ομαδοποιήσετε εκ νέου τα δεδομένα, διευρύνοντας τα διαστήματα (αυξάνοντας το βήμα).

Τι είναι μια ομαδοποίηση στατιστικών δεδομένων και πώς σχετίζεται με τις σειρές διανομής, συζητήθηκε σε αυτήν τη διάλεξη, όπου μπορείτε επίσης να μάθετε τι είναι μια διακριτή και μεταβλητή σειρά διανομής.

Οι σειρές διανομής είναι μία από τις ποικιλίες στατιστικών σειρών (επιπλέον αυτών, οι σειρές δυναμικής χρησιμοποιούνται στις στατιστικές), χρησιμοποιούνται για την ανάλυση δεδομένων σχετικά με τα φαινόμενα της κοινωνικής ζωής. Η κατασκευή σειρών παραλλαγών είναι μια αρκετά εφικτή εργασία για όλους. Ωστόσο, υπάρχουν κανόνες που πρέπει να θυμόμαστε.

Πώς να κατασκευάσετε μια διακριτή σειρά μεταβλητής διανομής

Παράδειγμα 1. Υπάρχουν στοιχεία για τον αριθμό των παιδιών σε 20 οικογένειες που συμμετείχαν στην έρευνα. Κατασκευάστε μια διακριτή σειρά παραλλαγών οικογενειακή διανομήκατά αριθμό παιδιών.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Λύση:

  1. Ας ξεκινήσουμε με μια διάταξη πίνακα, στην οποία στη συνέχεια θα εισάγουμε δεδομένα. Δεδομένου ότι οι σειρές διανομής έχουν δύο στοιχεία, ο πίνακας θα αποτελείται από δύο στήλες. Η πρώτη στήλη είναι πάντα μια επιλογή - αυτό που μελετάμε - παίρνουμε το όνομά της από την εργασία (το τέλος της πρότασης με την εργασία στις συνθήκες) - κατά αριθμό παιδιών– αυτό σημαίνει ότι η επιλογή μας είναι ο αριθμός των παιδιών.

Η δεύτερη στήλη είναι η συχνότητα - πόσο συχνά εμφανίζεται η παραλλαγή μας στο υπό μελέτη φαινόμενο - παίρνουμε επίσης το όνομα της στήλης από την εργασία - οικογενειακή διανομή – αυτό σημαίνει ότι η συχνότητά μας είναι ο αριθμός των οικογενειών με τον αντίστοιχο αριθμό παιδιών.

  1. Τώρα από τα δεδομένα πηγής επιλέγουμε εκείνες τις τιμές που εμφανίζονται τουλάχιστον μία φορά. Στην περίπτωσή μας είναι

Και ας τακτοποιήσουμε αυτά τα δεδομένα στην πρώτη στήλη του πίνακα μας με λογική σειρά, σε αυτήν την περίπτωση αυξάνοντας από το 0 στο 4. Παίρνουμε

Και τέλος, ας μετρήσουμε πόσες φορές εμφανίζεται κάθε τιμή της παραλλαγής.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

Ως αποτέλεσμα, λαμβάνουμε έναν συμπληρωμένο πίνακα ή την απαιτούμενη σειρά κατανομής των οικογενειών κατά αριθμό παιδιών.

Ασκηση . Υπάρχουν στοιχεία για τις τιμολογιακές κατηγορίες 30 εργαζομένων στην επιχείρηση. Κατασκευάστε μια διακριτή σειρά παραλλαγών για την κατανομή των εργαζομένων ανά κατηγορία τιμολογίων. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Πώς να κατασκευάσετε μια σειρά μεταβλητής κατανομής διαστήματος

Ας κατασκευάσουμε μια σειρά διανομής διαστήματος και ας δούμε πώς διαφέρει η κατασκευή της από μια διακριτή σειρά.

Παράδειγμα 2. Υπάρχουν στοιχεία για το ποσό του κέρδους που έλαβαν 16 επιχειρήσεις, εκατομμύρια ρούβλια. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Κατασκευάστε μια σειρά μεταβολών διαστήματος της κατανομής των επιχειρήσεων ανά όγκο κέρδους, προσδιορίζοντας 3 ομάδες με ίσα διαστήματα.

Η γενική αρχή της κατασκευής της σειράς, φυσικά, θα παραμείνει οι ίδιες δύο στήλες, οι ίδιες επιλογές και συχνότητα, αλλά σε αυτήν την περίπτωση οι επιλογές θα βρίσκονται στο διάστημα και οι συχνότητες θα μετρηθούν διαφορετικά.

Λύση:

  1. Ας ξεκινήσουμε με τον ίδιο τρόπο με την προηγούμενη εργασία δημιουργώντας μια διάταξη πίνακα, στην οποία στη συνέχεια θα εισάγουμε δεδομένα. Δεδομένου ότι οι σειρές διανομής έχουν δύο στοιχεία, ο πίνακας θα αποτελείται από δύο στήλες. Η πρώτη στήλη είναι πάντα μια επιλογή - αυτό που μελετάμε - παίρνουμε το όνομά της από την εργασία (το τέλος της πρότασης με την εργασία στις συνθήκες) - κατά το ποσό του κέρδους - που σημαίνει ότι η επιλογή μας είναι το ποσό του κέρδους που ελήφθη .

Η δεύτερη στήλη είναι η συχνότητα - πόσο συχνά εμφανίζεται η παραλλαγή μας στο υπό μελέτη φαινόμενο - παίρνουμε επίσης το όνομα της στήλης από την εργασία - κατανομή των επιχειρήσεων - που σημαίνει ότι η συχνότητά μας είναι ο αριθμός των επιχειρήσεων με το αντίστοιχο κέρδος, σε αυτή η περίπτωση εμπίπτει στο μεσοδιάστημα.

Ως αποτέλεσμα, η διάταξη του πίνακα μας θα μοιάζει με αυτό:

όπου i είναι η τιμή ή το μήκος του διαστήματος,

Xmax και Xmin – μέγιστη και ελάχιστη τιμή του χαρακτηριστικού,

n είναι ο απαιτούμενος αριθμός ομάδων σύμφωνα με τις συνθήκες του προβλήματος.

Ας υπολογίσουμε το μέγεθος του διαστήματος για το παράδειγμά μας. Για να γίνει αυτό, μεταξύ των αρχικών δεδομένων θα βρούμε το μεγαλύτερο και το μικρότερο

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 - η μέγιστη τιμή είναι 118 εκατομμύρια ρούβλια και η ελάχιστη είναι 9 εκατομμύρια ρούβλια. Ας κάνουμε τον υπολογισμό χρησιμοποιώντας τον τύπο.

Στον υπολογισμό πήραμε τον αριθμό 36, (3) τρία στην περίοδο, σε τέτοιες περιπτώσεις η τιμή του διαστήματος πρέπει να στρογγυλοποιείται προς τα πάνω ώστε μετά τους υπολογισμούς να μην χάνονται τα μέγιστα δεδομένα, γι' αυτό στον υπολογισμό η τιμή του το διάστημα είναι 36,4 εκατομμύρια ρούβλια.

  1. Τώρα ας κατασκευάσουμε διαστήματα - τις επιλογές μας σε αυτό το πρόβλημα. Το πρώτο διάστημα αρχίζει να δημιουργείται από την ελάχιστη τιμή, προστίθεται η τιμή του διαστήματος και προκύπτει το ανώτερο όριο του πρώτου διαστήματος. Στη συνέχεια, το ανώτερο όριο του πρώτου διαστήματος γίνεται το κατώτερο όριο του δεύτερου διαστήματος, η τιμή του διαστήματος προστίθεται σε αυτό και προκύπτει το δεύτερο διάστημα. Και ούτω καθεξής όσες φορές απαιτείται για την κατασκευή διαστημάτων ανάλογα με την κατάσταση.

Ας σημειώσουμε ότι αν δεν είχαμε στρογγυλοποιήσει την τιμή του διαστήματος στο 36,4, αλλά το αφήναμε στο 36,3, τότε η τελευταία τιμή θα ήταν 117,9. Προκειμένου να αποφευχθεί η απώλεια δεδομένων είναι απαραίτητο να στρογγυλοποιηθεί η τιμή του διαστήματος σε μεγαλύτερη τιμή.

  1. Ας μετρήσουμε τον αριθμό των επιχειρήσεων που εμπίπτουν σε κάθε συγκεκριμένο διάστημα. Κατά την επεξεργασία δεδομένων, πρέπει να θυμάστε ότι η ανώτερη τιμή του διαστήματος σε ένα δεδομένο διάστημα δεν λαμβάνεται υπόψη (δεν περιλαμβάνεται σε αυτό το διάστημα), αλλά λαμβάνεται υπόψη στο επόμενο διάστημα (περιλαμβάνεται το κατώτερο όριο του διαστήματος σε αυτό το διάστημα, και δεν περιλαμβάνεται το ανώτερο), με εξαίρεση το τελευταίο διάστημα.

Κατά την επεξεργασία δεδομένων, είναι καλύτερο να υποδεικνύονται τα επιλεγμένα δεδομένα με σύμβολα ή χρώματα για απλοποίηση της επεξεργασίας.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Ας υποδηλώσουμε το πρώτο διάστημα με κίτρινο χρώμα - και ας προσδιορίσουμε πόσα δεδομένα εμπίπτουν στο διάστημα από 9 έως 45,4, ενώ αυτό το 45,4 θα ληφθεί υπόψη στο δεύτερο διάστημα (με την προϋπόθεση ότι είναι στα δεδομένα) - ως αποτέλεσμα, παίρνουμε 7 επιχειρήσεις στο πρώτο διάστημα. Και ούτω καθεξής σε όλα τα διαστήματα.

  1. (πρόσθετη δράση) Ας υπολογίσουμε το συνολικό ποσό του κέρδους που εισπράττουν οι επιχειρήσεις για κάθε διάστημα και γενικά. Για να το κάνετε αυτό, προσθέστε τα δεδομένα που επισημαίνονται με διαφορετικά χρώματα και λάβετε τη συνολική αξία κέρδους.

Για το πρώτο διάστημα - 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 εκατομμύρια ρούβλια.

Για το δεύτερο διάστημα - 48 + 57 + 48 + 56 + 63 = 272 εκατομμύρια ρούβλια.

Για το τρίτο διάστημα - 118 + 87 + 98 + 88 = 391 εκατομμύρια ρούβλια.

Ασκηση . Υπάρχουν στοιχεία για το ποσό των καταθέσεων στην τράπεζα 30 καταθετών, χιλιάδες ρούβλια. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Χτίζω σειρές παραλλαγής διαστήματοςκατανομή των καταθετών, ανάλογα με το μέγεθος της κατάθεσης, προσδιορίζοντας 4 ομάδες με ίσα διαστήματα. Για κάθε ομάδα, υπολογίστε το συνολικό ποσό των καταθέσεων.

Έχοντας διαθέσιμα δεδομένα στατιστικής παρατήρησης που χαρακτηρίζουν ένα συγκεκριμένο φαινόμενο, πρώτα απ 'όλα είναι απαραίτητο να τα οργανώσουμε, δηλ. δίνουν συστηματικό χαρακτήρα

Άγγλος στατιστικολόγος. Ο UJReichman είπε μεταφορικά για τις διαταραγμένες συλλογές ότι το να συναντάς μια μάζα μη γενικευμένων δεδομένων ισοδυναμεί με μια κατάσταση όπου ένα άτομο ρίχνεται σε ένα αλσύλλιο χωρίς πυξίδα. Ποια είναι η συστηματοποίηση των στατιστικών δεδομένων με τη μορφή σειρών διανομής;

Οι στατιστικές σειρές κατανομών είναι ταξινομημένα στατιστικά μεγέθη (Πίνακας 17). Ο απλούστερος τύπος στατιστικής σειράς κατανομής είναι μια σειρά κατάταξης, δηλ. μια σειρά αριθμών σε αύξουσα ή φθίνουσα σειρά, που διαφοροποιούν τα χαρακτηριστικά. Μια τέτοια σειρά δεν επιτρέπει σε κάποιον να κρίνει τα μοτίβα που είναι εγγενή στα κατανεμημένα δεδομένα: ποια τιμή έχει ομαδοποιήσει τους περισσότερους δείκτες, ποιες αποκλίσεις υπάρχουν από αυτήν την τιμή. καθώς και η γενική εικόνα κατανομής. Για το σκοπό αυτό, ομαδοποιούνται δεδομένα, δείχνοντας πόσο συχνά συμβαίνουν μεμονωμένες παρατηρήσεις στο συνολικό τους αριθμό (Σχήμα 1α 1).

. Πίνακας 17

. Γενική άποψη των σειρών στατιστικής κατανομής

. Σχήμα 1. Στατιστικό σχήμασειρά διανομής

Η κατανομή των πληθυσμιακών μονάδων σύμφωνα με χαρακτηριστικά που δεν έχουν ποσοτική έκφραση ονομάζεται αποδοτική σειρά(για παράδειγμα, κατανομή των επιχειρήσεων ανά περιοχή παραγωγής τους)

Οι σειρές κατανομής των πληθυσμιακών μονάδων σύμφωνα με χαρακτηριστικά, έχουν ποσοτική έκφραση, ονομάζονται σειρά παραλλαγής. Σε τέτοιες σειρές, η τιμή του χαρακτηριστικού (επιλογές) είναι σε αύξουσα ή φθίνουσα σειρά

Στη σειρά μεταβλητής διανομής διακρίνονται δύο στοιχεία: παραλλαγή και συχνότητα . Επιλογή- αυτό είναι μια ξεχωριστή έννοια των χαρακτηριστικών ομαδοποίησης συχνότητα- ένας αριθμός που δείχνει πόσες φορές εμφανίζεται κάθε επιλογή

Στις μαθηματικές στατιστικές, υπολογίζεται ένα ακόμη στοιχείο της σειράς παραλλαγών - εν μέρει. Το τελευταίο ορίζεται ως ο λόγος της συχνότητας των περιπτώσεων ενός δεδομένου διαστήματος προς το συνολικό άθροισμα των συχνοτήτων· το μέρος προσδιορίζεται σε κλάσματα μονάδας, τοις εκατό (%) σε ppm (%o)

Έτσι, μια σειρά διανομής παραλλαγών είναι μια σειρά στην οποία οι επιλογές είναι διατεταγμένες σε αύξουσα ή φθίνουσα σειρά και υποδεικνύονται οι συχνότητες ή οι συχνότητές τους. Οι σειρές παραλλαγών είναι διακριτές (διαστήματα) και άλλα διαστήματα (συνεχείς).

. Σειρά διακριτών παραλλαγών- πρόκειται για σειρές διανομής στις οποίες η παραλλαγή ως τιμή ενός ποσοτικού χαρακτηριστικού μπορεί να λάβει μόνο μια συγκεκριμένη τιμή. Οι επιλογές διαφέρουν μεταξύ τους κατά μία ή περισσότερες μονάδες

Έτσι, ο αριθμός των ανταλλακτικών που παράγονται ανά βάρδια από έναν συγκεκριμένο εργαζόμενο μπορεί να εκφραστεί μόνο με έναν συγκεκριμένο αριθμό (6, 10, 12 κ.λπ.). Ένα παράδειγμα μιας σειράς διακριτών παραλλαγών θα μπορούσε να είναι η κατανομή των εργαζομένων με βάση τον αριθμό των εξαρτημάτων που παράγονται (Πίνακας 18 18).

. Πίνακας 18

. Διακεκριμένη διανομή σειρών _

. Σειρά διαλειμματικής (συνεχούς) μεταβολής- τέτοιες σειρές διανομής στις οποίες η αξία των επιλογών δίνεται με τη μορφή διαστημάτων, δηλ. οι τιμές των χαρακτηριστικών μπορεί να διαφέρουν μεταξύ τους κατά ένα αυθαίρετα μικρό ποσό. Κατά την κατασκευή μιας σειράς παραλλαγών περι-μεταβλητών χαρακτηριστικών NEP, είναι αδύνατο να υποδειχθεί κάθε τιμή της παραλλαγής, επομένως ο πληθυσμός κατανέμεται σε διαστήματα. Το τελευταίο μπορεί να είναι ίσο ή άνισο. Για καθένα από αυτά, υποδεικνύονται συχνότητες ή συχνότητες (Πίνακας 1 9 19).

Σε σειρές κατανομής διαστήματος με άνισα διαστήματα, υπολογίζονται μαθηματικά χαρακτηριστικά όπως η πυκνότητα κατανομής και η σχετική πυκνότητα κατανομής σε ένα δεδομένο διάστημα. Το πρώτο χαρακτηριστικό καθορίζεται από την αναλογία συχνότητας προς την τιμή του ίδιου διαστήματος, το δεύτερο - από την αναλογία συχνότητας προς την τιμή του ίδιου διαστήματος. Για το παραπάνω παράδειγμα, η πυκνότητα κατανομής στο πρώτο διάστημα θα είναι 3: 5 = 0,6 και η σχετική πυκνότητα σε αυτό το διάστημα είναι 7,5: 5 = 1,55%.

. Πίνακας 19

. Σειρά διαλειμματικής διανομής _

Κατά την κατασκευή μιας σειράς διαλειμματικής διανομής, επιλύονται τρία ερωτήματα:

  • 1. Πόσα διαστήματα πρέπει να κάνω;
  • 2. Ποιο είναι το μήκος των διαστημάτων;
  • 3. Ποια είναι η διαδικασία για την ένταξη των πληθυσμιακών μονάδων στα όρια των διαστημάτων;
  • 1. Αριθμός διαστημάτωνμπορεί να προσδιοριστεί από Φόρμουλα Sturgess:

2. Μήκος διαστήματος ή βήμα διαστήματος, συνήθως καθορίζεται από τον τύπο

Οπου R-εύρος παραλλαγής.

3. Η σειρά ένταξης των πληθυσμιακών μονάδων εντός των ορίων του διαστήματος

μπορεί να είναι διαφορετική, αλλά κατά την κατασκευή μιας σειράς διαστήματος, η κατανομή πρέπει να είναι αυστηρά καθορισμένη.

Για παράδειγμα, αυτό: [), στο οποίο οι πληθυσμιακές μονάδες περιλαμβάνονται στα κάτω όρια, αλλά δεν περιλαμβάνονται στα ανώτερα όρια, αλλά μεταφέρονται στο επόμενο διάστημα. Εξαίρεση σε αυτόν τον κανόνα είναι το τελευταίο διάστημα, το ανώτερο όριο του οποίου περιλαμβάνει τον τελευταίο αριθμό της σειράς κατάταξης.

Τα όρια του διαστήματος είναι:

  • κλειστό - με δύο ακραίες τιμές του χαρακτηριστικού.
  • ανοιχτό - με μια ακραία τιμή του χαρακτηριστικού (πριντάδε νούμερο ή πάνω απότέτοιος και αυτός αριθμός).

Για να αφομοιώσουμε το θεωρητικό υλικό εισάγουμε γενικές πληροφορίεςγια λύσεις εργασία από άκρο σε άκρο.

Υπάρχουν δεδομένα υπό όρους για τον μέσο αριθμό των διευθυντών πωλήσεων, την ποσότητα παρόμοιων αγαθών που πωλούνται από αυτούς, την μεμονωμένη τιμή αγοράς για αυτό το προϊόν, καθώς και τον όγκο πωλήσεων 30 εταιρειών σε μία από τις περιοχές της Ρωσικής Ομοσπονδίας κατά την πρώτη τρίμηνο του έτους αναφοράς (Πίνακας 2.1).

Πίνακας 2.1

Αρχικές πληροφορίες για μια εγκάρσια εργασία

Αριθμός

διευθυντές,

Τιμή, χιλιάδες ρούβλια

Όγκος πωλήσεων, εκατομμύρια ρούβλια.

Αριθμός

διευθυντές,

Ποσότητα πωληθέντων, τεμ.

Τιμή, χιλιάδες ρούβλια

Όγκος πωλήσεων, εκατομμύρια ρούβλια.

Με βάση τις αρχικές πληροφορίες, καθώς και πρόσθετες πληροφορίες, θα ορίσουμε μεμονωμένες εργασίες. Στη συνέχεια θα παρουσιάσουμε τη μεθοδολογία επίλυσής τους και τις ίδιες τις λύσεις.

Οριζόντια εργασία. Εργασία 2.1

Χρησιμοποιώντας τα αρχικά δεδομένα από τον πίνακα. 2.1 απαιτείταικατασκευάστε μια διακριτή σειρά διανομής των επιχειρήσεων ανά ποσότητα πωληθέντων αγαθών (Πίνακας 2.2).

Λύση:

Πίνακας 2.2

Διακεκριμένες σειρές διανομής επιχειρήσεων ανά ποσότητα αγαθών που πωλήθηκαν σε μία από τις περιοχές της Ρωσικής Ομοσπονδίας κατά το πρώτο τρίμηνο του έτους αναφοράς

Οριζόντια εργασία. Εργασία 2.2

απαιτείταικατασκευάστε μια σειρά κατάταξης 30 εταιρειών σύμφωνα με τον μέσο αριθμό διευθυντικών στελεχών.

Λύση:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Οριζόντια εργασία. Εργασία 2.3

Χρησιμοποιώντας τα αρχικά δεδομένα από τον πίνακα. 2.1, απαιτείται:

  • 1. Κατασκευάστε μια σειρά διαστημάτων κατανομής των επιχειρήσεων κατά αριθμό διευθυντικών στελεχών.
  • 2. Υπολογίστε τις συχνότητες της σειράς διανομής των επιχειρήσεων.
  • 3. Εξάγετε συμπεράσματα.

Λύση:

Ας υπολογίσουμε χρησιμοποιώντας τον τύπο Sturgess (2.5) αριθμός διαστημάτων:

Έτσι, παίρνουμε 6 διαστήματα (ομάδες).

Μήκος διαστήματος, ή βήμα μεσοδιάστημα, υπολογίστε χρησιμοποιώντας τον τύπο

Σημείωση.Η σειρά συμπερίληψης των πληθυσμιακών μονάδων στα όρια του διαστήματος έχει ως εξής: I), στην οποία οι πληθυσμιακές μονάδες περιλαμβάνονται στα κατώτερα όρια, αλλά δεν περιλαμβάνονται στα ανώτερα όρια, αλλά μεταφέρονται στο επόμενο διάστημα. Η εξαίρεση σε αυτόν τον κανόνα είναι το τελευταίο διάστημα I ], το ανώτερο όριο του οποίου περιλαμβάνει τον τελευταίο αριθμό της σειράς κατάταξης.

Κατασκευάζουμε μια σειρά διαστημάτων (Πίνακας 2.3).

Σειρές διαστημάτων κατανομής εταιρειών και ο μέσος αριθμός διευθυντικών στελεχών σε μία από τις περιοχές της Ρωσικής Ομοσπονδίας κατά το πρώτο τρίμηνο του έτους αναφοράς

Συμπέρασμα.Η μεγαλύτερη ομάδα επιχειρήσεων είναι η ομάδα με μέσο αριθμό διευθυντών 25-30 ατόμων, η οποία περιλαμβάνει 8 επιχειρήσεις (27%). Η μικρότερη ομάδα με μέσο αριθμό διευθυντών 40-45 ατόμων περιλαμβάνει μόνο μία εταιρεία (3%).

Χρησιμοποιώντας τα αρχικά δεδομένα από τον πίνακα. 2.1, καθώς και μια σειρά διαστημάτων κατανομής των επιχειρήσεων κατά αριθμό διευθυντικών στελεχών (Πίνακας 2.3), απαιτείταιοικοδομήστε μια αναλυτική ομαδοποίηση της σχέσης μεταξύ του αριθμού των διευθυντών και του όγκου πωλήσεων των επιχειρήσεων και, με βάση αυτήν, συνάγετε ένα συμπέρασμα σχετικά με την παρουσία (ή την απουσία) μιας σχέσης μεταξύ αυτών των χαρακτηριστικών.

Λύση:

Η αναλυτική ομαδοποίηση βασίζεται σε χαρακτηριστικά παραγόντων. Στο πρόβλημά μας, το χαρακτηριστικό παράγοντα (x) είναι ο αριθμός των διευθυντών και το χαρακτηριστικό που προκύπτει (y) είναι ο όγκος πωλήσεων (Πίνακας 2.4).

Ας χτίσουμε τώρα αναλυτική ομαδοποίηση(Πίνακας 2.5).

Συμπέρασμα.Με βάση τα δεδομένα της κατασκευασμένης αναλυτικής ομαδοποίησης, μπορούμε να πούμε ότι με την αύξηση του αριθμού των διευθυντών πωλήσεων, αυξάνεται και ο μέσος όγκος πωλήσεων της εταιρείας στον όμιλο, γεγονός που υποδηλώνει την ύπαρξη άμεσης σύνδεσης μεταξύ αυτών των χαρακτηριστικών.

Πίνακας 2.4

Βοηθητικός πίνακας για την κατασκευή αναλυτικής ομαδοποίησης

Αριθμός διευθυντών, άτομα,

Αριθμός εταιρείας

Όγκος πωλήσεων, εκατομμύρια ρούβλια, y

" = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U4 = 7 = 10,61

στο = ’ =10,31 30

Πίνακας 2.5

Εξάρτηση των όγκων πωλήσεων από τον αριθμό των διευθυντών εταιρειών σε μία από τις περιοχές της Ρωσικής Ομοσπονδίας κατά το πρώτο τρίμηνο του έτους αναφοράς

ΕΡΩΤΗΣΕΙΣ ΕΛΕΓΧΟΥ
  • 1. Ποια είναι η ουσία της στατιστικής παρατήρησης;
  • 2. Ονομάστε τα στάδια της στατιστικής παρατήρησης.
  • 3. Ποιες είναι οι οργανωτικές μορφές στατιστικής παρατήρησης;
  • 4. Ονομάστε τα είδη της στατιστικής παρατήρησης.
  • 5. Τι είναι η στατιστική περίληψη;
  • 6. Ονομάστε τα είδη των στατιστικών αναφορών.
  • 7. Τι είναι η στατιστική ομαδοποίηση;
  • 8. Ονομάστε τα είδη των στατιστικών ομαδοποιήσεων.
  • 9. Τι είναι η σειρά διανομής;
  • 10. Ονομάστε τα δομικά στοιχεία της σειράς διανομής.
  • 11. Ποια είναι η διαδικασία κατασκευής μιας σειράς διανομής;

Ένα παράδειγμα επίλυσης τεστ μαθηματικών στατιστικών

Πρόβλημα 1

Αρχικά στοιχεία : μαθητές μιας συγκεκριμένης ομάδας αποτελούμενη από 30 άτομα πέρασαν εξετάσεις στο μάθημα «Πληροφορική». Οι βαθμοί που λαμβάνουν οι μαθητές σχηματίζουν την ακόλουθη σειρά αριθμών:

I. Ας δημιουργήσουμε μια σειρά παραλλαγών

Μ Χ

w Χ

Μ Χ nak

w Χ nak

Σύνολο:

II. Γραφική αναπαράσταση στατιστικών πληροφοριών.

III. Αριθμητικά χαρακτηριστικά του δείγματος.

1. Αριθμητικός μέσος όρος

2. Γεωμετρικός μέσος όρος

3. Μόδα

4. Διάμεσος

222222333333333 | 3 34444444445555

5. Δειγματική διακύμανση

7. Συντελεστής διακύμανσης

8. Ασυμμετρία

9. Συντελεστής ασυμμετρίας

10. Υπέρβαση

11. Συντελεστής κύρωσης

Πρόβλημα 2

Αρχικά στοιχεία : Οι μαθητές κάποιας ομάδας έγραψαν το τελικό τεστ. Η ομάδα αποτελείται από 30 άτομα. Οι βαθμοί που σημειώνουν οι μαθητές σχηματίζουν την παρακάτω σειρά αριθμών

Λύση

I. Δεδομένου ότι το χαρακτηριστικό παίρνει πολλές διαφορετικές τιμές, θα κατασκευάσουμε μια σειρά παραλλαγής διαστήματος για αυτό. Για να το κάνετε αυτό, ορίστε πρώτα την τιμή του διαστήματος η. Ας χρησιμοποιήσουμε τον τύπο του Stanger

Ας δημιουργήσουμε μια κλίμακα διαστήματος. Σε αυτήν την περίπτωση, θα πάρουμε ως ανώτατο όριο του πρώτου διαστήματος την τιμή που καθορίζεται από τον τύπο:

Καθορίζουμε τα ανώτερα όρια των επόμενων διαστημάτων χρησιμοποιώντας τον ακόλουθο επαναλαμβανόμενο τύπο:

, Επειτα

Ολοκληρώνουμε την κατασκευή της κλίμακας διαστήματος, καθώς το ανώτερο όριο του επόμενου διαστήματος έχει γίνει μεγαλύτερο ή ίσο με τη μέγιστη τιμή δείγματος
.

II. Γραφική απεικόνιση σειρών διαστημάτων παραλλαγής

III. Αριθμητικά χαρακτηριστικά του δείγματος

Για να προσδιορίσουμε τα αριθμητικά χαρακτηριστικά του δείγματος, θα συντάξουμε έναν βοηθητικό πίνακα

Αθροισμα:

1. Αριθμητικός μέσος όρος

2. Γεωμετρικός μέσος όρος

3. Μόδα

4. Διάμεσος

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Δειγματική διακύμανση

6. Δείγμα τυπικής απόκλισης

7. Συντελεστής διακύμανσης

8. Ασυμμετρία

9. Συντελεστής ασυμμετρίας

10. Υπέρβαση

11. Συντελεστής κύρωσης

Πρόβλημα 3

Κατάσταση : η τιμή διαίρεσης της κλίμακας αμπερόμετρου είναι 0,1 A. Οι ενδείξεις στρογγυλοποιούνται στην πλησιέστερη ακέραια διαίρεση. Βρείτε την πιθανότητα κατά την ανάγνωση να γίνει σφάλμα που θα υπερβαίνει το 0,02 A.

Λύση.

Το σφάλμα στρογγυλοποίησης του δείγματος μπορεί να θεωρηθεί ως τυχαία μεταβλητή Χ, το οποίο κατανέμεται ομοιόμορφα στο διάστημα μεταξύ δύο γειτονικών ακέραιων διαιρέσεων. Ομοιόμορφη πυκνότητα κατανομής

Οπου
- μήκος του διαστήματος που περιέχει πιθανές τιμές Χ; έξω από αυτό το διάστημα
Σε αυτό το πρόβλημα, το μήκος του διαστήματος που περιέχει πιθανές τιμές είναι Χ, ισούται με 0,1, επομένως

Το σφάλμα ανάγνωσης θα ξεπεράσει το 0,02 εάν βρίσκεται στο διάστημα (0,02; 0,08). Επειτα

Απάντηση: R=0,6

Πρόβλημα 4

Αρχικά δεδομένα: μαθηματική προσδοκία και τυπική απόκλιση ενός κανονικά κατανεμημένου χαρακτηριστικού Χαντίστοιχα ίσο με 10 και 2. Να βρείτε την πιθανότητα ότι ως αποτέλεσμα του τεστ Χθα λάβει την τιμή που περιέχεται στο διάστημα (12, 14).

Λύση.

Ας χρησιμοποιήσουμε τον τύπο

Και θεωρητικές συχνότητες

Λύση

Για το Χ η μαθηματική του προσδοκία είναι M(X) και η διακύμανση D(X). Λύση. Ας βρούμε τη συνάρτηση κατανομής F(x) της τυχαίας μεταβλητής... δειγματοληπτικό σφάλμα). Ας συνθέσουμε μεταβλητή σειράΠλάτος διαστήματος θα είναι: Για κάθε τιμή σειράΑς υπολογίσουμε πόσα...

  • Λύση: διαχωρίσιμη εξίσωση

    Λύση

    Με τη μορφή Για να βρείτε το πηλίκο λύσειςανομοιογενής εξίσωση ας φτιάξουμεσύστημα Ας λύσουμε το σύστημα που προκύπτει... ; +47; +61; +10; -8. Διάστημα δόμησης μεταβλητή σειρά. Δώστε στατιστικές εκτιμήσεις για τη μέση τιμή...

  • Λύση: Ας υπολογίσουμε αλυσιδωτές και βασικές απόλυτες αυξήσεις, ρυθμούς ανάπτυξης, ρυθμούς ανάπτυξης. Συνοψίζουμε τις λαμβανόμενες τιμές στον Πίνακα 1

    Λύση

    Όγκος παραγωγής. Λύση: Αριθμητικός μέσος όρος διαστήματος μεταβλητή σειράυπολογίζεται ως εξής: για... Οριακό δειγματοληπτικό σφάλμα με πιθανότητα 0,954 (t=2) θα είναι: Δ w = t*μ = 2*0,0146 = 0,02927 Ας ορίσουμε τα όρια...

  • Λύση. Σημάδι

    Λύση

    Σχετικά με ποιανού η εργασιακή εμπειρία και φτιαγμένοδείγμα. Το δείγμα μέσης εργασιακής εμπειρίας... αυτών των εργαζομένων και φτιαγμένοδείγμα. Η μέση διάρκεια για το δείγμα... 1,16, επίπεδο σημαντικότητας α = 0,05. Λύση. Μεταβλητή σειράαυτού του δείγματος μοιάζει με: 0,71 ...

  • Πρόγραμμα εργασίας στη βιολογία για τις τάξεις 10-11 Συντάχθηκε από: Polikarpova S. V.

    Πρόγραμμα σπουδών εργασίας

    Τα απλούστερα σχήματα διέλευσης» 5 L.r. " Λύσηστοιχειώδη γενετικά προβλήματα» 6 L.b. " Λύσηστοιχειώδη γενετικά προβλήματα» 7 L.r. «..., 110, 115, 112, 110. Συνθέτω μεταβλητή σειρά, σχεδιάζω μεταβλητήκαμπύλη, βρείτε τη μέση τιμή του χαρακτηριστικού...