Στατιστική επεξεργασία δεδομένων. Επεξεργασία στατιστικών δεδομένων Ορισμός επεξεργασίας στατιστικών δεδομένων

  • Διαφάνεια 2

    • Η στατιστική είναι μια ακριβής επιστήμη που μελετά μεθόδους συλλογής, ανάλυσης και επεξεργασίας δεδομένων που περιγράφουν μαζικές ενέργειες, φαινόμενα και διαδικασίες
    • Η μαθηματική στατιστική είναι ένας κλάδος των μαθηματικών που μελετά μεθόδους συλλογής, συστηματοποίησης και επεξεργασίας των αποτελεσμάτων των παρατηρήσεων φαινομένων τυχαίας μάζας προκειμένου να προσδιορίσει τα υπάρχοντα πρότυπα.
  • Διαφάνεια 3

    Μελέτες στατιστικών

    • τον αριθμό των επιμέρους πληθυσμιακών ομάδων της χώρας και των περιφερειών της,
    • παραγωγή και κατανάλωση διαφόρων τύπων προϊόντων,
    • μεταφορά εμπορευμάτων και επιβατών με διάφορους τρόπους μεταφοράς,
    • φυσικούς πόρους και πολλά άλλα.
    • Τα αποτελέσματα των στατιστικών μελετών χρησιμοποιούνται ευρέως για πρακτικά και επιστημονικά συμπεράσματα.
    • Επί του παρόντος, οι στατιστικές έχουν αρχίσει ήδη να μελετώνται Λύκειο, στα πανεπιστήμια αυτό είναι υποχρεωτικό μάθημα, γιατί συνδέεται με πολλές επιστήμες και πεδία.
    • Για να αυξηθεί ο αριθμός των πωλήσεων σε ένα κατάστημα, να βελτιωθεί η ποιότητα της γνώσης στο σχολείο, να οδηγηθεί η χώρα προς την οικονομική ανάπτυξη, είναι απαραίτητο να γίνουν στατιστικές μελέτες και να εξαχθούν κατάλληλα συμπεράσματα. Και όλοι πρέπει να μπορούν να το κάνουν αυτό.
  • Διαφάνεια 4

    Οι κύριοι στόχοι της μελέτης των στοιχείων της στατιστικής

    • Διαμόρφωση δεξιοτήτων στην πρωτογενή επεξεργασία στατιστικών δεδομένων.
    • εικόνα και ανάλυση ποσοτικών πληροφοριών που παρουσιάζονται σε διάφορες μορφές (με τη μορφή πινάκων, διαγραμμάτων, γραφημάτων πραγματικών εξαρτήσεων).
    • ανάπτυξη ιδεών για σημαντικές στατιστικές ιδέες, συγκεκριμένα: η ιδέα της εκτίμησης και η ιδέα της δοκιμής στατιστικών υποθέσεων.
    • ανάπτυξη της ικανότητας σύγκρισης των πιθανοτήτων συμβάντων τυχαίων γεγονότων με τα αποτελέσματα συγκεκριμένων πειραμάτων.
  • Διαφάνεια 5

    • Σειρά δεδομένων
    • Όγκος σειράς δεδομένων
    • Εύρος σειρών δεδομένων
    • Λειτουργία σειράς δεδομένων
    • Διάμεσος της σειράς
    • Μέση τιμή
    • Παραγγελθείσες σειρές δεδομένων
    • Πίνακας διανομής δεδομένων
    • Ας το συνοψίσουμε
    • Ονομαστική σειρά δεδομένων
    • Συχνότητα Αποτελεσμάτων
    • Ποσοστό συχνότητας
    • Ομαδοποίηση δεδομένων
    • Μέθοδοι επεξεργασίας δεδομένων
    • Ας το συνοψίσουμε
  • Διαφάνεια 6

    Ορισμός

    • Μια σειρά δεδομένων είναι μια σειρά αποτελεσμάτων ορισμένων μετρήσεων.
    • Για παράδειγμα: 1) μέτρηση του ύψους του ανθρώπου
    • 2) Μετρήσεις βάρους ανθρώπου (ζώου).
    • 3) Ενδείξεις μετρητών (ηλεκτρισμός, νερό, θερμότητα...)
    • 4) Αποτελέσματα στα 100 μέτρα
    • Και τα λοιπά.
  • Διαφάνεια 7

    • Ο όγκος μιας σειράς δεδομένων είναι ο όγκος όλων των δεδομένων.
    • Για παράδειγμα: δίνεται μια σειρά αριθμών 1. 3; 6; -4; 0
    • ο όγκος του θα είναι ίσος με 5. Γιατί;
  • Διαφάνεια 8

    Ολοκληρώστε την εργασία

    • Προσδιορίστε τον όγκο αυτής της σειράς.
    • Απάντηση: 10
  • Διαφάνεια 9

    Ορισμός

    • Το εύρος είναι η διαφορά μεταξύ του μεγαλύτερου και του μικρότερου αριθμού σε μια σειρά δεδομένων.
    • Για παράδειγμα: αν δοθεί μια σειρά αριθμών 1; 3; 6; -4; 0; 2, τότε το εύρος αυτής της σειράς δεδομένων θα είναι ίσο με 6 (αφού 6 – 0 = 6)
  • Διαφάνεια 10

    Ολοκληρώστε την εργασία

    • Στο ινστιτούτο κάναμε ένα τεστ στα ανώτερα μαθηματικά. Υπήρχαν 10 άτομα στην ομάδα και έλαβαν τις αντίστοιχες βαθμολογίες: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Προσδιορίστε το εύρος αυτής της σειράς.
    • Απάντηση: 3
  • Διαφάνεια 11

    Ορισμός

    • Ο τρόπος λειτουργίας μιας σειράς δεδομένων είναι ο αριθμός της σειράς που εμφανίζεται πιο συχνά σε αυτήν τη σειρά.
    • Μια σειρά δεδομένων μπορεί να έχει ή να μην έχει λειτουργία.
    • Έτσι, στις σειρές δεδομένων 47, 46, 50, 52, 47, 52, 49, 45, 43, 53, καθένας από τους αριθμούς 47 και 52 εμφανίζεται δύο φορές και οι υπόλοιποι αριθμοί είναι λιγότεροι από δύο φορές. Σε τέτοιες περιπτώσεις, συμφωνήθηκε ότι η σειρά έχει δύο τρόπους: 47 και 52.
  • Διαφάνεια 12

    Ολοκληρώστε την εργασία

    • Έτσι, στη σειρά δεδομένων
    • 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 καθένας από τους αριθμούς 47 και 52 εμφανίζεται δύο φορές και οι υπόλοιποι αριθμοί είναι λιγότεροι από δύο φορές. Σε τέτοιες περιπτώσεις, συμφωνήθηκε ότι η σειρά έχει δύο τρόπους: 47 και 52.
    • Στο ινστιτούτο κάναμε ένα τεστ στα ανώτερα μαθηματικά. Υπήρχαν 10 άτομα στην ομάδα και έλαβαν τις κατάλληλες βαθμολογίες:
    • 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Προσδιορίστε τη λειτουργία αυτής της σειράς.
    • Απάντηση: 4
  • Διαφάνεια 13

    Ορισμός

    • Διάμεσος με περιττό αριθμό όρων είναι ο αριθμός που γράφεται στη μέση.
    • Διάμεσος με ζυγό αριθμό όρων είναι ο αριθμητικός μέσος όρος των δύο αριθμών που γράφονται στη μέση.
    • Για παράδειγμα: προσδιορίστε τη διάμεσο μιας σειράς αριθμών
    • 16; -4; 5; -2; -3; 3; 3; -2; 3. Απάντηση: -3
    • 2) -1; 0; 2; 1; -1; 0;2; -1. Απάντηση: 0
  • Διαφάνεια 14

    Ολοκληρώστε την εργασία

    • Στο ινστιτούτο κάναμε ένα τεστ στα ανώτερα μαθηματικά. Υπήρχαν 10 άτομα στην ομάδα και έλαβαν τις αντίστοιχες βαθμολογίες: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Προσδιορίστε τη διάμεσο αυτής της σειράς.
    • Απάντηση: 4
  • Διαφάνεια 15

    Ορισμός

    • Ο αριθμητικός μέσος όρος είναι το πηλίκο της διαίρεσης του αθροίσματος των αριθμών μιας σειράς με τον αριθμό τους.
    • Για παράδειγμα: δίνεται μια σειρά αριθμών -1; 0; 2; 1; -1; 0; 2; -1. Τότε ο αριθμητικός μέσος όρος θα είναι ίσος με: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0,25
  • Διαφάνεια 16

    Ολοκληρώστε την εργασία

    • Στο ινστιτούτο κάναμε ένα τεστ στα ανώτερα μαθηματικά. Υπήρχαν 10 άτομα στην ομάδα και έλαβαν τις αντίστοιχες βαθμολογίες: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Προσδιορίστε τον αριθμητικό μέσο όρο αυτής της σειράς.
    • Απάντηση: 3.9
  • Διαφάνεια 17

    Πρακτική δουλειά

    • Εργασία: χαρακτηρίστε την επίδοση του μαθητή Ivanov στα μαθηματικά για το τέταρτο τρίμηνο.
    • ΟΛΟΚΛΗΡΩΣΗ ΤΗΣ ΕΡΓΑΣΙΑΣ:
    • 1.Συλλογή πληροφοριών:
    • Οι βαθμοί που γράφονται από το περιοδικό είναι: 5,4,5,3,3,5,4,4,4.
    • 2.Επεξεργασία ληφθέντων δεδομένων:
    • όγκος = 9
    • εύρος = 5 - 3 = 2
    • μόδα = 4
    • διάμεσος = 3
    • αριθμητικός μέσος όρος =(5+4+5+3+3+5+4+4+4) : 9 ≈ 4
    • Χαρακτηριστικά της ακαδημαϊκής επίδοσης: ο μαθητής δεν είναι πάντα έτοιμος για το μάθημα.
    • Κυρίως σπουδάζει με βαθμούς «4». Το ένα τέταρτο βγαίνει στο "4".
  • Διαφάνεια 18

    Από μόνος του

    • Πρέπει να βρούμε τον όγκο της σειράς, το εύρος της σειράς, τον τρόπο λειτουργίας, τη διάμεσο και τον αριθμητικό μέσο όρο:
    • Κάρτα 1. 22,5; 23; 21,5; 22; 23.
    • Κάρτα 2. 6; -4; 5; -2; -3; 3; 3; -2; 3.
    • Κάρτα 3. 12,5; 12; 12; 12,5; 13; 12,5; 13.
    • Κάρτα 4. -1; 0; 2; 1; -1; 0; 2; -1.
    • Κάρτα 5. 125; 130; 124; 131.
    • Κάρτα 6. 120; 100; 110.
  • Διαφάνεια 19

    Ας ελέγξουμε

    • Κάρτα 1.
    • όγκος σειράς = 5
    • εύρος σειράς = 10
    • μόδα = 23
    • διάμεσος = 21,5
    • αριθμητικός μέσος όρος = 13,3
    • Κάρτα 3.
    • όγκος σειράς = 7
    • εύρος σειράς = 1
    • λειτουργία = 12,5
    • διάμεσος = 12,5
    • αριθμητικός μέσος όρος = 12,5
    • Κάρτα 2.
    • όγκος σειράς = 9
    • εύρος σειράς = 10
    • μόδα = 3
    • διάμεσος = -3
    • αριθμητικός μέσος όρος = 1
    • Κάρτα 4.
    • όγκος σειράς = 8
    • εύρος σειράς = 3
    • λειτουργία = -1
    • διάμεσος = 0
    • αριθμητικός μέσος όρος = 0,25
  • Διαφάνεια 20

    • Κάρτα 5.
    • όγκος σειράς = 4
    • εύρος σειρών = 7
    • μόδα = όχι
    • διάμεσος = 127
    • αριθμητικός μέσος όρος =127,5
    • Κάρτα 6.
    • όγκος σειράς = 3
    • εύρος εύρους = 20
    • μόδα = όχι
    • διάμεσος = 100
    • αριθμητικός μέσος όρος = 110
  • Διαφάνεια 21

    Ορισμός

    • Οι σειρές διατεταγμένων δεδομένων είναι σειρές στις οποίες τα δεδομένα είναι διατεταγμένα σύμφωνα με κάποιον κανόνα.
    • Πώς να οργανώσετε μια σειρά αριθμών; (Γράψτε τους αριθμούς έτσι ώστε κάθε επόμενος αριθμός να μην είναι μικρότερος (όχι περισσότερο) από τον προηγούμενο). ή γράψτε μερικά ονόματα «αλφαβητικά»...
  • Διαφάνεια 22

    Ολοκληρώστε την εργασία

    • Δίνεται μια σειρά αριθμών:
    • -1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1
    • Ταξινομήστε το σε αύξοντες αριθμούς.
    • Λύση:
    • -3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3
    • Το αποτέλεσμα είναι μια διατεταγμένη σειρά. Τα ίδια τα δεδομένα δεν έχουν αλλάξει, έχει αλλάξει μόνο η σειρά με την οποία εμφανίζονται.
  • Διαφάνεια 23

    Ορισμός

    • Ένας πίνακας διανομής δεδομένων είναι ένας πίνακας μιας σειράς σειράς στον οποίο, αντί να επαναλαμβάνεται ο ίδιος αριθμός, καταγράφεται ο αριθμός των επαναλήψεων.
    • Αντίθετα, εάν ο πίνακας κατανομής είναι γνωστός, τότε μπορεί να μεταγλωττιστεί μια διατεταγμένη σειρά δεδομένων.
    • Για παράδειγμα:
    • Από αυτό παίρνουμε την εξής διατεταγμένη σειρά:
    • -3;-3;-3;-1;-1;-1;-1;5;5;7;8;8;8;8;8
  • Διαφάνεια 24

    Ολοκληρώστε την εργασία

    • Σε κατάστημα γυναικείων υποδημάτων, έγινε στατιστική έρευνα και καταρτίστηκε αντίστοιχος πίνακας για την τιμή των παπουτσιών και τον αριθμό των πωλήσεων:
    • Τιμή (RUB): 500 1200 1500 1800 2000 2500
    • Ποσότητα: 8 9 14 15 3 1
    • Για αυτούς τους δείκτες, πρέπει να βρείτε στατιστικά χαρακτηριστικά:
    • δημιουργήστε μια διατεταγμένη σειρά δεδομένων
    • όγκος σειρών δεδομένων
    • σειρά σειράς
    • σειρά μόδας
    • διάμεσος της σειράς
    • αριθμητικός μέσος όρος μιας σειράς δεδομένων
  • Διαφάνεια 25

    Και απαντήστε στις παρακάτω ερωτήσεις

    • Από αυτές τις κατηγορίες τιμών, σε ποια τιμή δεν πρέπει να πουλάει το κατάστημα τα παπούτσια;
    • Παπούτσια, σε τι τιμή πρέπει να διανεμηθούν;
    • Σε ποια τιμή πρέπει να στοχεύσετε;
  • Διαφάνεια 26

    Ας το συνοψίσουμε

    • Γνωριστήκαμε με τις αρχικές έννοιες του τρόπου με τον οποίο γίνεται η επεξεργασία στατιστικών δεδομένων:
    • Τα δεδομένα είναι πάντα το αποτέλεσμα κάποιου είδους μέτρησης
    • Μπορούν να βρεθούν ορισμένα δεδομένα:
    • ένταση, εύρος, λειτουργία, διάμεσος και
    • μέση τιμή
    • 3) οποιαδήποτε σειρά δεδομένων μπορεί να είναι
    • οργανώνουν και συνθέτουν
    • πίνακα διανομής δεδομένων
  • Διαφάνεια 27

    Ορισμός

    • Η ονομαστική σειρά δεδομένων ΔΕΝ είναι ΑΡΙΘΜΗΤΙΚΑ ΔΕΔΟΜΕΝΑ, αλλά, για παράδειγμα, ονόματα. τίτλοι? υποψηφιότητες...
    • Για παράδειγμα: λίστα με τους φιναλίστ του Παγκοσμίου Κυπέλλου από το 1930: Αργεντινή, Τσεχοσλοβακία, Ουγγαρία, Βραζιλία, Ουγγαρία, Σουηδία, Τσεχοσλοβακία, Γερμανία, Ιταλία, Ολλανδία, Ολλανδία, Γερμανία, Γερμανία,
    • Αργεντινή, Ιταλία, Βραζιλία, Γερμανία, Γαλλία
  • Διαφάνεια 28

    Ολοκληρώστε την εργασία

    • Βρείτε από το προηγούμενο παράδειγμα:
    • όγκος σειράς 2) τρόπος σειράς
    • 3) δημιουργήστε έναν πίνακα διανομής
    • Λύση: όγκος = 18; μόδα – γερμανική ομάδα.
  • Εργαστηριακή εργασία Νο 3. Επεξεργασία στατιστικών δεδομένων στο σύστημα MatLab

    Γενική δήλωση του προβλήματος

    Ο κύριος σκοπός της εκτέλεσης εργαστηριακές εργασίεςείναι να εξοικειωθείτε με τα βασικά της εργασίας με την επεξεργασία στατιστικών δεδομένων στο περιβάλλον MatLAB.

    Θεωρητικό μέρος

    Πρωτογενής επεξεργασία στατιστικών δεδομένων

    Η επεξεργασία στατιστικών δεδομένων βασίζεται σε πρωτογενείς και δευτερογενείς ποσοτικές μεθόδους. Ο σκοπός της πρωτογενούς επεξεργασίας των στατιστικών δεδομένων είναι η δομή των πληροφοριών που λαμβάνονται, η οποία περιλαμβάνει την ομαδοποίηση των δεδομένων σε συνοπτικούς πίνακες σύμφωνα με διάφορες παραμέτρους. Τα πρωτεύοντα δεδομένα πρέπει να παρουσιάζονται σε μορφή που να επιτρέπει σε ένα άτομο να κάνει μια κατά προσέγγιση αξιολόγηση του προκύπτοντος συνόλου δεδομένων και να προσδιορίζει πληροφορίες σχετικά με την κατανομή δεδομένων του προκύπτοντος δείγματος δεδομένων, όπως την ομοιογένεια ή τη συμπαγή των δεδομένων. Μετά την πρωτογενή ανάλυση δεδομένων, εφαρμόζονται μέθοδοι δευτερογενούς επεξεργασίας στατιστικών δεδομένων, βάσει των οποίων καθορίζονται στατιστικά πρότυπα στο υπάρχον σύνολο δεδομένων.

    Η διεξαγωγή πρωτογενούς στατιστικής ανάλυσης σε έναν πίνακα δεδομένων σάς επιτρέπει να αποκτήσετε γνώσεις για τα ακόλουθα:

    Ποια τιμή είναι πιο χαρακτηριστική για το δείγμα; Για να απαντηθεί αυτό το ερώτημα, ορίζονται μέτρα κεντρικής τάσης.

    Πόσο μεγάλη είναι η εξάπλωση των δεδομένων σε σχέση με αυτή τη χαρακτηριστική τιμή, δηλαδή ποια είναι η «ασαφής» των δεδομένων; ΣΕ σε αυτήν την περίπτωσηκαθορίζονται μέτρα μεταβλητότητας.

    Αξίζει να σημειωθεί το γεγονός ότι οι στατιστικοί δείκτες κεντρικής τάσης και μεταβλητότητας καθορίζονται μόνο σε ποσοτικά δεδομένα.

    Μέτρα κεντρικής τάσης– μια ομάδα τιμών γύρω από την οποία ομαδοποιούνται τα υπόλοιπα δεδομένα. Έτσι, τα μέτρα κεντρικής τάσης γενικεύουν τη σειρά των δεδομένων, γεγονός που καθιστά δυνατό τον σχηματισμό συμπερασμάτων τόσο για το δείγμα στο σύνολό του όσο και για τη διεξαγωγή συγκριτική ανάλυσηδιαφορετικά δείγματα μεταξύ τους.

    Ας υποθέσουμε ότι έχουμε ένα δείγμα δεδομένων, τότε τα μέτρα κεντρικής τάσης αξιολογούνται με τους ακόλουθους δείκτες:

    1. Δείγμα μέσου όρουείναι το αποτέλεσμα της διαίρεσης του αθροίσματος όλων των τιμών του δείγματος με τον αριθμό τους. Καθορίζεται από τον τύπο (3.1).

    (3.1)

    Οπου - Εγώτο στοιχείο της επιλογής.

    n– αριθμός δειγματοληπτικών στοιχείων.

    Ο μέσος όρος του δείγματος παρέχει τη μεγαλύτερη ακρίβεια στη διαδικασία εκτίμησης της κεντρικής τάσης.

    Ας πούμε ότι έχουμε ένα δείγμα 20 ατόμων. Τα στοιχεία του δείγματος είναι πληροφορίες σχετικά με το μέσο μηνιαίο εισόδημα κάθε ατόμου. Ας υποθέσουμε ότι 19 άτομα έχουν μέσο μηνιαίο εισόδημα 20 χιλιάδες ρούβλια. και 1 άτομο με εισόδημα 300 τρ. Το συνολικό μηνιαίο εισόδημα ολόκληρου του δείγματος είναι 680 ρούβλια. Ο μέσος όρος του δείγματος σε αυτή την περίπτωση είναι S=34.


    2. Διάμεσος– σχηματίζει μια τιμή πάνω και κάτω από την οποία ο αριθμός των διαφορετικών τιμών είναι ο ίδιος, δηλαδή αυτή είναι η κεντρική τιμή σε μια διαδοχική σειρά δεδομένων. Προσδιορίζεται ανάλογα με τον ζυγό/μονό αριθμό στοιχείων στο δείγμα χρησιμοποιώντας τους τύπους (3.2) ή (3.3). Αλγόριθμος για την εκτίμηση της διάμεσης τιμής για ένα δείγμα δεδομένων:

    Πρώτα απ 'όλα, τα δεδομένα ταξινομούνται (ταξινομούνται) με φθίνουσα/αύξουσα σειρά.

    Εάν το διατεταγμένο δείγμα έχει περιττό αριθμό στοιχείων, τότε η διάμεσος συμπίπτει με την κεντρική τιμή.

    (3.2)

    Οπου n

    Στην περίπτωση ζυγού αριθμού στοιχείων, η διάμεσος ορίζεται ως ο αριθμητικός μέσος όρος των δύο κεντρικών τιμών.

    (3.3)

    πού είναι το μέσο στοιχείο του παραγγελθέντος δείγματος;

    - στοιχείο της διατεταγμένης επιλογής δίπλα στο ;

    Αριθμός στοιχείων δείγματος.

    Εάν όλα τα στοιχεία του δείγματος είναι διαφορετικά, τότε ακριβώς τα μισά από τα στοιχεία του δείγματος είναι μεγαλύτερα από τη διάμεσο και τα άλλα μισά είναι λιγότερα. Για παράδειγμα, για το δείγμα (1, 5, 9, 15, 16), η διάμεσος είναι ίση με το στοιχείο 9.

    Στην ανάλυση στατιστικών δεδομένων, η διάμεσος βοηθά στον εντοπισμό στοιχείων δείγματος που επηρεάζουν σε μεγάλο βαθμό την τιμή του μέσου όρου του δείγματος.

    Ας πούμε ότι έχουμε ένα δείγμα 20 ατόμων. Τα στοιχεία του δείγματος είναι πληροφορίες σχετικά με το μέσο μηνιαίο εισόδημα κάθε ατόμου. Ας υποθέσουμε ότι 19 άτομα έχουν μέσο μηνιαίο εισόδημα 20 χιλιάδες ρούβλια. και 1 άτομο με εισόδημα 300 τρ. Το συνολικό μηνιαίο εισόδημα ολόκληρου του δείγματος είναι 680 ρούβλια. Η διάμεσος, μετά την παραγγελία του δείγματος, ορίζεται ως ο αριθμητικός μέσος όρος του δέκατου και του ενδέκατου στοιχείου του δείγματος) και ισούται με Me = 20 tr. Αυτό το αποτέλεσμαερμηνεύεται ως εξής: ο διάμεσος χωρίζει το δείγμα σε δύο ομάδες, έτσι ώστε να μπορούμε να συμπεράνουμε ότι στην πρώτη ομάδα κάθε άτομο έχει μέσο μηνιαίο εισόδημα που δεν υπερβαίνει τα 20 χιλιάδες ρούβλια και στη δεύτερη ομάδα όχι λιγότερο από 20 χιλιάδες ρούβλια . ΣΕ σε αυτό το παράδειγμαμπορούμε να πούμε ότι ο διάμεσος χαρακτηρίζεται από το πόσα κερδίζει ο «μέσος όρος». Ενώ η τιμή του μέσου όρου του δείγματος υπερβαίνει σημαντικά S=34, γεγονός που υποδηλώνει το μη αποδεκτό αυτού του χαρακτηριστικού κατά την αξιολόγηση των μέσων αποδοχών.

    Έτσι, όσο μεγαλύτερη είναι η διαφορά μεταξύ του μέσου όρου και του μέσου όρου του δείγματος, τόσο μεγαλύτερη είναι η διασπορά των δεδομένων του δείγματος (στο εξεταζόμενο παράδειγμα, ένα άτομο με εισόδημα 300 ρούβλια διαφέρει σαφώς από τον μέσο όρο των ατόμων σε ένα συγκεκριμένο δείγμα και έχει σημαντική αντίκτυπο στην εκτίμηση του μέσου εισοδήματος). Τι να κάνετε με τέτοια στοιχεία αποφασίζεται σε κάθε μεμονωμένη περίπτωση. Αλλά στη γενική περίπτωση, για να εξασφαλιστεί η αξιοπιστία του δείγματος, αφαιρούνται, καθώς έχουν ισχυρή επιρροή στην αξιολόγηση των στατιστικών δεικτών.

    3. Μόδα (Mo)– δημιουργεί την τιμή που εμφανίζεται πιο συχνά στο δείγμα, δηλαδή την τιμή με την υψηλότερη συχνότητα. Αλγόριθμος εκτίμησης λειτουργίας:

    Στην περίπτωση που ένα δείγμα περιέχει στοιχεία που εμφανίζονται εξίσου συχνά, λέγεται ότι δεν υπάρχει τρόπος λειτουργίας σε ένα τέτοιο δείγμα.

    Αν δύο γειτονικά στοιχείατα δείγματα έχουν την ίδια συχνότητα, η οποία είναι μεγαλύτερη από τη συχνότητα των υπολοίπων στοιχείων του δείγματος, τότε η λειτουργία ορίζεται ως ο μέσος όρος αυτών των δύο τιμών.

    Εάν δύο στοιχεία δείγματος έχουν την ίδια συχνότητα, η οποία είναι μεγαλύτερη από τη συχνότητα των υπόλοιπων στοιχείων δείγματος, και αυτά τα στοιχεία δεν είναι γειτονικά, τότε το δείγμα λέγεται ότι έχει δύο τρόπους λειτουργίας.

    Η λειτουργία στη στατιστική ανάλυση χρησιμοποιείται σε καταστάσεις όπου είναι απαραίτητη μια γρήγορη αξιολόγηση του μέτρου της κεντρικής τάσης και δεν απαιτείται υψηλή ακρίβεια. Για παράδειγμα, η μόδα (κατά μέγεθος ή επωνυμία) μπορεί να χρησιμοποιηθεί εύκολα για τον προσδιορισμό των ρούχων και των παπουτσιών που έχουν τη μεγαλύτερη ζήτηση από τους πελάτες.

    Μέτρα διασποράς (μεταβλητότητα)– μια ομάδα στατιστικών δεικτών που χαρακτηρίζουν τις διαφορές μεταξύ των μεμονωμένων τιμών δείγματος. Με βάση τους δείκτες των μέτρων διασποράς, μπορεί να εκτιμηθεί ο βαθμός ομοιογένειας και συμπαγούς των στοιχείων του δείγματος. Τα μέτρα διασποράς χαρακτηρίζονται από το ακόλουθο σύνολο δεικτών:

    1. Εύρος -αυτό είναι το διάστημα μεταξύ των μέγιστων και ελάχιστων τιμών των αποτελεσμάτων παρατήρησης (στοιχεία δείγματος). Ο δείκτης εύρους υποδεικνύει την εξάπλωση των τιμών στο σύνολο δεδομένων. Εάν το εύρος είναι μεγάλο, τότε οι τιμές στο σύνολο είναι πολύ διάσπαρτες, διαφορετικά (το εύρος είναι μικρό) λέγεται ότι οι τιμές στο σύνολο βρίσκονται κοντά η μία στην άλλη. Το εύρος προσδιορίζεται από τον τύπο (3.4).

    (3.4)

    Οπου - μέγιστο στοιχείο δείγματος.

    - ελάχιστο στοιχείο δείγματος.

    2.Μέση απόκλιση– αριθμητική μέση διαφορά (σε απόλυτη τιμή) μεταξύ κάθε τιμής στο δείγμα και της μέσης τιμής του δείγματος. Η μέση απόκλιση προσδιορίζεται από τον τύπο (3.5).

    (3.5)

    Οπου - Εγώτο στοιχείο της επιλογής.

    Η μέση τιμή του δείγματος υπολογίστηκε με τον τύπο (3.1).

    Αριθμός στοιχείων δείγματος.

    Μονάδα μέτρησης αναγκαίες λόγω του γεγονότος ότι οι αποκλίσεις από τον μέσο όρο για κάθε συγκεκριμένο στοιχείο μπορεί να είναι θετικές και αρνητικές. Κατά συνέπεια, εάν δεν πάρετε τη μονάδα, τότε το άθροισμα όλων των αποκλίσεων θα είναι κοντά στο μηδέν και θα είναι αδύνατο να κριθεί ο βαθμός μεταβλητότητας των δεδομένων (συνωστισμός δεδομένων γύρω από τη μέση τιμή του δείγματος). Κατά την εκτέλεση στατιστικής ανάλυσης, ο τρόπος λειτουργίας και η διάμεσος μπορούν να ληφθούν αντί του μέσου όρου του δείγματος.

    3. Διασπορά- ένα μέτρο διασποράς που περιγράφει τη συγκριτική απόκλιση μεταξύ των τιμών δεδομένων και της μέσης τιμής. Υπολογίζεται ως το άθροισμα των τετραγωνικών αποκλίσεων κάθε στοιχείου δείγματος από τη μέση τιμή. Ανάλογα με το μέγεθος του δείγματος, εκτιμάται η διακύμανση διαφορετικοί τρόποι:

    Για μεγάλα δείγματα (n>30) σύμφωνα με τον τύπο (3.6)

    (3.6)

    Για μικρά δείγματα (αρ<30) по формуле (3.7)

    (3.7)

    όπου X i είναι το i-ο δείγμα δείγματος.

    S – μέσος όρος δείγματος;

    Αριθμός στοιχείων δείγματος.

    (X i – S) - απόκλιση από τη μέση τιμή για κάθε τιμή του συνόλου δεδομένων.

    4. Τυπική απόκλιση-ένα μέτρο του πόσο ευρέως διασκορπισμένα είναι τα σημεία δεδομένων σε σχέση με τον μέσο όρο τους.

    Η διαδικασία τετραγωνισμού μεμονωμένων αποκλίσεων κατά τον υπολογισμό της διακύμανσης αυξάνει τον βαθμό απόκλισης της προκύπτουσας απόκλισης από τις αρχικές αποκλίσεις, γεγονός που με τη σειρά του εισάγει πρόσθετα σφάλματα. Έτσι, για να φέρουμε την εκτίμηση της εξάπλωσης των σημείων δεδομένων σε σχέση με τον μέσο όρο τους πιο κοντά στην τιμή της μέσης απόκλισης, λαμβάνεται η τετραγωνική ρίζα της διακύμανσης. Η εξαγόμενη ρίζα της διακύμανσης χαρακτηρίζει ένα μέτρο μεταβλητότητας που ονομάζεται μέση τετραγωνική ρίζα ή τυπική απόκλιση (3.8).

    (3.8)

    Ας υποθέσουμε ότι είστε ο διαχειριστής ενός έργου ανάπτυξης λογισμικού. Έχετε πέντε προγραμματιστές υπό τις εντολές σας. Με τη διαχείριση της διαδικασίας εκτέλεσης του έργου, κατανέμετε εργασίες μεταξύ των προγραμματιστών. Για να απλοποιήσουμε το παράδειγμα, θα προχωρήσουμε από το γεγονός ότι οι εργασίες είναι ίσες σε πολυπλοκότητα και χρόνο ολοκλήρωσης. Αποφασίσατε να αναλύσετε την εργασία κάθε προγραμματιστή (ο αριθμός των ολοκληρωμένων εργασιών κατά τη διάρκεια της εβδομάδας) τις τελευταίες 10 εβδομάδες, ως αποτέλεσμα των οποίων λάβατε τα ακόλουθα δείγματα:

    Όνομα εβδομάδας

    Υπολογίζοντας τον μέσο αριθμό των ολοκληρωμένων εργασιών, λαμβάνετε το ακόλουθο αποτέλεσμα:

    Όνομα εβδομάδας μικρό
    22,3
    22,4
    22,2
    22,1
    22,5

    Με βάση τον δείκτη S, όλοι οι προγραμματιστές εργάζονται κατά μέσο όρο με την ίδια απόδοση (περίπου 22 εργασίες την εβδομάδα). Ωστόσο, ο δείκτης μεταβλητότητας (εύρος) είναι πολύ υψηλός (από 5 εργασίες για τον τέταρτο προγραμματιστή έως 24 εργασίες για τον πέμπτο).

    Όνομα εβδομάδας μικρό Π
    22,3
    22,4
    22,2
    22,1
    22,5

    Ας υπολογίσουμε την τυπική απόκλιση, η οποία δείχνει πώς κατανέμονται οι τιμές στα δείγματα σε σχέση με τον μέσο όρο, και συγκεκριμένα, στην περίπτωσή μας, να υπολογίσουμε πόσο μεγάλη είναι η διαφορά στην ολοκλήρωση της εργασίας από εβδομάδα σε εβδομάδα.

    Όνομα εβδομάδας μικρό Π ΕΤΣΙ
    22,3 1,56
    22,4 1,8
    22,2 2,84
    22,1 1,3
    22,5 5,3

    Η προκύπτουσα εκτίμηση της τυπικής απόκλισης δείχνει τα εξής (θα αξιολογήσουμε δύο ακραίες περιπτώσεις, τους προγραμματιστές 4 και 5):

    Κάθε τιμή στο δείγμα των 4 προγραμματιστών αποκλίνει κατά μέσο όρο κατά 1,3 εκχωρήσεις από τη μέση τιμή.

    Κάθε τιμή στο δείγμα του προγραμματιστή 5 αποκλίνει κατά μέσο όρο κατά 5,3 στοιχεία από τη μέση τιμή.

    Όσο πιο κοντά είναι η τυπική απόκλιση στο 0, τόσο πιο αξιόπιστη είναι η μέση τιμή, καθώς δείχνει ότι κάθε τιμή στο δείγμα είναι σχεδόν ίση με τη μέση τιμή (στο παράδειγμά μας, 22,5 στοιχεία). Επομένως, ο προγραμματιστής 4 είναι ο πιο συνεπής, σε αντίθεση με τον προγραμματιστή 5. Η μεταβλητότητα της ολοκλήρωσης της εργασίας από εβδομάδα σε εβδομάδα για τον 5ο προγραμματιστή είναι 5,3 εργασίες, που υποδηλώνει σημαντική εξάπλωση. Στην περίπτωση του 5ου προγραμματιστή, ο μέσος όρος δεν μπορεί να εμπιστευτεί και, ως εκ τούτου, είναι δύσκολο να προβλεφθεί ο αριθμός των ολοκληρωμένων εργασιών για την επόμενη εβδομάδα, γεγονός που με τη σειρά του περιπλέκει τη διαδικασία σχεδιασμού και την τήρηση των χρονοδιαγραμμάτων εργασίας. Δεν έχει σημασία ποια απόφαση διαχείρισης παίρνετε σε αυτό το μάθημα. Είναι σημαντικό να λάβετε μια αξιολόγηση βάσει της οποίας μπορείτε να λάβετε τις κατάλληλες αποφάσεις διαχείρισης.

    Έτσι, μπορεί να εξαχθεί ένα γενικό συμπέρασμα ότι ο μέσος όρος δεν αξιολογεί πάντα σωστά τα δεδομένα. Η ορθότητα της μέσης εκτίμησης μπορεί να κριθεί από την τιμή της τυπικής απόκλισης.

    Οι μέθοδοι για τη στατιστική επεξεργασία των πειραματικών αποτελεσμάτων είναι μαθηματικές τεχνικές, τύποι, μέθοδοι ποσοτικών υπολογισμών, με τη βοήθεια των οποίων οι δείκτες που λαμβάνονται κατά τη διάρκεια ενός πειράματος μπορούν να γενικευτούν, να εισαχθούν σε ένα σύστημα, αποκαλύπτοντας κρυμμένα μοτίβα σε αυτά.

    Μιλάμε για μοτίβα στατιστικής φύσης που υπάρχουν μεταξύ των μεταβλητών που μελετήθηκαν στο πείραμα.

    Δεδομένα είναι τα βασικά στοιχεία που πρέπει να ταξινομηθούν ή να κατηγοριοποιηθούν για τους σκοπούς της επεξεργασίας 26 .

    Ορισμένες από τις μεθόδους μαθηματικής-στατιστικής ανάλυσης καθιστούν δυνατό τον υπολογισμό των λεγόμενων στοιχειωδών μαθηματικών στατιστικών που χαρακτηρίζουν τη δειγματοληπτική κατανομή των δεδομένων, για παράδειγμα:

    Δείγμα μέσου όρου,

    Διακύμανση δείγματος,

    Median και μια σειρά από άλλα.

    Άλλες μέθοδοι μαθηματικών στατιστικών καθιστούν δυνατό να κρίνουμε τη δυναμική των αλλαγών σε μεμονωμένα δείγματα στατιστικών στοιχείων, για παράδειγμα:

    Ανάλυση της διακύμανσης,

    Ανάλυση παλινδρόμησης.

    Χρησιμοποιώντας την τρίτη ομάδα μεθόδων δειγματοληψίας δεδομένων, μπορεί κανείς να κρίνει αξιόπιστα τις στατιστικές σχέσεις που υπάρχουν μεταξύ των μεταβλητών που μελετώνται σε αυτό το πείραμα:

    Ανάλυση συσχέτισης;

    Παραγοντική ανάλυση;

    Μέθοδοι σύγκρισης.

    Όλες οι μέθοδοι μαθηματικής και στατιστικής ανάλυσης χωρίζονται συμβατικά σε πρωτογενείς και δευτερεύουσες 27 .

    Οι κύριες μέθοδοι είναι εκείνες που μπορούν να χρησιμοποιηθούν για τη λήψη δεικτών που αντικατοπτρίζουν άμεσα τα αποτελέσματα των μετρήσεων που έγιναν σε ένα πείραμα.

    Οι δευτερεύουσες μέθοδοι ονομάζονται μέθοδοι στατιστικής επεξεργασίας, με τη βοήθεια των οποίων, με βάση πρωτογενή δεδομένα, αποκαλύπτονται στατιστικά πρότυπα που κρύβονται σε αυτές.

    Οι κύριες μέθοδοι στατιστικής επεξεργασίας περιλαμβάνουν, για παράδειγμα:

    Προσδιορισμός του μέσου όρου του δείγματος;

    Διακύμανση δείγματος;

    Επιλεκτική μόδα;

    Διάμεσος δείγματος.

    Οι δευτερεύουσες μέθοδοι συνήθως περιλαμβάνουν:

    Ανάλυση συσχέτισης;

    Ανάλυση παλινδρόμησης;

    Μέθοδοι σύγκρισης πρωτογενών στατιστικών σε δύο ή περισσότερα δείγματα.

    Ας εξετάσουμε μεθόδους για τον υπολογισμό στοιχειωδών μαθηματικών στατιστικών, ξεκινώντας από τον μέσο όρο του δείγματος.

    Αριθμητικός μέσος όρος - είναι ο λόγος του αθροίσματος όλων των τιμών δεδομένων προς τον αριθμό των όρων 28.

    Η μέση τιμή ως στατιστικός δείκτης αντιπροσωπεύει τη μέση εκτίμηση της ψυχολογικής ποιότητας που μελετήθηκε στο πείραμα.

    Η αξιολόγηση αυτή χαρακτηρίζει το βαθμό ανάπτυξής της συνολικά στην ομάδα των υποκειμένων που υποβλήθηκαν σε ψυχοδιαγνωστική εξέταση. Συγκρίνοντας απευθείας τις μέσες τιμές δύο ή περισσότερων δειγμάτων, μπορούμε να κρίνουμε τον σχετικό βαθμό ανάπτυξης της αξιολογούμενης ποιότητας στα άτομα που απαρτίζουν αυτά τα δείγματα.

    Ο μέσος όρος του δείγματος προσδιορίζεται χρησιμοποιώντας τον ακόλουθο τύπο 29:

    όπου x cf είναι ο μέσος όρος του δείγματος ή ο αριθμητικός μέσος όρος του δείγματος.

    n είναι ο αριθμός των ατόμων στο δείγμα ή οι ιδιωτικοί ψυχοδιαγνωστικοί δείκτες βάσει των οποίων υπολογίζεται η μέση τιμή.

    x k - ιδιωτικές τιμές δεικτών για μεμονωμένα θέματα. Υπάρχουν n τέτοιοι δείκτες συνολικά, επομένως ο δείκτης k αυτής της μεταβλητής παίρνει τιμές από 1 έως n.

    ∑ είναι το πρόσημο που είναι αποδεκτό στα μαθηματικά για την άθροιση των τιμών εκείνων των μεταβλητών που βρίσκονται στα δεξιά αυτού του σημείου.

    Διασπορά είναι ένα μέτρο της εξάπλωσης των δεδομένων σε σχέση με τη μέση τιμή του 30.

    Όσο μεγαλύτερη είναι η διακύμανση, τόσο μεγαλύτερη είναι η απόκλιση ή η εξάπλωση των δεδομένων. Καθορίζεται έτσι ώστε να είναι δυνατή η διάκριση μεταξύ των τιμών που έχουν τον ίδιο μέσο όρο, αλλά διαφορετική διασπορά.

    Η διακύμανση καθορίζεται από τον ακόλουθο τύπο:

    πού είναι η διακύμανση του δείγματος, ή απλά η διακύμανση;

    Μια έκφραση που σημαίνει ότι για όλα τα x k από το πρώτο έως το τελευταίο σε ένα δεδομένο δείγμα, είναι απαραίτητο να υπολογιστούν οι διαφορές μεταξύ των μερικών και μέσων τιμών, να τετραγωνιστούν αυτές οι διαφορές και να αθροιστούν.

    n είναι ο αριθμός των υποκειμένων στο δείγμα ή οι πρωτογενείς τιμές από τις οποίες υπολογίζεται η διακύμανση.

    Διάμεσος είναι η τιμή του χαρακτηριστικού που μελετάται, που διαιρεί το δείγμα, ταξινομημένο με την τιμή αυτού του χαρακτηριστικού, στο μισό.

    Η γνώση της διάμεσης τιμής είναι χρήσιμη προκειμένου να προσδιοριστεί εάν η κατανομή των μερικών τιμών του μελετημένου χαρακτηριστικού είναι συμμετρική και προσεγγίζει τη λεγόμενη κανονική κατανομή. Ο μέσος όρος και ο διάμεσος για μια κανονική κατανομή είναι συνήθως ο ίδιος ή πολύ λίγο διαφορετικός μεταξύ τους.

    Εάν η κατανομή του δείγματος των χαρακτηριστικών είναι κανονική, τότε μπορούν να εφαρμοστούν σε αυτήν μέθοδοι δευτερογενών στατιστικών υπολογισμών που βασίζονται στην κανονική κατανομή των δεδομένων. Διαφορετικά, αυτό δεν μπορεί να γίνει, καθώς ενδέχεται να υπάρξουν σοβαρά σφάλματα στους υπολογισμούς.

    Μόδα άλλο ένα στοιχειώδες μαθηματικό στατιστικό και χαρακτηριστικό της κατανομής των πειραματικών δεδομένων. Mode είναι η ποσοτική τιμή του χαρακτηριστικού που μελετάται, το οποίο βρίσκεται πιο συχνά στο δείγμα.

    Για συμμετρικές κατανομές χαρακτηριστικών, συμπεριλαμβανομένης της κανονικής κατανομής, οι τιμές λειτουργίας συμπίπτουν με τις τιμές του μέσου όρου και της διάμεσης. Για άλλους τύπους κατανομών, ασύμμετρες, αυτό δεν είναι τυπικό.

    Η μέθοδος δευτερογενούς στατιστικής επεξεργασίας, μέσω της οποίας προσδιορίζεται η σύνδεση ή η άμεση εξάρτηση μεταξύ δύο σειρών πειραματικών δεδομένων, ονομάζεται μέθοδος ανάλυσης συσχέτισης. Δείχνει πώς ένα φαινόμενο επηρεάζει ή σχετίζεται με ένα άλλο στη δυναμική του. Εξαρτήσεις αυτού του είδους υπάρχουν, για παράδειγμα, μεταξύ μεγεθών που βρίσκονται σε σχέση αιτίου-αποτελέσματος μεταξύ τους. Εάν αποδειχθεί ότι δύο φαινόμενα συσχετίζονται στατιστικά σημαντικά μεταξύ τους και εάν υπάρχει βεβαιότητα ότι το ένα από αυτά μπορεί να λειτουργήσει ως αιτία του άλλου φαινομένου, τότε το συμπέρασμα ότι υπάρχει σχέση αιτίου-αποτελέσματος μεταξύ τους σίγουρα ακολουθεί.

    Υπάρχουν διάφορες ποικιλίες αυτής της μεθόδου:

    Η ανάλυση γραμμικής συσχέτισης σάς επιτρέπει να δημιουργήσετε άμεσες συνδέσεις μεταξύ μεταβλητών με βάση τις απόλυτες τιμές τους. Αυτές οι συνδέσεις εκφράζονται γραφικά με μια ευθεία γραμμή, εξ ου και η ονομασία «γραμμική».

    Ο συντελεστής γραμμικής συσχέτισης προσδιορίζεται χρησιμοποιώντας τον ακόλουθο τύπο 31:

    όπου r xy - γραμμικός συντελεστής συσχέτισης;

    x, y -μέσες τιμές δείγματος των συγκριτικών τιμών·

    Χ Εγώ , y Εγώ - ιδιωτικές τιμές δειγμάτων συγκριτικών ποσοτήτων·

    Π -ο συνολικός αριθμός των τιμών στη συγκριτική σειρά δεικτών·

    Διασπορές, αποκλίσεις συγκριτικών τιμών από τις μέσες τιμές.

    Η συσχέτιση κατάταξης καθορίζει την εξάρτηση όχι μεταξύ των απόλυτων τιμών των μεταβλητών, αλλά μεταξύ των τακτικών θέσεων, ή βαθμών, που καταλαμβάνουν σε μια σειρά ταξινομημένες κατά τιμή. Ο τύπος για τον συντελεστή συσχέτισης κατάταξης είναι ο ακόλουθος 32:

    όπου R s είναι ο συντελεστής συσχέτισης κατάταξης Spearman.

    ρε Εγώ - τη διαφορά μεταξύ των βαθμών των δεικτών των ίδιων θεμάτων σε διατεταγμένες σειρές·

    Π -τον αριθμό των θεμάτων ή των ψηφιακών δεδομένων (τάξεις) σε συσχετισμένες σειρές.

    Σκοπός του μαθήματος:
    - δημιουργία συνθηκών για την κατάκτηση του θέματος σε επίπεδο κατανόησης και κύριας απομνημόνευσης.
    - για τη διαμόρφωση της μαθηματικής ικανότητας της προσωπικότητας του μαθητή.

    Στόχοι μαθήματος
    Εκπαιδευτικός:σχηματίζουν μια ιδέα της στατιστικής ως επιστήμης. εξοικείωση των μαθητών με τις έννοιες των βασικών στατιστικών χαρακτηριστικών. αναπτύξουν την ικανότητα να βρίσκουν το εύρος και τη λειτουργία μιας σειράς, να αναλύουν δεδομένα και να βελτιώνουν τις νοητικές δεξιότητες υπολογισμού.
    Εκπαιδευτικός:να προωθήσουν την κυριαρχία των εννοιών και την ερμηνεία τους· ανάπτυξη δεξιοτήτων ανάλυσης, σύγκρισης, συστηματοποίησης και γενίκευσης υπερθεματικών. Συνέχιση του σχηματισμού της γλώσσας του θέματος, προώθηση του σχηματισμού βασικών ικανοτήτων (γνωστικές, πληροφοριακές, επικοινωνιακές) σε διάφορα στάδια του μαθήματος, προώθηση της διαμόρφωσης μιας ενιαίας επιστημονικής εικόνας του κόσμου μεταξύ των μαθητών, εντοπίζοντας διεπιστημονικές συνδέσεις μεταξύ στατιστικών και διαφόρων επιστημών.
    Εκπαιδευτικός:καλλιέργεια ενδιαφέροντος για το αντικείμενο που μελετάται, την κουλτούρα της πληροφορίας. ετοιμότητα συμμόρφωσης με γενικά αποδεκτούς κανόνες και κανόνες, υψηλή απόδοση και οργάνωση.

    Τεχνολογίες που χρησιμοποιούνται: Τεχνολογία μαθητοκεντρικής μάθησης, τεχνολογίες πληροφορικής και επικοινωνίας.
    Απαραίτητος εξοπλισμός, υλικά: προβολέας πολυμέσων, υπολογιστής, διαδραστικός πίνακας.

    Κατά τη διάρκεια των μαθημάτων

    1. Οργανωτική στιγμή.

    Έλεγχος της ετοιμότητας των μαθητών για το μάθημα

    Έλεγχος συμμετοχής

    2. Ορισμός στόχου.

    Το σκεπτικό για την ανάγκη μελέτης αυτού του θέματος

    Συμμετοχή των μαθητών στη διαδικασία καθορισμού των στόχων του μαθήματος

    Από ποιες πηγές λαμβάνουμε και συλλέγουμε πληροφορίες; (Προτεινόμενες απαντήσεις: ραδιόφωνο, τηλεόραση, εφημερίδες, περιοδικά, τηλέφωνο, άνθρωποι, Διαδίκτυο, επιστολές).

    Πού αποθηκεύουν οι άνθρωποι πληροφορίες; (Προτεινόμενες απαντήσεις : στη μνήμη και σε εξωτερικά μέσα).
    Η φοίτηση σε μια τεχνική σχολή είναι η απόκτηση πληροφοριών; Στο σχολείο σπούδαζες μαθήματα γενικής παιδείας, αλλά όταν σπουδάζεις σε τεχνική σχολή τι άλλο παίρνεις; (Προτεινόμενη απάντηση: s επαγγελματική γνώση).Όσο περισσότερα μαθαίνουμε, τόσο περισσότερες πληροφορίες περιέχει η μνήμη μας.

    Σήμερα σας προσφέρω άλλη μια πληροφορία. Εκπαιδεύεστε ως χειριστής εξόρυξης, θα εργαστείτε σε εκσκαφείς EKG-8I. Ποια είναι η απόδοση αυτού του εκσκαφέα. Κατόπιν αιτήματός μου, το εργοστάσιο μου παρείχε τις ακόλουθες πληροφορίες. (Απόδοση εκσκαφέα - πίνακας)

    Από απορρίμματα πετρωμάτων (χιλιάδες τόνοι)

    Παιδιά, οι πολλές πληροφορίες είναι καλές; Μπορούν όλες οι πληροφορίες να είναι χρήσιμες και υψηλής ποιότητας; Τι πρέπει να μπορούμε να κάνουμε για να μη χαθούμε στον λαβύρινθο των πληροφοριών; (Αναμενόμενη απάντηση των μαθητών: "Πρέπει να είναι σε θέση να διαχωρίζει χρήσιμες, υψηλής ποιότητας πληροφορίες από πληροφορίες χαμηλής ποιότητας.") Εκείνοι. να μπορέσει να το επεξεργαστεί.

    ΣΥΜΠΕΡΑΣΜΑ: σήμερα στο μάθημα θα μάθουμε να επεξεργαζόμαστε πληροφορίες.

    3. Οργάνωση δραστηριοτήτων μελέτης νέου υλικού.(οι μαθητές κάνουν σημειώσεις σε τετράδια και ολοκληρώνουν εργασίες κατά τη διαδικασία της επεξήγησης)

    1. Ορισμός στατιστικών

    Τι είναι τα στατιστικά; Λέγεται ότι ο Άγγλος πρωθυπουργός Benjamin Disraeli (1804 - 1881) απάντησε σε αυτό το ερώτημα ως εξής: «Υπάρχουν τρία είδη ψεμάτων: ψέματα, καταραμένα ψέματα και στατιστικές».

    Στατιστικήείναι μια ακριβής επιστήμη που μελετά μεθόδους συλλογής, ανάλυσης και επεξεργασίας δεδομένων που περιγράφουν μαζικές ενέργειες, φαινόμενα και διαδικασίες.

    (Διαβάζεται ένα απόσπασμα από το μυθιστόρημα «Οι δώδεκα καρέκλες» των Ilf και Petrov.

    «Η στατιστική ξέρει τα πάντα», είναι γνωστό πόσο φαγητό τρώει ο μέσος πολίτης της δημοκρατίας ετησίως: είναι γνωστό πόσοι κυνηγοί, μπαλαρίνες: μηχανές, ποδήλατα, μνημεία, φάροι και ραπτομηχανές στη χώρα: Πόση ζωή, γεμάτη από λαχτάρα, πάθη και σκέψεις, μας κοιτάζει από στατιστικούς πίνακες!...»

    Το όνομά του προέρχεται από τη λατινική λέξη "status" - κατάσταση, από αυτή τη ρίζα οι λέξεις stato (ιταλικά), statistik (γερμανικά), state (αγγλικά) - κατάσταση.

    Μελέτες στατιστικών:

    Οι κύριοι στόχοι της μελέτης των στοιχείων της στατιστικής:

    • τον αριθμό των επιμέρους πληθυσμιακών ομάδων της χώρας και των περιφερειών της,
    • παραγωγή και κατανάλωση διαφόρων τύπων προϊόντων,
    • μεταφορά εμπορευμάτων και επιβατών με διάφορους τρόπους μεταφοράς,
    • φυσικούς πόρους και πολλά άλλα.

    Γνωρίζετε σε ποια χώρα ξεκίνησε η στατιστική πρακτική (στην Κίνα)· οι πρώτες απογραφές πληθυσμού της χώρας χρονολογούνται από τον 5ο αιώνα. II χιλιετία π.Χ

    Τον 19ο αιώνα κατέστη δυνατή η επεξεργασία δεδομένων χρησιμοποιώντας τύπους, μαθηματικούς νόμους και ειδικά χαρακτηριστικά. Αυτό?.... ( χαλάκι. στατιστική).

    2. Στατιστικά μαθηματικών

    Στατιστικά μαθηματικώνείναι κλάδος των μαθηματικών που μελετά μεθόδους συλλογής, συστηματοποίησης και επεξεργασίας των αποτελεσμάτων των παρατηρήσεων φαινομένων τυχαίας μάζας με σκοπό τον εντοπισμό υπαρχόντων προτύπων.

    Γιατί λοιπόν ο Ντισραέλι συνέκρινε τα στατιστικά στοιχεία με ψέματα; (Δεν υπήρχε καμία επιστημονική, αυστηρή επεξεργασία πληροφοριών· τα δεδομένα ερμηνεύονταν από οποιονδήποτε όπως ήθελε).

    Η μαθηματική στατιστική έχει καθολικές μεθόδους επεξεργασίας πληροφοριών
    Αυτό επέτρεψε στους ήρωες της ταινίας "Office Romance" να πουν τα ακόλουθα λόγια για τα στατιστικά στοιχεία ( απόσπασμα της ταινίας "Office Romance").
    ΣΥΜΠΕΡΑΣΜΑ: Οι στατιστικές φέρνουν πληροφορίες στο σύστημα.

    3. Γραφική αναπαράσταση πληροφοριών

    Πολύγωνο διανομής

    Ιστόγραμμα κατανομής

    Διάγραμμα πίτας

    4. Χαρακτηριστικά μέτρησης
    1. Μια σειρά δεδομένων είναι μια σειρά αποτελεσμάτων οποιωνδήποτε μετρήσεων.

    Για παράδειγμα: 1) μέτρηση του ύψους του ανθρώπου

    2) Μετρήσεις βάρους ανθρώπου (ζώου).

    3) Ενδείξεις μετρητών (ηλεκτρισμός, νερό, θερμότητα...)

    4) Αποτελέσματα στα 100 μέτρα

    2. Όγκος μιας σειράς δεδομένων - ο όγκος μιας σειράς δεδομένων είναι ο όγκος όλων των δεδομένων.

    Για παράδειγμα:δίνεται μια σειρά αριθμών 1. 3; 6; -4; 0

    ο όγκος του θα είναι ίσος με 5. Γιατί;

    3. Το εύρος μιας σειράς δεδομένων είναι η διαφορά μεταξύ του μεγαλύτερου και του μικρότερου αριθμού από μια σειρά δεδομένων.

    Για παράδειγμα:αν δοθεί μια σειρά αριθμών 1? 3; 6; -4; 0; 2, λοιπόν πεδίο εφαρμογήςαυτή η σειρά δεδομένων θα είναι ίση με 6 (αφού 6 - 0 = 6)

    4. Λειτουργία μιας σειράς δεδομένων - η λειτουργία μιας σειράς δεδομένων είναι ο αριθμός της σειράς που εμφανίζεται πιο συχνά σε αυτήν τη σειρά.

    Για παράδειγμα: σελτο data poison μπορεί να έχει ή να μην έχει λειτουργία.

    Έτσι, στις σειρές δεδομένων 47, 46, 50, 52, 47, 52, 49, 45, 43, 53, καθένας από τους αριθμούς 47 και 52 εμφανίζεται δύο φορές και οι υπόλοιποι αριθμοί είναι λιγότεροι από δύο φορές. Σε τέτοιες περιπτώσεις, συμφωνήθηκε ότι η σειρά έχει δύο τρόπους: 47 και 52.

    5. Διάμεσος της σειράς

    Διάμεσος με περιττό αριθμό όρων είναι ο αριθμός που γράφεται στη μέση.

    Διάμεσος με ζυγό αριθμό όρων - αυτός είναι ο αριθμητικός μέσος όρος των δύο αριθμών που γράφονται στη μέση.

    Για παράδειγμα: προσδιορίστε τη διάμεσο μιας σειράς αριθμών

    16; -4; 5; -2; -3; 3; 3; -2; 3. Απάντηση: -3

    2) -1; 0; 2; 1; -1; 0;2; -1. Απάντηση: 0

    6. Ο αριθμητικός μέσος όρος είναι το πηλίκο της διαίρεσης του αθροίσματος των αριθμών μιας σειράς με τον αριθμό τους.

    Για παράδειγμα: δίνεται μια σειρά αριθμών -1; 0; 2; 1; -1; 0; 2; -1. Τότε ο αριθμητικός μέσος όρος θα είναι ίσος με: (-1+0+2+1+(-1)+0+2+(-1)): 8 = 2: 8 = 0,25

    4. Εμπέδωση της μελετημένης ύλης.

    Πρακτική δουλειά

    Ασκηση:χαρακτηρίζουν την επίδοση του μαθητή Peter Ivanov στα μαθηματικά για το τέταρτο τρίμηνο.

    Ολοκλήρωση της εργασίας:

    1. Συλλογή πληροφοριών:

    Οι βαθμοί που γράφονται από το περιοδικό είναι: 5,4,5,3,3,5,4,4,4.

    2. Επεξεργασία ληφθέντων δεδομένων:

    Διάλεξη 12. Μέθοδοι στατιστικής επεξεργασίας αποτελεσμάτων.

    Οι μέθοδοι για τη στατιστική επεξεργασία των αποτελεσμάτων είναι μαθηματικές τεχνικές, τύποι, μέθοδοι ποσοτικών υπολογισμών, με τη βοήθεια των οποίων οι δείκτες που λαμβάνονται κατά τη διάρκεια ενός πειράματος μπορούν να γενικευτούν, να εισαχθούν σε ένα σύστημα, αποκαλύπτοντας μοτίβα που κρύβονται σε αυτά. Μιλάμε για μοτίβα στατιστικής φύσης που υπάρχουν μεταξύ των μεταβλητών που μελετήθηκαν στο πείραμα.

    1. Μέθοδοι πρωτογενούς στατιστικής επεξεργασίας πειραματικών αποτελεσμάτων

    Όλες οι μέθοδοι μαθηματικής και στατιστικής ανάλυσης χωρίζονται συμβατικά σε πρωτογενείς και δευτερογενείς. Οι κύριες μέθοδοι είναι εκείνες που μπορούν να χρησιμοποιηθούν για τη λήψη δεικτών που αντικατοπτρίζουν άμεσα τα αποτελέσματα των μετρήσεων που έγιναν σε ένα πείραμα. Αντίστοιχα, ως πρωτογενείς στατιστικοί δείκτες εννοούμε αυτούς που χρησιμοποιούνται στις ίδιες τις ψυχοδιαγνωστικές μεθόδους και είναι αποτέλεσμα της αρχικής στατιστικής επεξεργασίας των ψυχοδιαγνωστικών αποτελεσμάτων. Οι δευτερεύουσες μέθοδοι ονομάζονται μέθοδοι στατιστικής επεξεργασίας, με τη βοήθεια των οποίων, με βάση πρωτογενή δεδομένα, αποκαλύπτονται στατιστικά πρότυπα που κρύβονται σε αυτές.

    Οι κύριες μέθοδοι στατιστικής επεξεργασίας περιλαμβάνουν, για παράδειγμα, τον προσδιορισμό του μέσου όρου του δείγματος, της διακύμανσης του δείγματος, του τρόπου λειτουργίας δείγματος και του μέσου όρου του δείγματος. Οι δευτερεύουσες μέθοδοι περιλαμβάνουν συνήθως ανάλυση συσχέτισης, ανάλυση παλινδρόμησης και μεθόδους σύγκρισης πρωτογενών στατιστικών σε δύο ή περισσότερα δείγματα.

    Ας εξετάσουμε μεθόδους υπολογισμού στοιχειωδών μαθηματικών στατιστικών.

    ΜόδαΟνομάζουν την ποσοτική τιμή του χαρακτηριστικού που μελετάται, το οποίο βρίσκεται συχνότερα στο δείγμα.

    Διάμεσοςείναι η τιμή του χαρακτηριστικού που μελετάται, που διαιρεί το δείγμα, ταξινομημένο με την τιμή αυτού του χαρακτηριστικού, στο μισό.

    Δείγμα μέσου όρουΗ (αριθμητική μέση) τιμή ως στατιστικός δείκτης αντιπροσωπεύει τη μέση εκτίμηση της ψυχολογικής ποιότητας που μελετήθηκε στο πείραμα.

    Σκορπίζω(μερικές φορές αυτή η τιμή ονομάζεται εύρος) του δείγματος συμβολίζεται με το γράμμα R. Αυτός είναι ο απλούστερος δείκτης που μπορεί να ληφθεί για το δείγμα - η διαφορά μεταξύ των μέγιστων και ελάχιστων τιμών αυτής της συγκεκριμένης σειράς παραλλαγών.

    Διασποράείναι ο αριθμητικός μέσος όρος των τετραγωνικών αποκλίσεων των τιμών μιας μεταβλητής από τη μέση τιμή της.

    2. Μέθοδοι δευτερογενούς στατιστικής επεξεργασίας πειραματικών αποτελεσμάτων

    Με τη βοήθεια δευτερογενών μεθόδων στατιστικής επεξεργασίας πειραματικών δεδομένων, υποθέσεις που σχετίζονται με το πείραμα ελέγχονται άμεσα, αποδεικνύονται ή διαψεύδονται. Αυτές οι μέθοδοι, κατά κανόνα, είναι πιο περίπλοκες από τις μεθόδους πρωτογενούς στατιστικής επεξεργασίας και απαιτούν από τον ερευνητή να είναι καλά εκπαιδευμένος στα στοιχειώδη μαθηματικά και τη στατιστική.

    Η ομάδα μεθόδων υπό συζήτηση μπορεί να χωριστεί σε διάφορες υποομάδες:

    1 Λογισμός παλινδρόμησης

    Ο λογισμός παλινδρόμησης είναι μια μέθοδος μαθηματικών στατιστικών που καθιστά δυνατή τη μείωση ιδιωτικών, διάσπαρτων δεδομένων σε κάποιο γραμμικό γράφημα που αντικατοπτρίζει κατά προσέγγιση την εσωτερική τους σχέση και να μπορεί να εκτιμήσει κατά προσέγγιση την πιθανή τιμή μιας άλλης μεταβλητής με βάση την τιμή μιας από τις μεταβλητές.

    2.Συσχετισμός

    Η επόμενη μέθοδος δευτερογενούς στατιστικής επεξεργασίας, μέσω της οποίας προσδιορίζεται η σύνδεση ή η άμεση εξάρτηση μεταξύ δύο σειρών πειραματικών δεδομένων, ονομάζεται μέθοδος συσχετισμών. Δείχνει πώς ένα φαινόμενο επηρεάζει ή σχετίζεται με ένα άλλο στη δυναμική του. Εξαρτήσεις αυτού του είδους υπάρχουν, για παράδειγμα, μεταξύ μεγεθών που βρίσκονται σε σχέση αιτίου-αποτελέσματος μεταξύ τους. Εάν αποδειχθεί ότι δύο φαινόμενα συσχετίζονται στατιστικά σημαντικά μεταξύ τους και εάν υπάρχει βεβαιότητα ότι το ένα από αυτά μπορεί να λειτουργήσει ως αιτία του άλλου φαινομένου, τότε το συμπέρασμα ότι υπάρχει σχέση αιτίου-αποτελέσματος μεταξύ τους σίγουρα ακολουθεί.

    3 Παραγοντική ανάλυση

    Η παραγοντική ανάλυση είναι μια στατιστική μέθοδος που χρησιμοποιείται κατά την επεξεργασία μεγάλων ποσοτήτων πειραματικών δεδομένων. Οι στόχοι της παραγοντικής ανάλυσης είναι: η μείωση του αριθμού των μεταβλητών (μείωση δεδομένων) και ο προσδιορισμός της δομής των σχέσεων μεταξύ των μεταβλητών, δηλ. ταξινόμηση μεταβλητών, επομένως η παραγοντική ανάλυση χρησιμοποιείται ως μέθοδος μείωσης δεδομένων ή ως μέθοδος δομικής ταξινόμησης.

    Επιθεώρηση των ερωτήσεων

    1.Τι είναι οι μέθοδοι στατιστικής επεξεργασίας;

    2.Σε ποιες υποομάδες χωρίζονται οι δευτερεύουσες μέθοδοι στατιστικής επεξεργασίας;

    3. Εξηγήστε την ουσία της μεθόδου συσχέτισης;

    4. Σε ποιες περιπτώσεις χρησιμοποιούνται μέθοδοι στατιστικής επεξεργασίας;

    5. Πόσο αποτελεσματική πιστεύετε ότι είναι η χρήση μεθόδων στατιστικής επεξεργασίας στην επιστημονική έρευνα;

    2. Εξετάστε τα χαρακτηριστικά των μεθόδων επεξεργασίας στατιστικών δεδομένων.

    Βιβλιογραφία

    1.. Gorbatov D.S. Εργαστήριο για την ψυχολογική έρευνα: Proc. επίδομα. - Samara: "BAKHRAH - M", 2003. - 272 σελ.

    2. Ermolaev A.Yu. Μαθηματική στατιστική για ψυχολόγους. - Μ.: Ψυχολογικό και Κοινωνικό Ινστιτούτο Μόσχας: Flinta, 2003.336σ.

    3. Kornilova T.V. Εισαγωγή στο ψυχολογικό πείραμα. Εγχειρίδιο για τα πανεπιστήμια. Μ.: Εκδοτικός Οίκος CheRo, 2001.