Statistička obrada podataka. Statistička obrada podataka Definicija statističke obrade podataka

  • Slajd 2

    • Statistika je egzaktna nauka koja proučava metode prikupljanja, analize i obrade podataka koji opisuju masovne akcije, pojave i procese
    • Matematička statistika je grana matematike koja proučava metode prikupljanja, sistematizacije i obrade rezultata posmatranja slučajnih masovnih pojava u cilju identifikacije postojećih obrazaca.
  • Slajd 3

    Statističke studije

    • broj pojedinih grupa stanovništva zemlje i njenih regija,
    • proizvodnju i potrošnju raznih vrsta proizvoda,
    • prevoz robe i putnika raznim vidovima transporta,
    • prirodni resursi i još mnogo toga.
    • Rezultati statističkih studija se široko koriste za praktične i naučne zaključke.
    • Trenutno se statistika počinje proučavati već u srednja škola, na univerzitetima je ovo obavezan predmet, jer je povezan sa mnogim naukama i oblastima.
    • Da bi se povećao broj prodaje u prodavnici, da bi se poboljšao kvalitet znanja u školi, da bi se zemlja pomerila ka ekonomskom rastu, potrebno je sprovesti statističke studije i izvući odgovarajuće zaključke. I svi bi to trebali moći.
  • Slajd 4

    Glavni ciljevi proučavanja elemenata statistike

    • Formiranje vještina primarne obrade statističkih podataka;
    • slika i analiza kvantitativnih informacija predstavljenih u različitim oblicima (u obliku tabela, dijagrama, grafikona realnih zavisnosti);
    • razvijanje ideja o važnim statističkim idejama, i to: ideja procjene i ideja testiranja statističkih hipoteza;
    • razvijanje sposobnosti da se uporede verovatnoće slučajnih događaja sa rezultatima specifičnih eksperimenata.
  • Slajd 5

    • Serija podataka
    • Volumen serije podataka
    • Raspon serija podataka
    • Način rada serije podataka
    • Medijan serije
    • Prosjek
    • Naručene serije podataka
    • Tabela distribucije podataka
    • Hajde da sumiramo
    • Nominativni niz podataka
    • Frekvencija rezultata
    • Procenat frekvencije
    • Grupisanje podataka
    • Metode obrade podataka
    • Hajde da sumiramo
  • Slajd 6

    Definicija

    • Serija podataka je niz rezultata nekih mjerenja.
    • Na primjer: 1) mjerenje ljudske visine
    • 2) Mjerenje ljudske (životinjske) težine
    • 3) Očitavanje brojila (struja, voda, toplota...)
    • 4) Rezultati u trci na 100 metara
    • itd.
  • Slajd 7

    • Volumen serije podataka je količina svih podataka.
    • Na primjer: dati niz brojeva 1; 3; 6; -4; 0
    • njegov volumen će biti jednak 5. Zašto?
  • Slajd 8

    Dovršite zadatak

    • Odredite zapreminu ove serije.
    • Odgovor: 10
  • Slajd 9

    Definicija

    • Raspon je razlika između najvećeg i najmanjeg broja u nizu podataka.
    • Na primjer: ako je dat niz brojeva 1; 3; 6; -4; 0; 2, tada će raspon ove serije podataka biti jednak 6 (pošto je 6 – 0 = 6)
  • Slajd 10

    Dovršite zadatak

    • Na institutu smo polagali test iz više matematike. U grupi je bilo 10 ljudi i dobili su odgovarajuće ocjene: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Odredite opseg ove serije.
    • Odgovor: 3
  • Slajd 11

    Definicija

    • Način serije podataka je broj serije koji se najčešće javlja u ovoj seriji.
    • Serija podataka može, ali i ne mora imati mod.
    • Tako se u serijama podataka 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 svaki od brojeva 47 i 52 pojavljuje dva puta, a preostali brojevi manje od dva puta. U takvim slučajevima dogovoreno je da serija ima dva načina rada: 47 i 52.
  • Slajd 12

    Dovršite zadatak

    • Dakle, u nizu podataka
    • 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 svaki od brojeva 47 i 52 pojavljuje se dva puta, a preostali brojevi manje od dva puta. U takvim slučajevima dogovoreno je da serija ima dva načina rada: 47 i 52.
    • Na institutu smo polagali test iz više matematike. U grupi je bilo 10 ljudi i dobili su odgovarajuće ocjene:
    • 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Odredite način ove serije.
    • Odgovor: 4
  • Slajd 13

    Definicija

    • Medijan s neparnim brojem pojmova je broj napisan u sredini.
    • Medijan s parnim brojem članova je aritmetička sredina dva broja zapisana u sredini.
    • Na primjer: odredite medijanu niza brojeva
    • 16; -4; 5; -2; -3; 3; 3; -2; 3. Odgovor: -3
    • 2) -1; 0; 2; 1; -1; 0;2; -1. Odgovor: 0
  • Slajd 14

    Dovršite zadatak

    • Na institutu smo polagali test iz više matematike. U grupi je bilo 10 ljudi i dobili su odgovarajuće ocjene: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Odredite medijanu ove serije.
    • Odgovor: 4
  • Slajd 15

    Definicija

    • Aritmetička sredina je količnik dijeljenja zbira brojeva u nizu njihovim brojem.
    • Na primjer: dati niz brojeva -1; 0; 2; 1; -1; 0; 2; -1. Tada će aritmetička sredina biti jednaka: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0,25
  • Slajd 16

    Dovršite zadatak

    • Na institutu smo polagali test iz više matematike. U grupi je bilo 10 ljudi i dobili su odgovarajuće ocjene: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • Odredite aritmetičku sredinu ove serije.
    • Odgovor: 3.9
  • Slajd 17

    Praktičan rad

    • Zadatak: okarakterizirati učinak učenika Ivanova iz matematike za četvrto tromjesečje.
    • ZAVRŠETAK POSLOVA:
    • 1. Prikupljanje informacija:
    • Ocjene ispisane iz časopisa su: 5,4,5,3,3,5,4,4,4.
    • 2. Obrada primljenih podataka:
    • zapremina = 9
    • raspon = 5 - 3 = 2
    • moda = 4
    • medijan = 3
    • aritmetička sredina =(5+4+5+3+3+5+4+4+4) : 9 ≈ 4
    • Karakteristike akademskog uspjeha: učenik nije uvijek spreman za čas.
    • Uglavnom uči sa ocjenom "4". Četvrtina izlazi na "4".
  • Slajd 18

    Na svoju ruku

    • Moramo pronaći volumen serije, raspon serije, mod, medijan i aritmetičku sredinu:
    • Kartica 1. 22.5; 23; 21.5; 22; 23.
    • Kartica 2. 6; -4; 5; -2; -3; 3; 3; -2; 3.
    • Kartica 3. 12.5; 12; 12; 12.5; 13; 12.5; 13.
    • Kartica 4. -1; 0; 2; 1; -1; 0; 2; -1.
    • Kartica 5. 125; 130; 124; 131.
    • Kartica 6. 120; 100; 110.
  • Slajd 19

    Hajde da proverimo

    • Kartica 1.
    • zapremina reda = 5
    • opseg reda = 10
    • moda = 23
    • medijan = 21,5
    • aritmetička sredina = 13,3
    • Kartica 3.
    • zapremina reda = 7
    • raspon serije = 1
    • mod = 12.5
    • medijan = 12,5
    • aritmetička sredina = 12,5
    • Kartica 2.
    • zapremina reda = 9
    • opseg reda = 10
    • moda = 3
    • medijan = -3
    • aritmetička sredina = 1
    • Kartica 4.
    • zapremina reda = 8
    • opseg reda = 3
    • mod = -1
    • medijan = 0
    • aritmetička sredina = 0,25
  • Slajd 20

    • Kartica 5.
    • zapremina reda = 4
    • opseg reda = 7
    • moda = br
    • medijan = 127
    • aritmetička sredina =127,5
    • Kartica 6.
    • zapremina reda = 3
    • raspon raspona = 20
    • moda = br
    • medijan = 100
    • aritmetička sredina = 110
  • Slajd 21

    Definicija

    • Uređene serije podataka su serije u kojima su podaci raspoređeni prema nekom pravilu.
    • Kako urediti niz brojeva? (Zapišite brojeve tako da svaki sljedeći broj nije manji (ne više) od prethodnog); ili zapišite neka imena "po abecedi"...
  • Slajd 22

    Dovršite zadatak

    • Dat niz brojeva:
    • -1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1
    • Sortirajte ga u rastućim brojevima.
    • Rješenje:
    • -3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3
    • Rezultat je uređena serija. Sami podaci se nisu promijenili, promijenio se samo redoslijed kojim se pojavljuju.
  • Slajd 23

    Definicija

    • Tablica distribucije podataka je tabela uređene serije u kojoj se, umjesto ponavljanja istog broja, bilježi broj ponavljanja.
    • Suprotno tome, ako je tabela distribucije poznata, tada se može sastaviti uređena serija podataka.
    • Na primjer:
    • Od njega dobijamo sledeću naređenu seriju:
    • -3;-3;-3;-1;-1;-1;-1;5;5;7;8;8;8;8;8
  • Slajd 24

    Dovršite zadatak

    • U jednoj prodavnici ženske obuće izvršeno je statističko istraživanje i sastavljena odgovarajuća tabela za cijenu obuće i broj prodaja:
    • Cijena (RUB): 500 1200 1500 1800 2000 2500
    • Količina: 8 9 14 15 3 1
    • Za ove indikatore morate pronaći statističke karakteristike:
    • kreirati uređenu seriju podataka
    • volumen serija podataka
    • raspon serije
    • modne serije
    • medijana serije
    • aritmetička sredina serije podataka
  • Slajd 25

    I odgovorite na sljedeća pitanja

    • Iz ovih cjenovnih kategorija, po kojoj cijeni trgovina ne bi trebala prodavati cipele?
    • Cipele, po kojoj cijeni da se distribuiraju?
    • Koju cijenu trebate ciljati?
  • Slajd 26

    Hajde da sumiramo

    • Upoznali smo se sa početnim konceptima kako se odvija statistička obrada podataka:
    • podaci su uvijek rezultat neke vrste mjerenja
    • Može se pronaći niz nekih podataka:
    • volumen, opseg, mod, medijan i
    • prosjek
    • 3) bilo koja serija podataka može biti
    • organizovati i komponovati
    • tabela distribucije podataka
  • Slajd 27

    Definicija

    • Nominativni niz podataka NISU NUMERIČKI PODACI, već, na primjer, imena; titule; nominacije...
    • Na primjer: lista finalista Svjetskog prvenstva od 1930: Argentina, Čehoslovačka, Mađarska, Brazil, Mađarska, Švedska, Čehoslovačka, Njemačka, Italija, Holandija, Holandija, Njemačka, Njemačka,
    • Argentina, Italija, Brazil, Njemačka, Francuska
  • Slajd 28

    Dovršite zadatak

    • Pronađite iz prethodnog primjera:
    • volumen reda 2) način reda
    • 3) kreirajte tabelu distribucije
    • Rešenje: zapremina = 18; moda – njemački tim.
  • Laboratorijski rad br. 3. Statistička obrada podataka u MatLab sistemu

    Opšta izjava o problemu

    Glavna svrha izvršenja laboratorijski rad je upoznavanje sa osnovama rada sa statističkom obradom podataka u MatLAB okruženju.

    Teorijski dio

    Primarna statistička obrada podataka

    Statistička obrada podataka zasniva se na primarnim i sekundarnim kvantitativnim metodama. Svrha primarne obrade statističkih podataka je strukturiranje dobijenih informacija, što uključuje grupisanje podataka u zbirne tabele prema različitim parametrima. Primarni podaci moraju biti predstavljeni u formatu koji omogućava osobi da napravi približnu procjenu rezultirajućeg skupa podataka i da identifikuje informacije o distribuciji podataka rezultirajućeg uzorka podataka, kao što je homogenost ili kompaktnost podataka. Nakon primarne analize podataka primjenjuju se metode sekundarne statističke obrade podataka na osnovu kojih se utvrđuju statistički obrasci u postojećem skupu podataka.

    Izvođenje primarne statističke analize na nizu podataka omogućava vam da steknete znanje o sljedećem:

    Koja je vrijednost najtipičnija za uzorak? Da bi se odgovorilo na ovo pitanje, definisane su mere centralne tendencije.

    Koliko je veliko širenje podataka u odnosu na ovu karakterističnu vrijednost, tj. koja je „zamućenost“ podataka? IN u ovom slučaju određuju se mjere varijabilnosti.

    Vrijedi napomenuti i činjenicu da se statistički pokazatelji centralne tendencije i varijabilnosti određuju samo na kvantitativnim podacima.

    Mjere centralne tendencije– grupa vrijednosti oko koje se grupišu ostali podaci. Dakle, mjere centralne tendencije generaliziraju niz podataka, što omogućava da se formiraju zaključci kako o uzorku u cjelini tako i da se komparativna analiza različiti uzorci jedni s drugima.

    Pretpostavimo da imamo uzorak podataka, tada se mjere centralne tendencije procjenjuju sljedećim indikatorima:

    1. Uzorak srednji je rezultat dijeljenja zbira svih vrijednosti uzorka njihovim brojem.Određuje se formulom (3.1).

    (3.1)

    Gdje - i th element selekcije;

    n– broj elemenata uzorka.

    Srednja vrijednost uzorka daje najveću tačnost u procesu procjene centralne tendencije.

    Recimo da imamo uzorak od 20 ljudi. Elementi uzorka su podaci o prosječnom mjesečnom prihodu svake osobe. Pretpostavimo da 19 ljudi ima prosječan mjesečni prihod od 20 hiljada rubalja. i 1 osoba sa prihodom od 300 tr. Ukupni mjesečni prihod cijelog uzorka je 680 rubalja. Srednja vrijednost uzorka u ovom slučaju je S=34.


    2. Medijan– formira vrijednost iznad i ispod koje je broj različitih vrijednosti isti, odnosno ovo je središnja vrijednost u nizu podataka koji se u nizu nalaze. Određuje se u zavisnosti od parnog/neparnog broja elemenata u uzorku pomoću formula (3.2) ili (3.3) Algoritam za procjenu medijane za uzorak podataka:

    Prije svega, podaci se rangiraju (poređaju) u silaznom/uzlaznom redoslijedu.

    Ako uređeni uzorak ima neparan broj elemenata, tada se medijan poklapa sa središnjom vrijednošću.

    (3.2)

    Gdje n

    U slučaju parnog broja elemenata, medijana se definira kao aritmetička sredina dvije središnje vrijednosti.

    (3.3)

    gdje je prosječni element naručenog uzorka;

    - element poredanog izbora pored ;

    Broj uzoraka elemenata.

    Ako su svi elementi uzorka različiti, tada je tačno polovina elemenata uzorka veća od medijane, a druga polovina je manja. Na primjer, za uzorak (1, 5, 9, 15, 16), medijan je jednak elementu 9.

    U statističkoj analizi podataka, medijan pomaže da se identifikuju elementi uzorka koji u velikoj meri utiču na vrednost srednje vrednosti uzorka.

    Recimo da imamo uzorak od 20 ljudi. Elementi uzorka su podaci o prosječnom mjesečnom prihodu svake osobe. Pretpostavimo da 19 ljudi ima prosječan mjesečni prihod od 20 hiljada rubalja. i 1 osoba sa prihodom od 300 tr. Ukupni mjesečni prihod cijelog uzorka je 680 rubalja. Medijan se nakon uređenja uzorka definira kao aritmetička sredina desetog i jedanaestog elementa uzorka) i jednaka je Me = 20 tr. Ovaj rezultat tumači se na sljedeći način: medijana dijeli uzorak u dvije grupe, tako da možemo zaključiti da u prvoj grupi svaka osoba ima prosječni mjesečni prihod od najviše 20 hiljada rubalja, au drugoj grupi ne manje od 20 hiljada rubalja. . IN u ovom primjeru možemo reći da medijan karakteriše koliko zarađuje “prosječna” osoba. Dok je vrijednost prosjeka uzorka značajno premašena S=34, što ukazuje na neprihvatljivost ove karakteristike pri procjeni prosječne zarade.

    Dakle, što je veća razlika između medijane i prosjeka uzorka, to je veća disperzija podataka uzorka (u razmatranom primjeru, osoba s prihodom od 300 rubalja jasno se razlikuje od prosječnih ljudi u određenom uzorku i ima značajan uticaj na procjenu prosječnog dohotka). Što učiniti s takvim elementima odlučuje se u svakom pojedinačnom slučaju. Ali u opštem slučaju, da bi se osigurala pouzdanost uzorka, oni se uklanjaju, jer imaju snažan uticaj na ocjenu statističkih pokazatelja.

    3. moda (pon.)– generira vrijednost koja se najčešće javlja u uzorku, tj. vrijednost s najvećom frekvencijom Algoritam procjene moda:

    U slučaju kada uzorak sadrži elemente koji se javljaju podjednako često, kaže se da u takvom uzorku nema moda.

    Ako dva susjedni elementi uzorci imaju istu frekvenciju, koja je veća od frekvencije preostalih elemenata uzorka, tada se mod definira kao prosjek ove dvije vrijednosti.

    Ako dva elementa uzorka imaju istu frekvenciju, koja je veća od frekvencije preostalih elemenata uzorka, a ti elementi nisu susjedni, onda se kaže da uzorak ima dva moda.

    Modus u statističkoj analizi koristi se u situacijama kada je neophodna brza procjena mjere centralne tendencije i nije potrebna visoka tačnost. Na primjer, moda (po veličini ili marki) može se prikladno koristiti za određivanje odjeće i obuće za kojima je najveća potražnja među kupcima.

    Mjere raspršenosti (varijabilnost)– grupa statističkih pokazatelja koji karakterišu razlike između pojedinačnih vrednosti uzorka. Na osnovu indikatora mjera disperzije može se ocijeniti stepen homogenosti i kompaktnosti elemenata uzorka. Mere disperzije karakteriše sledeći skup indikatora:

    1. Raspon - ovo je interval između maksimalne i minimalne vrijednosti rezultata posmatranja (elementi uzorka). Indikator raspona pokazuje širenje vrijednosti u skupu podataka. Ako je raspon velik, tada su vrijednosti u agregatu vrlo raštrkane, u suprotnom (opseg je mali) kaže se da vrijednosti u agregatu leže blizu jedna drugoj. Raspon je određen formulom (3.4).

    (3.4)

    Gdje - maksimalni element uzorka;

    - element minimalnog uzorka.

    2.Prosečno odstupanje– razlika srednje aritmetičke vrijednosti (u apsolutnoj vrijednosti) između svake vrijednosti u uzorku i srednje vrijednosti uzorka. Prosječna devijacija je određena formulom (3.5).

    (3.5)

    Gdje - i th element selekcije;

    Srednja vrijednost uzorka izračunata korištenjem formule (3.1);

    Broj uzoraka elemenata.

    Modul neophodno zbog činjenice da odstupanja od prosjeka za svaki pojedini element mogu biti i pozitivna i negativna. Shodno tome, ako ne uzmete modul, tada će zbir svih odstupanja biti blizu nule i biće nemoguće procijeniti stepen varijabilnosti podataka (natrpanost podataka oko srednje vrijednosti uzorka). Prilikom izvođenja statističke analize, mod i medijan se mogu uzeti umjesto srednje vrijednosti uzorka.

    3. Disperzija- mjera disperzije koja opisuje uporedno odstupanje između vrijednosti podataka i prosječne vrijednosti. Izračunava se kao zbir kvadrata odstupanja svakog elementa uzorka od prosječne vrijednosti. Ovisno o veličini uzorka, procjenjuje se varijansa Različiti putevi:

    Za velike uzorke (n>30) prema formuli (3.6)

    (3.6)

    Za male uzorke (n<30) по формуле (3.7)

    (3.7)

    gdje je X i i-ti element uzorka;

    S – srednja vrijednost uzorka;

    Broj elemenata uzorka;

    (X i – S) - odstupanje od prosječne vrijednosti za svaku vrijednost skupa podataka.

    4. Standardna devijacija- mjera koliko su široko rasute tačke podataka u odnosu na njihovu srednju vrijednost.

    Proces kvadriranja pojedinačnih odstupanja pri izračunavanju varijanse povećava stepen odstupanja rezultirajućeg odstupanja od prvobitnih odstupanja, što zauzvrat unosi dodatne greške. Dakle, da bi se procjena širenja tačaka podataka u odnosu na njihovu srednju vrijednost približila vrijednosti srednjeg odstupanja, uzima se kvadratni korijen varijanse. Izvučeni korijen varijanse karakterizira mjeru varijabilnosti koja se naziva srednji kvadrat ili standardna devijacija (3.8).

    (3.8)

    Recimo da ste menadžer projekta razvoja softvera. Pod svojom komandom imate pet programera. Upravljajući procesom izvođenja projekta, distribuirate zadatke među programerima. Da bismo pojednostavili primjer, polazit ćemo od činjenice da su zadaci jednaki po složenosti i vremenu završetka. Odlučili ste da analizirate rad svakog programera (broj završenih zadataka tokom sedmice) u posljednjih 10 sedmica, kao rezultat toga dobili ste sljedeće uzorke:

    Week Name

    Procjenom prosječnog broja obavljenih zadataka dobijate sljedeći rezultat:

    Week Name S
    22,3
    22,4
    22,2
    22,1
    22,5

    Na osnovu S indikatora, svi programeri rade u prosjeku sa istom efikasnošću (oko 22 zadatka sedmično). Međutim, indikator varijabilnosti (raspon) je vrlo visok (od 5 zadataka za četvrtog programera do 24 zadatka za petog).

    Week Name S P
    22,3
    22,4
    22,2
    22,1
    22,5

    Procijenimo standardnu ​​devijaciju, koja pokazuje kako su vrijednosti u uzorcima raspoređene u odnosu na prosjek, a konkretno, u našem slučaju, procijenimo koliki je raspon u izvršenju zadatka iz sedmice u sedmicu.

    Week Name S P SO
    22,3 1,56
    22,4 1,8
    22,2 2,84
    22,1 1,3
    22,5 5,3

    Rezultirajuća procjena standardne devijacije ukazuje na sljedeće (procijenićemo dva ekstremna slučaja, programeri 4 i 5):

    Svaka vrijednost u uzorku od 4 programera odstupa u prosjeku za 1,3 zadatka od prosječne vrijednosti.

    Svaka vrijednost u uzorku programera 5 odstupa u prosjeku za 5,3 stavke od prosječne vrijednosti.

    Što je standardna devijacija bliža 0, to je srednja vrijednost pouzdanija, jer ukazuje da je svaka vrijednost u uzorku skoro jednaka srednjoj (u našem primjeru 22,5 stavki). Stoga je programer 4 najdosljedniji, za razliku od programera 5. Varijabilnost izvršenja zadatka iz sedmice u sedmicu za 5. programera je 5,3 zadatka, što ukazuje na značajno širenje. U slučaju 5. programera, prosjeku se ne može vjerovati, pa je stoga teško predvidjeti broj obavljenih zadataka za narednu sedmicu, što otežava proceduru planiranja i pridržavanja rasporeda rada. Nije važno koju ćete upravljačku odluku donijeti na ovom kursu. Važno je da dobijete procjenu na osnovu koje možete donijeti odgovarajuće upravljačke odluke.

    Stoga se može izvući opći zaključak da prosjek ne procjenjuje uvijek podatke ispravno. Ispravnost prosječne procjene može se suditi po vrijednosti standardne devijacije.

    Metode za statističku obradu eksperimentalnih rezultata su matematičke tehnike, formule, metode kvantitativnih proračuna, uz pomoć kojih se indikatori dobijeni tokom eksperimenta mogu generalizovati, dovesti u sistem, otkrivajući skrivene obrasce u njima.

    Govorimo o obrascima statističke prirode koji postoje između varijabli proučavanih u eksperimentu.

    Podaci su osnovni elementi koji se klasifikuju ili kategorišu u svrhu obrade 26 .

    Neke od metoda matematičko-statističke analize omogućavaju izračunavanje takozvanih elementarnih matematičkih statistika koje karakteriziraju distribuciju uzoraka podataka, na primjer:

    Uzorak srednji,

    Varijanca uzorka,

    Median i niz drugih.

    Druge metode matematičke statistike omogućavaju procjenu dinamike promjena u statistici pojedinačnih uzoraka, na primjer:

    analiza varijanse,

    Regresiona analiza.

    Koristeći treću grupu metoda uzorkovanja podataka, može se pouzdano suditi o statističkim odnosima koji postoje između varijabli koje se proučavaju u ovom eksperimentu:

    Korelaciona analiza;

    Faktorska analiza;

    Metode poređenja.

    Sve metode matematičke i statističke analize konvencionalno se dijele na primarne i sekundarne 27 .

    Primarne metode su one koje se mogu koristiti za dobijanje indikatora koji direktno odražavaju rezultate mjerenja izvršenih u eksperimentu.

    Sekundarne metode se nazivaju statističkim metodama obrade, uz pomoć kojih se, na osnovu primarnih podataka, otkrivaju statistički obrasci skriveni u njima.

    Primarne metode statističke obrade uključuju, na primjer:

    Određivanje prosjeka uzorka;

    Varijanca uzorka;

    Selektivna moda;

    Medijan uzorka.

    Sekundarne metode obično uključuju:

    Korelaciona analiza;

    Regresiona analiza;

    Metode za poređenje primarne statistike u dva ili više uzoraka.

    Razmotrimo metode za izračunavanje elementarne matematičke statistike, počevši od prosjeka uzorka.

    aritmetička sredina – to je omjer zbira svih vrijednosti podataka i broja pojmova 28.

    Prosječna vrijednost kao statistički indikator predstavlja prosječnu procjenu psihološkog kvaliteta proučavanog u eksperimentu.

    Ova procena karakteriše stepen njenog razvoja u celini u grupi ispitanika koji su bili podvrgnuti psihodijagnostičkom pregledu. Direktnim upoređivanjem prosječnih vrijednosti dva ili više uzoraka, možemo suditi o relativnom stepenu razvoja procijenjenog kvaliteta kod ljudi koji čine ove uzorke.

    Srednja vrijednost uzorka se određuje korištenjem sljedeće formule 29:

    gdje je x cf prosjek uzorka ili aritmetička sredina uzorka;

    n je broj ispitanika u uzorku ili privatni psihodijagnostički indikatori na osnovu kojih se izračunava prosječna vrijednost;

    x k - privatne vrijednosti indikatora za pojedinačne subjekte. Ukupno ima n takvih indikatora, tako da indeks k ove varijable ima vrijednosti od 1 do n;

    ∑ je znak prihvaćen u matematici za zbrajanje vrijednosti onih varijabli koje se nalaze desno od ovog znaka.

    Disperzija je mjera širenja podataka u odnosu na srednju vrijednost 30.

    Što je varijansa veća, to je veće odstupanje ili širenje podataka. Određuje se tako da je moguće razlikovati jedne od drugih vrijednosti koje imaju isti prosjek, ali različiti raspršivanje.

    Varijanca je određena sljedećom formulom:

    gdje je varijansa uzorka, ili jednostavno varijansa;

    Izraz koji znači da je za sve x k od prvog do posljednjeg u datom uzorku potrebno izračunati razlike između parcijalnih i prosječnih vrijednosti, kvadrirati ove razlike i zbrojiti ih;

    n je broj ispitanika u uzorku ili primarnih vrijednosti iz kojih se izračunava varijansa.

    Medijan je vrijednost karakteristike koja se proučava, koja dijeli uzorak, poredan po vrijednosti ove karakteristike, na pola.

    Poznavanje medijane je korisno kako bi se utvrdilo da li je distribucija parcijalnih vrijednosti proučavane karakteristike simetrična i aproksimirajuća takozvanoj normalnoj raspodjeli. Srednja vrijednost i medijan za normalnu distribuciju obično su isti ili se vrlo malo razlikuju jedan od drugog.

    Ako je uzorkovana distribucija karakteristika normalna, tada se na nju mogu primijeniti metode sekundarnih statističkih proračuna zasnovanih na normalnoj distribuciji podataka. U suprotnom, to se ne može učiniti, jer se ozbiljne greške mogu uvući u proračune.

    Moda još jedna elementarna matematička statistika i karakteristika distribucije eksperimentalnih podataka. Mod je kvantitativna vrijednost karakteristike koja se proučava, a koja se najčešće nalazi u uzorku.

    Za simetrične distribucije karakteristika, uključujući normalnu distribuciju, vrijednosti moda se poklapaju sa vrijednostima srednje vrijednosti i medijana. Za druge vrste distribucija, asimetrične, to nije tipično.

    Metoda sekundarne statističke obrade, kojom se utvrđuje povezanost ili direktna zavisnost između dvije serije eksperimentalnih podataka, naziva se metoda korelacione analize. Pokazuje kako jedna pojava utječe ili je povezana s drugom u svojoj dinamici. Zavisnosti ove vrste postoje, na primjer, između veličina koje su jedna s drugom u uzročno-posledičnoj vezi. Ako se pokaže da su dvije pojave statistički značajno povezane jedna s drugom, i ako postoji uvjerenje da jedna od njih može djelovati kao uzrok druge pojave, onda je zaključak da između njih postoji uzročno-posljedična veza definitivno slijedi.

    Postoji nekoliko varijanti ove metode:

    Analiza linearne korelacije vam omogućava da uspostavite direktne veze između varijabli na osnovu njihovih apsolutnih vrednosti. Ove veze su grafički prikazane pravom linijom, pa otuda i naziv „linearne“.

    Koeficijent linearne korelacije određuje se pomoću sljedeće formule 31:

    gdje je r xy - koeficijent linearne korelacije;

    x, y - prosječne vrijednosti uzorka upoređenih vrijednosti;

    X i ,y i - vrijednosti privatnih uzoraka upoređenih količina;

    P - ukupan broj vrijednosti u upoređenoj seriji indikatora;

    Disperzije, odstupanja upoređenih vrijednosti od prosječnih vrijednosti.

    Korelacija ranga određuje ovisnost ne između apsolutnih vrijednosti varijabli, već između rednih mjesta, ili rangova, koje zauzimaju u nizu poredanih po vrijednosti. Formula za koeficijent korelacije ranga je sljedeća 32:

    gdje je R s koeficijent korelacije Spearmanovog ranga;

    d i - razlika između rangova indikatora istih subjekata u uređenim serijama;

    P - broj subjekata ili digitalnih podataka (rangova) u koreliranim serijama.

    Svrha lekcije:
    - stvaranje uslova za savladavanje teme na nivou razumijevanja i primarnog pamćenja;
    - za formiranje matematičke kompetencije ličnosti učenika.

    Ciljevi lekcije
    edukativni: formiraju ideju o statistici kao nauci; upoznati studente sa pojmovima osnovnih statističkih karakteristika; razviti sposobnost pronalaženja raspona i načina niza, analizirati podatke i poboljšati vještine mentalnog proračuna.
    edukativni: promovirati ovladavanje pojmovima i njihovu interpretaciju; razvoj nadpredmetnih vještina analize, poređenja, sistematizacije i generalizacije; nastaviti sa formiranjem predmetnog jezika, promovirati formiranje ključnih kompetencija (kognitivnih, informatičkih, komunikativnih) u različitim fazama časa, promovirati formiranje jedinstvene naučne slike svijeta među učenicima utvrđivanjem interdisciplinarnih veza između statistike i različitih nauka.
    edukativni: gajiti interesovanje za predmet koji se izučava, informatičku kulturu; spremnost na poštovanje opšteprihvaćenih normi i pravila, visoka efikasnost i organizovanost.

    Korišćene tehnologije: Tehnologija učenja usmjerenog na studenta, informacione i komunikacione tehnologije.
    Neophodna oprema, materijala: multimedijalni projektor, računar, interaktivna tabla.

    Tokom nastave

    1. Organizacioni momenat.

    Provjera spremnosti učenika za nastavu

    Provjera prisutnosti

    2. Postavljanje ciljeva.

    Obrazloženje potrebe za proučavanjem ove teme

    Uključivanje učenika u proces postavljanja ciljeva časa

    Iz kojih izvora primamo i prikupljamo informacije? (Predloženi odgovori: radio, televizija, novine, časopisi, telefon, ljudi, internet, pisma).

    Gdje ljudi pohranjuju informacije? (Predloženi odgovori : u memoriji i na vanjskom mediju).
    Da li je studiranje u tehničkoj školi povezano sa dobijanjem informacija? U školi ste učili opšteobrazovne predmete, ali kada studirate u tehničkoj školi, šta drugo dobijate? (Predloženi odgovor: s stručno znanje).Što više učimo, više informacija sadrži naše pamćenje.

    Danas vam nudim još jednu informaciju. Obučeni ste za rudara, radit ćete na bagerima EKG-8I. Kakve su performanse ovog bagera. Na moj zahtjev, fabrika mi je dostavila sljedeće podatke. (Performanse bagera - tabela)

    Po otpadnom kamenu (hiljadu tona)

    Ljudi, da li je puno informacija dobro? Mogu li sve informacije biti korisne i kvalitetne? Šta treba da budemo u stanju da uradimo da se ne izgubimo u lavirintu informacija? (Očekivani odgovor učenika: “Mora biti u stanju odvojiti korisne, visokokvalitetne informacije od informacija niskog kvaliteta.”) One. biti u stanju da ga obradi.

    ZAKLJUČAK: danas ćemo na lekciji naučiti da obrađujemo informacije.

    3. Organizacija aktivnosti za proučavanje novog gradiva.(učenici prave bilješke u sveskama i završavaju zadatke tokom procesa objašnjavanja)

    1. Definicija statistike

    Šta je statistika? Kažu da je engleski premijer Benjamin Disraeli (1804-1881) na ovo pitanje odgovorio ovako: „Postoje tri vrste laži: laži, proklete laži i statistika.

    Statistika je egzaktna nauka koja proučava metode prikupljanja, analize i obrade podataka koji opisuju masovne akcije, pojave i procese.

    (Čita se odlomak iz romana “Dvanaest stolica” Ilfa i Petrova.

    “Statistika sve zna”, zna se koliko hrane prosječan građanin republike pojede godišnje: zna se koliko lovaca, balerina: mašina, bicikala, spomenika, svjetionika i šivaćih mašina u zemlji: Koliko života, sita žara, strasti i misli, gleda nas iz statističkih tablica!..”

    Njegovo ime dolazi od latinske riječi “status” - država, iz ovog korijena riječi stato (italijanski), statistik (njemački), state (engleski) - država.

    Statističke studije:

    Glavni ciljevi proučavanja elemenata statistike:

    • broj pojedinih grupa stanovništva zemlje i njenih regija,
    • proizvodnju i potrošnju raznih vrsta proizvoda,
    • prevoz robe i putnika raznim vidovima transporta,
    • prirodni resursi i još mnogo toga.

    Znate li u kojoj zemlji je počela statistička praksa (u Kini); prvi popisi stanovništva u zemlji datiraju iz 5. stoljeća. II milenijum pne

    U 19. stoljeću postalo je moguće obraditi podatke pomoću formula, matematičkih zakona i posebnih karakteristika. Ovo?.... ( mat. statistika).

    2. Math statistics

    Math statistics je grana matematike koja proučava metode prikupljanja, sistematizacije i obrade rezultata posmatranja slučajnih masovnih pojava u cilju identifikacije postojećih obrazaca.

    Pa zašto je Dizraeli uporedio statistiku sa lažima? (Nije bilo naučne, rigorozne obrade informacija; podatke je tumačio ko je želeo).

    Matematička statistika ima univerzalne metode obrade informacija
    To je ono što je omogućilo junacima filma "Poslovna romansa" da kažu sljedeće riječi o statistici ( fragment filma "Službena romansa").
    ZAKLJUČAK: Statistika donosi informacije u sistem.

    3. Grafički prikaz informacija

    Poligon distribucije

    Histogram distribucije

    Pie chart

    4. Mjerne karakteristike
    1. Niz podataka je niz rezultata bilo kojeg mjerenja.

    Na primjer: 1) mjerenje ljudske visine

    2) Mjerenje ljudske (životinjske) težine

    3) Očitavanje brojila (struja, voda, toplota...)

    4) Rezultati u trci na 100 metara

    2. Volumen serije podataka - volumen serije podataka je količina svih podataka.

    Na primjer: dati niz brojeva 1; 3; 6; -4; 0

    njegov volumen će biti jednak 5. Zašto?

    3. Raspon serije podataka je razlika između najvećeg i najmanjeg broja iz serije podataka.

    Na primjer: ako je dat niz brojeva 1; 3; 6; -4; 0; 2, onda obim ovaj niz podataka će biti jednak 6 (pošto je 6 - 0 = 6)

    4. Mod serije podataka - način serije podataka je broj serije koji se najčešće javlja u ovoj seriji.

    Na primjer: str otrov podataka može, ali i ne mora imati mod.

    Tako se u serijama podataka 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 svaki od brojeva 47 i 52 pojavljuje dva puta, a preostali brojevi manje od dva puta. U takvim slučajevima dogovoreno je da serija ima dva načina rada: 47 i 52.

    5. Medijan serije

    Medijan s neparnim brojem pojmova je broj napisan u sredini.

    Medijan s parnim brojem pojmova - ovo je aritmetička sredina dva broja napisana u sredini.

    Na primjer: odrediti medijanu niza brojeva

    16; -4; 5; -2; -3; 3; 3; -2; 3. Odgovor: -3

    2) -1; 0; 2; 1; -1; 0;2; -1. Odgovor: 0

    6. Aritmetička sredina je količnik dijeljenja zbira brojeva u nizu njihovim brojem.

    Na primjer: dati niz brojeva -1; 0; 2; 1; -1; 0; 2; -1. Tada će aritmetička sredina biti jednaka: (-1+0+2+1+(-1)+0+2+(-1)): 8 = 2: 8 = 0,25

    4. Konsolidacija proučenog gradiva.

    Praktičan rad

    vježba: okarakterišu učinak učenika Petra Ivanova iz matematike za četvrtu četvrtinu.

    Završetak radova:

    1. Prikupljanje informacija:

    Ocjene ispisane iz časopisa su: 5,4,5,3,3,5,4,4,4.

    2. Obrada primljenih podataka:

    Predavanje 12. Metode statističke obrade rezultata.

    Metode za statističku obradu rezultata su matematičke tehnike, formule, metode kvantitativnih proračuna, uz pomoć kojih se indikatori dobijeni tokom eksperimenta mogu generalizovati, dovesti u sistem, otkrivajući u njima skrivene obrasce. Govorimo o obrascima statističke prirode koji postoje između varijabli proučavanih u eksperimentu.

    1. Metode primarne statističke obrade eksperimentalnih rezultata

    Sve metode matematičke i statističke analize konvencionalno se dijele na primarne i sekundarne. Primarne metode su one koje se mogu koristiti za dobijanje indikatora koji direktno odražavaju rezultate mjerenja izvršenih u eksperimentu. U skladu s tim, pod primarnim statističkim pokazateljima podrazumijevamo one koji se koriste u samim psihodijagnostičkim metodama i koji su rezultat početne statističke obrade psihodijagnostičkih rezultata. Sekundarne metode se nazivaju statističkim metodama obrade, uz pomoć kojih se, na osnovu primarnih podataka, otkrivaju statistički obrasci skriveni u njima.

    Primarne metode statističke obrade uključuju, na primjer, određivanje srednje vrijednosti uzorka, varijanse uzorka, načina uzorka i medijane uzorka. Sekundarne metode obično uključuju korelacione analize, regresione analize i metode za poređenje primarne statistike u dva ili više uzoraka.

    Razmotrimo metode za izračunavanje elementarne matematičke statistike.

    Moda Oni nazivaju kvantitativnu vrijednost karakteristike koja se proučava, a koja se najčešće nalazi u uzorku.

    Medijan je vrijednost karakteristike koja se proučava, koja dijeli uzorak, poredan po vrijednosti ove karakteristike, na pola.

    Uzorak srednji(aritmetička sredina) vrijednost kao statistički indikator predstavlja prosječnu procjenu psihološkog kvaliteta proučavanog u eksperimentu.

    Scatter(ponekad se ova vrijednost naziva raspon) uzorka je označena slovom R. Ovo je najjednostavniji pokazatelj koji se može dobiti za uzorak - razlika između maksimalne i minimalne vrijednosti ove određene serije varijacija.

    Disperzija je aritmetička sredina kvadrata odstupanja vrijednosti varijable od njene srednje vrijednosti.

    2. Metode sekundarne statističke obrade eksperimentalnih rezultata

    Uz pomoć sekundarnih metoda statističke obrade eksperimentalnih podataka, hipoteze povezane s eksperimentom se direktno provjeravaju, dokazuju ili opovrgavaju. Ove metode su, po pravilu, složenije od metoda primarne statističke obrade i zahtijevaju od istraživača da bude dobro obučen u elementarnoj matematici i statistici.

    Grupa metoda o kojima se raspravlja može se podijeliti u nekoliko podgrupa:

    1 Regresijski račun

    Regresijski račun je metoda matematičke statistike koja vam omogućava da smanjite privatne, raštrkane podatke na neki linearni graf koji približno odražava njihov interni odnos, i da možete približno procijeniti vjerovatnu vrijednost druge varijable na osnovu vrijednosti jedne od varijabli .

    2.Korelacija

    Sljedeća metoda sekundarne statističke obrade, kojom se utvrđuje povezanost ili direktna zavisnost između dvije serije eksperimentalnih podataka, naziva se metoda korelacija. Pokazuje kako jedna pojava utječe ili je povezana s drugom u svojoj dinamici. Zavisnosti ove vrste postoje, na primjer, između veličina koje su jedna s drugom u uzročno-posledičnoj vezi. Ako se pokaže da su dvije pojave statistički značajno povezane jedna s drugom, i ako postoji uvjerenje da jedna od njih može djelovati kao uzrok druge pojave, onda je zaključak da između njih postoji uzročno-posljedična veza definitivno slijedi.

    3 Faktorska analiza

    Faktorska analiza je statistička metoda koja se koristi pri obradi velikih količina eksperimentalnih podataka. Ciljevi faktorske analize su: smanjenje broja varijabli (redukcija podataka) i utvrđivanje strukture odnosa između varijabli, tj. klasifikacija varijabli, pa se faktorska analiza koristi kao metoda redukcije podataka ili kao metoda strukturne klasifikacije.

    Pregledajte pitanja

    1.Šta su statističke metode obrade?

    2. Na koje se podgrupe dijele sekundarne metode statističke obrade?

    3.Objasniti suštinu metode korelacije?

    4. U kojim slučajevima se koriste statističke metode obrade?

    5. Koliko je po vašem mišljenju efikasna upotreba metoda statističke obrade u naučnim istraživanjima?

    2. Razmotriti karakteristike metoda statističke obrade podataka.

    Književnost

    1.. Gorbatov D.S. Radionica o psihološkim istraživanjima: Proc. dodatak. - Samara: "BAKHRAH - M", 2003. - 272 str.

    2. Ermolaev A.Yu. Matematička statistika za psihologe. - M.: Moskovski psihološki i socijalni institut: Flinta, 2003. 336 str.

    3. Kornilova T.V. Uvod u psihološki eksperiment. Udžbenik za univerzitete. M.: Izdavačka kuća CheRo, 2001.