Dom · Mjerenja · Nivo statističke značajnosti. Koncepti statističkog značaja i statistički kriterijumi

Nivo statističke značajnosti. Koncepti statističkog značaja i statistički kriterijumi

Hipoteze se provjeravaju statističkom analizom. Statistička značajnost se nalazi pomoću P-vrijednosti, koja odgovara vjerovatnoći datog događaja pod pretpostavkom da je neka izjava (nulta hipoteza) tačna. Ako je P-vrijednost manja od specificiranog nivoa statističke značajnosti (obično 0,05), eksperimentator može sa sigurnošću zaključiti da je nulta hipoteza pogrešna i nastaviti s razmatranjem alternativne hipoteze. Koristeći Studentov t test, možete izračunati P-vrijednost i odrediti značaj za dva skupa podataka.

Koraci

Dio 1

Postavljanje eksperimenta

    Definišite svoju hipotezu. Prvi korak u procjeni statističke značajnosti je odabir pitanja na koje želite odgovoriti i formuliranje hipoteze. Hipoteza je izjava o eksperimentalnim podacima, njihovoj distribuciji i svojstvima. Za svaki eksperiment postoji i nulta i alternativna hipoteza. Uopšteno govoreći, moraćete da uporedite dva skupa podataka da biste utvrdili da li su slični ili različiti.

    • Nul hipoteza (H 0) tipično kaže da nema razlike između dva skupa podataka. Na primjer: oni učenici koji čitaju gradivo prije nastave ne dobijaju više ocjene.
    • Alternativna hipoteza (H a) je suprotna od nulte hipoteze i tvrdnja je koja mora biti potkrijepljena eksperimentalnim podacima. Na primjer: oni učenici koji čitaju gradivo prije časa dobijaju više ocjene.
  1. Postavite nivo značajnosti da odredite koliko se distribucija podataka mora razlikovati od normalne da bi se smatrala značajnim rezultatom. Nivo značaja (takođe se naziva α (\displaystyle \alpha )-nivo) je prag koji definirate za statističku značajnost. Ako je P-vrijednost manja ili jednaka nivou značajnosti, podaci se smatraju statistički značajnim.

    • U pravilu, nivo značajnosti (vrijednost α (\displaystyle \alpha )) uzima se jednakim 0,05, a u ovom slučaju vjerovatnoća otkrivanja slučajne razlike između različiti setovi podataka je samo 5%.
    • Što je viši nivo značajnosti (i, shodno tome, niža P-vrijednost), rezultati su pouzdaniji.
    • Ako želite pouzdanije rezultate, smanjite P-vrijednost na 0,01. Po pravilu više niske P-vrijednosti koristi se u proizvodnji kada je potrebno identifikovati nedostatke u proizvodima. U ovom slučaju potrebna je visoka pouzdanost kako bi se osiguralo da svi dijelovi rade kako se očekuje.
    • Za većinu eksperimenata hipoteze dovoljan je nivo značajnosti od 0,05.
  2. Odlučite koji ćete kriterij koristiti: jednostrano ili dvostrano. Jedna od pretpostavki u Studentovom t testu je da su podaci normalno raspoređeni. Normalna distribucija je kriva u obliku zvona sa maksimalnim brojem rezultata u sredini krive. Studentov t-test je matematička metoda testiranja podataka koja vam omogućava da odredite da li podaci izlaze izvan normalne distribucije (više, manje ili u „repovima“ krive).

    • Ako niste sigurni jesu li podaci iznad ili ispod vrijednosti kontrolne grupe, koristite dvostrani test. Ovo će vam omogućiti da odredite značaj u oba smjera.
    • Ako znate u kojem smjeru podaci mogu pasti izvan normalne distribucije, koristite jednostrani test. U gornjem primjeru očekujemo povećanje ocjena učenika, pa se može koristiti jednostrani test.
  3. Odredite veličinu uzorka koristeći statističku snagu. Statistička snaga studije je vjerovatnoća da će se, s obzirom na veličinu uzorka, dobiti očekivani rezultat. Uobičajeni prag snage (ili β) je 80%. Analiza statističke moći bez ikakvih prethodnih podataka može biti izazovna jer zahtijeva neke informacije o očekivanim srednjim vrijednostima u svakoj grupi podataka i njihovim standardnim devijacijama. Koristite kalkulator za analizu snage na mreži da odredite optimalnu veličinu uzorka za svoje podatke.

    • Obično istraživači sprovode malu pilot studiju koja daje podatke za statističku analizu snage i određuje veličinu uzorka potrebnu za veću, potpuniju studiju.
    • Ako niste u mogućnosti da provedete pilot studiju, pokušajte procijeniti moguće prosjeke na osnovu literature i rezultata drugih ljudi. Ovo vam može pomoći da odredite optimalnu veličinu uzorka.

    Dio 2

    Izračunati standardna devijacija
    1. Zapišite formulu za standardnu ​​devijaciju. Standardna devijacija pokazuje koliki je raspon u podacima. Omogućava vam da zaključite koliko su bliski podaci dobijeni iz određenog uzorka. Na prvi pogled formula se čini prilično kompliciranom, ali objašnjenja u nastavku pomoći će vam da je shvatite. Formula ima sljedeći pogled: s = √∑((x i – µ) 2 /(N – 1)).

      • s - standardna devijacija;
      • znak ∑ označava da treba dodati sve podatke dobijene iz uzorka;
      • x i odgovara i-toj vrijednosti, odnosno dobijenom odvojenom rezultatu;
      • µ je prosječna vrijednost za datu grupu;
      • N je ukupan broj podataka u uzorku.
    2. Pronađite prosjek u svakoj grupi. Da biste izračunali standardnu ​​devijaciju, prvo morate pronaći srednju vrijednost za svaku studijsku grupu. Naznačena je prosječna vrijednost grčko pismoµ (mu). Da biste pronašli prosjek, jednostavno zbrojite sve rezultirajuće vrijednosti i podijelite ih s količinom podataka (veličina uzorka).

      • Na primjer, da biste pronašli prosječnu ocjenu za grupu učenika koji uče prije nastave, razmotrite mali skup podataka. Radi jednostavnosti koristimo skup od pet tačaka: 90, 91, 85, 83 i 94.
      • Dodajmo sve vrijednosti zajedno: 90 + 91 + 85 + 83 + 94 = 443.
      • Podijelimo zbir sa brojem vrijednosti, N = 5: 443/5 = 88,6.
      • Tako je prosjek za ovu grupu 88,6.
    3. Oduzmite svaku dobijenu vrijednost od prosjeka. Sljedeći korak je izračunavanje razlike (x i – µ). Da biste to učinili, oduzmite od pronađenog prosječne veličine svaka primljena vrijednost. U našem primjeru moramo pronaći pet razlika:

      • (90 – 88,6), (91 – 88,6), (85 – 88,6), (83 – 88,6) i (94 – 88,6).
      • Kao rezultat, dobijamo sledeće vrednosti: 1.4, 2.4, -3.6, -5.6 i 5.4.
    4. Svaku dobijenu vrijednost kvadrirajte i saberite ih. Svaku od upravo pronađenih količina treba kvadrirati. Na ovom koraku svi će nestati negativne vrijednosti. Ako nakon ovog koraka i dalje imate negativni brojevi, što znači da ste ih zaboravili kvadrirati.

      • Za naš primjer, dobijamo 1,96, 5,76, 12,96, 31,36 i 29,16.
      • Dobivene vrijednosti zbrajamo: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Podijelite s veličinom uzorka minus 1. U formuli se zbir dijeli sa N – 1 zbog činjenice da ne uzimamo u obzir opštu populaciju, već uzimamo uzorak svih učenika za evaluaciju.

      • Oduzmite: N – 1 = 5 – 1 = 4
      • Podjela: 81,2/4 = 20,3
    6. Ukloni Kvadratni korijen. Nakon što podijelite zbroj s veličinom uzorka minus jedan, uzmite kvadratni korijen pronađene vrijednosti. Ovo poslednji korak u izračunavanju standardne devijacije. Postoje statistički programi koji, nakon unosa početnih podataka, vrše sve potrebne proračune.

      • U našem primjeru, standardna devijacija ocjena onih učenika koji čitaju gradivo prije časa je s =√20,3 = 4,51.

      dio 3

      Odredite značaj
      1. Izračunajte varijansu između dvije grupe podataka. Prije ovog koraka, pogledali smo primjer samo za jednu grupu podataka. Ako želite da uporedite dve grupe, očigledno bi trebalo da uzmete podatke iz obe grupe. Izračunajte standardnu ​​devijaciju za drugu grupu podataka, a zatim pronađite varijansu između dvije eksperimentalne grupe. Varijanca se izračunava korišćenjem sledeće formule: s d = √((s 1 /N 1) + (s 2 /N 2)).

Zadatak 3. Pet predškolaca dobija test. Zapisuje se vrijeme potrebno za rješavanje svakog zadatka. Hoće li se pronaći statistički značajne razlike između vremena za rješavanje prva tri testa?

Broj subjekata

Referentni materijal

Ovaj zadatak je zasnovan na teoriji analize varijanse. Generalno, zadatak analize varijanse je da identifikuje one faktore koji imaju značajan uticaj na rezultat eksperimenta. Analiza varijanse može se koristiti za poređenje srednjih vrijednosti nekoliko uzoraka ako postoji više od dva uzorka. U tu svrhu se koristi jednosmjerna analiza varijanse.

U cilju rješavanja postavljenih zadataka prihvata se sljedeće. Ako se varijanse dobijenih vrijednosti parametra optimizacije u slučaju utjecaja faktora razlikuju od varijanse rezultata u odsustvu utjecaja faktora, onda se takav faktor smatra značajnim.

Kao što se može vidjeti iz formulacije problema, ovdje se koriste metode verifikacije statističke hipoteze, naime, zadatak testiranja dvije empirijske varijanse. Stoga se analiza varijanse zasniva na testiranju varijanse korištenjem Fisherovog testa. U ovom zadatku potrebno je provjeriti da li su razlike između vremena rješavanja prva tri testna zadatka od strane svakog od šest predškolaca statistički značajne.

Nulta (glavna) hipoteza naziva se postavljena hipoteza H o. Suština e se svodi na pretpostavku da je razlika između upoređenih parametara nula (otuda naziv hipoteze - nula) i da su uočene razlike slučajne.

Konkurentna (alternativna) hipoteza se naziva H1, što je u suprotnosti sa nultom hipotezom.

Rješenje:

Koristeći metodu analize varijanse na nivou značajnosti α = 0,05, testiraćemo nultu hipotezu (H o) o postojanju statistički značajnih razlika između vremena rešavanja prva tri test zadatka za šest predškolaca.

Pogledajmo tabelu uslova zadatka, u kojoj ćemo pronaći prosečno vreme za rešavanje svakog od tri test zadatka

Broj subjekata

Nivoi faktora

Vrijeme za rješavanje prvog testnog zadatka (u sekundama).

Vrijeme za rješavanje drugog testnog zadatka (u sekundama).

Vrijeme za rješavanje trećeg testnog zadatka (u sekundama).

Grupni prosjek

Pronalaženje ukupnog prosjeka:

Kako bi se uzela u obzir značaj vremenskih razlika u svakom testu, ukupna varijansa uzorka podijeljena je na dva dijela, od kojih se prvi naziva faktorijalni, a drugi rezidualni

Izračunajmo ukupan zbir kvadrata odstupanja od ukupnog prosjeka koristeći formulu

ili , gdje je p broj mjerenja vremena za rješavanje testnih zadataka, q je broj ispitanika. Da bismo to učinili, napravimo tablicu kvadrata

Broj subjekata

Nivoi faktora

Vrijeme za rješavanje prvog testnog zadatka (u sekundama).

Vrijeme za rješavanje drugog testnog zadatka (u sekundama).

Vrijeme za rješavanje trećeg testnog zadatka (u sekundama).

Statistička pouzdanost je ključna u praksi izračuna FCC-a. Prethodno je napomenuto da se iz iste populacije može odabrati više uzoraka:

Ako su pravilno odabrani, onda se njihovi prosječni pokazatelji i indikatori opšte populacije neznatno razlikuju jedni od drugih po veličini greške reprezentativnosti, uzimajući u obzir prihvaćenu pouzdanost;

Ako su odabrani iz različitih populacija, razlika između njih se pokazuje značajnom. Statistika se svodi na poređenje uzoraka;

Ako se razlikuju neznatno, neprincipijelno, neznatno, odnosno pripadaju istoj opštoj populaciji, razlika između njih se naziva statistički nepouzdanom.

Statistički pouzdano Razlika uzorka je uzorak koji se značajno i fundamentalno razlikuje, odnosno pripada različitim općim populacijama.

U FCC-u, procjena statističke značajnosti razlika u uzorcima znači rješavanje skupa praktični problemi. Na primjer, uvođenje novih nastavnih metoda, programa, sklopova vježbi, testova, kontrolnih vježbi povezano je sa njihovim eksperimentalnim testiranjem, što bi trebalo da pokaže da se test grupa suštinski razlikuje od kontrolne grupe. Zbog toga se koriste posebne statističke metode, koje se nazivaju kriterijumi statističke značajnosti, da bi se otkrilo prisustvo ili odsustvo statistički značajne razlike između uzoraka.

Svi kriterijumi su podeljeni u dve grupe: parametarski i neparametarski. Parametarski kriterijumi zahtevaju prisustvo normalnog zakona distribucije, tj. To znači obavezno određivanje glavnih indikatora normalnog zakona – aritmetičke sredine i standardne devijacije s. Parametarski kriterijumi su najtačniji i najtačniji. Neparametarski testovi su zasnovani na rangu (rednim) razlikama između elemenata uzorka.

Evo glavnih kriterijuma za statističku značajnost koji se koriste u FCC praksi: Studentov test i Fišerov test.

Studentov t test nazvan po engleskom naučniku K. Gossetu (Student - pseudonim), koji je otkrio ovu metodu. Studentov t test je parametarski i koristi se za poređenje apsolutni pokazatelji uzorci. Uzorci mogu varirati u veličini.

Studentov t test je ovako definisan.

1. Pronađite Studentov t test koristeći sljedeću formulu:


gdje su aritmetički prosjeci upoređenih uzoraka; t 1, t 2 - greške reprezentativnosti identifikovane na osnovu indikatora upoređenih uzoraka.

2. Praksa u FCC-u je pokazala da je za sportski rad dovoljno prihvatiti pouzdanost računa P=0,95.

Za pouzdanost brojanja: P = 0,95 (a = 0,05), sa brojem stepeni slobode

k = n 1 + n 2 - 2 pomoću tabele u Dodatku 4 nalazimo vrijednost granične vrijednosti kriterija ( t gr).

3. Na osnovu svojstava zakona normalne distribucije, Studentov kriterijum poredi t i t gr.

Izvlačimo zaključke:

ako je t t gr, onda je razlika između upoređenih uzoraka statistički značajna;

ako je t t gr, onda je razlika statistički beznačajna.

Za istraživače u oblasti FCS-a, procena statističke značajnosti je prvi korak u rešavanju specifičnog problema: da li se uzorci koji se porede suštinski ili ne fundamentalno razlikuju jedan od drugog. Sljedeći korak je evaluacija ove razlike sa pedagoške tačke gledišta, koja je određena uslovima zadatka.

Razmotrimo primjenu Studentovog testa na konkretnom primjeru.

Primjer 2.14. Grupi od 18 ispitanika procijenjena je brzina otkucaja srca (bpm) prije x i i poslije y i zagrijavanje.

Procijenite efikasnost zagrijavanja na osnovu otkucaja srca. Početni podaci i proračuni prikazani su u tabeli. 2.30 i 2.31.

Tabela 2.30

Obrada indikatora otkucaja srca prije zagrijavanja


Greške za obje grupe su se poklopile, jer su uzorci jednaki (ista grupa se proučava kod različitim uslovima), i prosjek standardne devijacije iznosio je s x = s y = 3 otkucaja/min. Idemo dalje na definiranje Studentovog testa:

Postavili smo pouzdanost računa: P = 0,95.

Broj stepeni slobode k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. Iz tabele u Dodatku 4 nalazimo t gr= 2,02.

Statistički zaključak. Kako je t = 11,62, a granica t gr = 2,02, onda je 11,62 > 2,02, tj. t > t gr, stoga je razlika između uzoraka statistički značajna.

Pedagoški zaključak. Utvrđeno je da je u pogledu broja otkucaja srca statistički značajna razlika između stanja grupe prije i poslije zagrijavanja, tj. značajno, fundamentalno. Dakle, na osnovu indikatora otkucaja srca, možemo zaključiti da je zagrijavanje efikasno.

Fisherov kriterijum je parametarski. Koristi se prilikom poređenja brzina disperzije uzoraka. To obično znači poređenje u smislu stabilnosti sportskih performansi ili stabilnosti funkcionalnih i tehnički indikatori u praksi fizička kultura i sport. Uzorci mogu biti različitih veličina.

Fisherov kriterij definiran je sljedećim nizom.

1. Pronađite Fisherov kriterij F koristeći formulu


gdje su varijanse upoređenih uzoraka.

Uslovi Fisherovog kriterijuma to predviđaju u brojiocu formule F postoji velika disperzija, tj. broj F je uvijek veći od jedan.

Postavljamo pouzdanost proračuna: P = 0,95 - i određujemo broj stupnjeva slobode za oba uzorka: k 1 = n 1 - 1, k 2 = n 2 - 1.

Iz tabele u Dodatku 4 nalazimo granična vrijednost kriterijum F gr.

Poređenje F i F kriterija gr nam omogućava da formulišemo zaključke:

ako je F > F gr, onda je razlika između uzoraka statistički značajna;

ako je F< F гр, то различие между выборками статически недо­стоверно.

Navedimo konkretan primjer.

Primjer 2.15. Analizirajmo dvije grupe rukometaša: x i (n 1= 16 osoba) i y i (n 2 = 18 osoba). Ove grupe sportista su proučavane za vrijeme(a) uzleta pri ubacivanju lopte u gol.

Da li su indikatori odbijanja istog tipa?

Početni podaci i osnovni proračuni prikazani su u tabeli. 2.32 i 2.33.

Tabela 2.32

Obrada pokazatelja odbojnosti prve grupe rukometaša


Hajde da definišemo Fišerov kriterijum:





Prema podacima prikazanim u tabeli u Dodatku 6, nalazimo Fgr: Fgr = 2,4

Obratimo pažnju na činjenicu da u tabeli u Dodatku 6 navođenje brojeva stepena slobode i veće i manje disperzije postaje grublje kako se približavamo većim brojevima. Dakle, broj stupnjeva slobode veće disperzije slijedi ovim redom: 8, 9, 10, 11, 12, 14, 16, 20, 24 itd., a manjeg - 28, 29, 30, 40 , 50, itd. d.

To se objašnjava činjenicom da kako se veličina uzorka povećava, razlike u F-testu se smanjuju i moguće je koristiti tabelarne vrijednosti koje su bliske izvornim podacima. Dakle, u primjeru 2.15 =17 nedostaje i možemo uzeti njemu najbližu vrijednost k = 16, iz čega dobijamo Fgr = 2.4.

Statistički zaključak. Budući da je Fisherov test F= 2,5 > F= 2,4, uzorci se statistički razlikuju.

Pedagoški zaključak. Vrijednosti vremena (s) uzleta pri ubacivanju lopte u gol za rukometaše obje grupe značajno se razlikuju. Ove grupe treba smatrati različitim.

Dalja istraživanja mora pokazati šta je razlog za ovu razliku.

Primjer 2.20.(o statističkoj pouzdanosti uzorka ). Da li su se kvalifikacije fudbalera poboljšale ako je vrijeme(a) od davanja znaka do udarca lopte na početku treninga bilo x i , a na kraju y i .

Početni podaci i osnovni proračuni dati su u tabeli. 2.40 i 2.41.

Tabela 2.40

Obrada indikatora vremena od davanja signala do udaranja lopte na početku treninga


Odredimo razliku između grupa indikatora koristeći Studentov kriterijum:

Uz pouzdanost P = 0,95 i stepene slobode k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42, koristeći tabelu u Dodatku 4 nalazimo t gr= 2,02. Pošto je t = 8,3 > t gr= 2,02 - razlika je statistički značajna.

Odredimo razliku između grupa indikatora koristeći Fisherov kriterij:


Prema tabeli u Dodatku 2, sa pouzdanošću P = 0,95 i stepenom slobode k = 22-1 = 21, vrednost F gr = 21. Pošto je F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Statistički zaključak. Prema aritmetičkom prosjeku, razlika između grupa indikatora je statistički značajna. U smislu disperzije (disperzije), razlika između grupa indikatora je statistički nepouzdana.

Pedagoški zaključak. Kvalifikacije fudbalera su značajno napredovale, ali treba obratiti pažnju na stabilnost njegovog svjedočenja.

Priprema za posao

Prije ovoga laboratorijski rad u disciplini "Sportska metrologija" svi studenti u studijskoj grupi moraju formirati radne timove od po 3-4 studenta, da zajednički urade radni zadatak svih laboratorijskih radova.

U pripremi za rad pročitajte relevantne dijelove preporučene literature (vidi odjeljak 6 podataka metodološka uputstva) i bilješke s predavanja. Proučite dijelove 1 i 2 za ovaj laboratorijski rad, kao i radni zadatak za njega (odjeljak 4).

Pripremite obrazac za izvještaj on standardni listovi papir za pisanje formata A4 i u njega ubacite materijale potrebne za rad.

Izvještaj mora sadržavati :

Naslovna strana sa naznakom odsjeka (UC i TR), studijske grupe, prezimena, imena, patronimija studenta, broja i naziva laboratorijskog rada, datuma njegovog završetka, kao i prezimena, akademskog stepena, akademskog zvanja i radnog mjesta nastavnik prihvata rad;

Cilj rada;

Formule sa numeričke vrijednosti, objašnjavanje srednjih i konačnih rezultata proračuna;

Tablice izmjerenih i izračunatih vrijednosti;

Grafički materijal potreban zadatku;

Kratki zaključci o rezultatima svake faze radnog zadatka i o obavljenom poslu općenito.

Svi grafikoni i tabele su pažljivo nacrtani pomoću alata za crtanje. Uslovna grafika i slovne oznake moraju biti u skladu sa GOST standardima. Dozvoljeno je sastavljanje izvještaja korištenjem računarske tehnologije.

Radni zadatak

Prije izvođenja svih mjerenja, svaki član tima mora proučiti pravila za korištenje sportske igre Pikado data u Dodatku 7, koja su neophodna za provođenje sljedećih faza istraživanja.

I faza istraživanja“Proučavanje rezultata pogađanja mete sportske igre pikado od strane svakog člana tima za usklađenost sa zakonom normalne raspodjele prema kriteriju χ 2 Pearson i kriterijum tri sigma"

1. mjerite (testirajte) svoju (ličnu) brzinu i koordinaciju akcija, bacanjem pikado 30-40 puta u kružnu metu u sportskoj igri Pikado.

2. Rezultati mjerenja (testovi) x i(u čašama) formulirajte u obliku serije varijacija i unesite u tabelu 4.1 (kolone, popunite sve potrebne kalkulacije, popuniti potrebne tabele i izvući odgovarajuće zaključke o usklađenosti rezultirajuće empirijske distribucije sa normalnim zakonom raspodjele, po analogiji sa sličnim proračunima, tabelama i zaključcima primjera 2.12, datim u odjeljku 2 ovih smjernica na stranicama 7-10.

Tabela 4.1

Odgovaranje brzine i koordinacije akcija subjekata normalnom zakonu raspodjele

br. zaobljen
Ukupno

II – faza istraživanja

“Procjena prosječnih pokazatelja opšte populacije pogodaka na metu sportske igre Pikado svih studenata studijske grupe na osnovu rezultata mjerenja članova jedne ekipe”

Procijeniti prosječne pokazatelje brzine i koordinacije djelovanja svih učenika u studijskoj grupi (prema spisku studijske grupe u razrednom časopisu) na osnovu dobijenih rezultata pogađanja mete sportske igre pikado svih članova tima. u prvoj fazi istraživanja ovog laboratorijskog rada.

1. Dokumentirati rezultate mjerenja brzine i koordinacije akcija kada bacate pikado na kružnu metu u sportskoj igri Pikado svih članova vašeg tima (2 - 4 osobe), koji predstavljaju uzorak rezultata mjerenja iz opšte populacije (rezultati mjerenja svih učenika u studijskoj grupi - npr. 15 osoba), upisujući ih u drugu i treću kolonu Tabela 4.2.

Tabela 4.2

Obrada indikatora brzine i koordinacije akcija

pripadnici brigade

br.
Ukupno

U tabeli 4.2 pod treba razumjeti , poklapao prosječan rezultat (vidi rezultate proračuna u tabeli 4.1) članovi vašeg tima ( , dobijene u prvoj fazi istraživanja. Treba napomenuti da, obično, Tabela 4.2 sadrži izračunatu prosječnu vrijednost rezultata mjerenja koje je dobio jedan član tima u prvoj fazi istraživanja , budući da je vjerovatnoća da će se rezultati mjerenja različitih članova tima poklopiti vrlo mala. onda, po pravilu vrednosti u koloni Tabela 4.2 za svaki red - jednaka 1, A u redu „Ukupno " kolone " ", je napisano broj članova vašeg tima.

2. Izvršite sve potrebne proračune kako biste popunili tabelu 4.2, kao i druge proračune i zaključke slične proračunima i zaključcima primjera 2.13 datim u 2. dijelu ovog metodološki razvoj na stranicama 13-14. To treba imati na umu prilikom izračunavanja greške reprezentativnosti "m" potrebno je koristiti formulu 2.4 datu na strani 13 ove metodološke izrade, budući da je uzorak mali (n, a broj elemenata opšte populacije N je poznat, a jednak je broju studenata u studijskoj grupi, prema listi časopisa studijske grupe.

III – faza istraživanja

Procjena efikasnosti zagrijavanja prema indikatoru „Brzina i koordinacija radnji“ od strane svakog člana tima pomoću Studentovog t-testa

Za procjenu efikasnosti zagrijavanja za bacanje pikado u metu sportske igre "Pikado", koju je u prvoj fazi istraživanja ovog laboratorijskog rada izvršio svaki član tima prema indikatoru "Brzina i koordinacija akcija“, koristeći Studentov kriterijum – parametarski kriterijum za statističku pouzdanost empirijskog zakona raspodele prema normalnom zakonu raspodele.

… Ukupno

2. varijanse i RMS , rezultati mjerenja indikatora "Brzina i koordinacija akcija" na osnovu rezultata zagrijavanja, dato u tabeli 4.3, (vidi slične proračune date odmah iza tabele 2.30 primjera 2.14 na strani 16 ovog metodološkog razvoja).

3. Svaki član radnog tima izmjerite (testirajte) svoju (ličnu) brzinu i koordinaciju radnji nakon zagrijavanja,

… Ukupno

5. Izvršite prosječne proračune varijanse i RMS ,rezultati mjerenja indikatora "Brzina i koordinacija akcija" nakon zagrijavanja, dato u tabeli 4.4, zapišite ukupni rezultat mjerenja na osnovu rezultata zagrijavanja (vidi slične proračune date odmah iza tabele 2.31 primjera 2.14 na strani 17 ovog metodološkog razvoja).

6. Izvršite sve potrebne proračune i zaključke slične proračunima i zaključcima primjera 2.14 datim u 2. dijelu ovog metodološkog razvoja na stranicama 16-17. To treba imati na umu prilikom izračunavanja greške reprezentativnosti "m" potrebno je koristiti formulu 2.1 datu na strani 12 ove metodološke izrade, budući da je uzorak n, a broj elemenata u populaciji N ( je nepoznat.

IV – faza istraživanja

Procjena ujednačenosti (stabilnosti) indikatora „Brzina i koordinacija djelovanja“ dva člana tima po Fisherovom kriteriju

Procijenite ujednačenost (stabilnost) indikatora „Brzina i koordinacija djelovanja“ dva člana tima koristeći Fišerov kriterijum, na osnovu rezultata mjerenja dobijenih u trećoj fazi istraživanja u ovom laboratorijskom radu.

Da biste to uradili, potrebno je da uradite sledeće.

Koristeći podatke iz tabela 4.3 i 4.4, rezultati izračunavanja varijansi iz ovih tabela dobijeni u trećoj fazi istraživanja, kao i metodologija za izračunavanje i primenu Fišerovog kriterijuma za procenu uniformnosti (stabilnosti) sportskih pokazatelja, dati u primjer 2.15 na stranicama 18-19 ovog metodološkog razvoja, izvući odgovarajuće statističke i pedagoške zaključke.

V – faza istraživanja

Procjena grupa indikatora “Brzina i koordinacija djelovanja” jednog člana tima prije i poslije zagrijavanja

Statistička značajnost rezultata (p-vrijednost) je procijenjena mjera povjerenja u njegovu "istinitost" (u smislu "reprezentativnosti uzorka"). Više tehnički govoreći, p-vrijednost je mjera koja varira u opadajućem redu veličine s pouzdanošću rezultata. Viša p-vrijednost odgovara nižem nivou povjerenja u odnos između varijabli pronađenih u uzorku. Konkretno, p-vrijednost predstavlja vjerovatnoću greške povezane sa generalizacijom posmatranog rezultata na cijelu populaciju. Na primjer, p-vrijednost od 0,05 (tj. 1/20) ukazuje da postoji 5% šanse da je odnos između varijabli pronađenih u uzorku samo nasumična karakteristika uzorka. Drugim riječima, ako dati odnos ne postoji u populaciji, a slične eksperimente provodite mnogo puta, tada biste u otprilike jednom od dvadeset ponavljanja eksperimenta očekivali isti ili jači odnos između varijabli.

U mnogim studijama, p-vrijednost od 0,05 se smatra „prihvatljivom marginom“ za nivo greške.

Ne postoji način da se izbjegne proizvoljnost u odlučivanju o tome koji nivo značaja treba zaista smatrati „značajnim“. Izbor određenog nivoa značajnosti iznad kojeg se rezultati odbacuju kao netačni je prilično proizvoljan. U praksi, konačna odluka obično zavisi od toga da li je rezultat predviđen a priori (tj. pre nego što je eksperiment izveden) ili otkriven a posteriori kao rezultat mnogih analiza i poređenja izvršenih na različitim podacima, kao i od tradicija studijske oblasti. Tipično, u mnogim poljima, rezultat od p 0,05 je prihvatljiva granica za statističku značajnost, ali treba imati na umu da ovaj nivo i dalje uključuje prilično veliku stopu greške (5%). Rezultati značajni na nivou p 0,01 generalno se smatraju statistički značajnim, a rezultati sa nivoom p 0,005 ili p 0,001 generalno se smatraju visoko značajnim. Međutim, treba shvatiti da je ova klasifikacija nivoa značaja prilično proizvoljna i da je samo neformalni dogovor usvojen na osnovu praktičnog iskustva u određenoj oblasti istraživanja.

Kao što je već pomenuto, veličina zavisnosti i pouzdanost predstavljaju dva razne karakteristike zavisnosti između varijabli. Međutim, ne može se reći da su potpuno nezavisni. Govoreći zajednički jezik, što je veća veličina zavisnosti (veze) između varijabli u uzorku normalne veličine, to je pouzdaniji.

Ako pretpostavimo da ne postoji veza između odgovarajućih varijabli u populaciji, onda je najvjerovatnije očekivati ​​da u uzorku koji se proučava neće biti veze između ovih varijabli. Dakle, što je jača veza pronađena u uzorku, manja je vjerovatnoća da ta veza ne postoji u populaciji iz koje je izvučena.


Veličina uzorka utiče na značaj odnosa. Ako ima malo zapažanja, onda je odgovarajuće nekoliko mogućih kombinacija vrijednosti za ove varijable i stoga je vjerovatnoća da se slučajno otkrije kombinacija vrijednosti koja pokazuje jaku vezu relativno visoka.

Kako se izračunava nivo statističke značajnosti. Pretpostavimo da ste već izračunali meru zavisnosti između dve varijable (kao što je gore objašnjeno). Sljedeće pitanje, koji stoji ispred vas: "koliko je značajna ova veza?" Na primjer, da li je 40% objašnjene varijacije između dvije varijable dovoljno da se odnos smatra značajnim? Odgovor: "u zavisnosti od okolnosti." Naime, značajnost zavisi uglavnom od veličine uzorka. Kao što je već objašnjeno, u vrlo velikim uzorcima čak i vrlo slabe veze između varijabli će biti značajne, dok u malim uzorcima čak i vrlo jake veze nisu pouzdane. Dakle, da biste odredili nivo statističke značajnosti, potrebna vam je funkcija koja predstavlja odnos između "veličine" i "značajnosti" odnosa između varijabli za svaku veličinu uzorka. Ova funkcija bi vam tačno ukazalo „koliko je verovatno da ćete dobiti zavisnost date vrednosti (ili više) u uzorku date veličine, pod pretpostavkom da ne postoji takva zavisnost u populaciji“. Drugim riječima, ova funkcija bi dala nivo značajnosti (p-vrijednost), a samim tim i vjerovatnoću lažnog odbacivanja pretpostavke da dati odnos ne postoji u populaciji. Ova “alternativna” hipoteza (da nema veze u populaciji) se obično naziva nultom hipotezom. Bilo bi idealno kada bi funkcija koja izračunava vjerovatnoću greške bila linearna i imala samo različite nagibe za različite veličine uzorka. Nažalost, ova funkcija je mnogo složenija i nije uvijek potpuno ista. Međutim, u većini slučajeva njegov oblik je poznat i može se koristiti za određivanje nivoa značajnosti u studijama uzoraka date veličine. Većina ovih funkcija se odnosi na vrlo važna klasa distribucije koje se nazivaju normalnim.

Nivo značajnosti u statistici je važan indikator koji odražava stepen povjerenja u tačnost i istinitost dobijenih (predviđenih) podataka. Koncept se široko koristi u raznim oblastima: od dirigovanja sociološka istraživanja, prije statističkog testiranja naučnih hipoteza.

Definicija

Nivo statističke značajnosti (ili statistički značajan rezultat) pokazuje koliko je to vjerovatno slučajna pojava proučavani indikatori. Ukupna statistička značajnost pojave izražava se koeficijentom p-vrijednosti (p-nivo). U svakom eksperimentu ili zapažanju postoji mogućnost da su dobijeni podaci nastali zbog grešaka uzorkovanja. Ovo posebno važi za sociologiju.

Odnosno, statistički značajna vrijednost je vrijednost čija je vjerovatnoća slučajnog pojavljivanja izuzetno mala ili teži ekstremu. Ekstrem u ovom kontekstu je stepen do kojeg statistika odstupa od nulte hipoteze (hipoteze koja se testira na konzistentnost sa dobijenim podacima uzorka). U naučnoj praksi, nivo značajnosti se bira pre prikupljanja podataka i po pravilu je njegov koeficijent 0,05 (5%). Za sisteme gde je to izuzetno važno tačne vrijednosti, ovaj pokazatelj može biti 0,01 (1%) ili manje.

Pozadina

Koncept nivoa značajnosti uveo je britanski statističar i genetičar Ronald Fisher 1925. godine, kada je razvijao tehniku ​​za testiranje statističkih hipoteza. Kada se analizira bilo koji proces, postoji određena vjerovatnoća određenih pojava. Poteškoće nastaju kada se radi sa malim (ili neočiglednim) procentima verovatnoća koje potpadaju pod koncept „greške merenja“.

Kada rade sa statističkim podacima koji nisu dovoljno specifični da ih testiraju, naučnici se suočavaju sa problemom nulte hipoteze, koja „sprečava“ rad sa malim količinama. Fisher je predložio da takvi sistemi odrede vjerovatnoću događaja na 5% (0,05) kao pogodan rez uzorkovanja, koji omogućava da se odbaci nulta hipoteza u proračunima.

Uvođenje fiksnih kvota

Godine 1933 Jerzy naučnici Neyman i Egon Pearson su u svojim radovima preporučili postavljanje određenog nivoa značaja unaprijed (prije prikupljanja podataka). Primjeri korištenja ovih pravila jasno su vidljivi tokom izbora. Recimo da su dva kandidata, od kojih je jedan veoma popularan, a drugi malo poznat. Očigledno je da će prvi kandidat pobijediti na izborima, a šanse drugog su ravne nuli. Nastoje - ali nisu jednaki: uvijek postoji mogućnost više sile, senzacionalne informacije, neočekivane odluke, što bi moglo promijeniti predviđene izborne rezultate.

Neyman i Pearson su se složili da je Fišerov nivo značajnosti od 0,05 (označen sa α) najprikladniji. Međutim, sam Fischer se 1956. godine protivio fiksiranju ove vrijednosti. Smatrao je da nivo α treba podesiti prema specifičnim okolnostima. Na primjer, u fizici čestica to je 0,01.

vrijednost p-nivoa

Termin p-vrijednost prvi je upotrijebio Brownlee 1960. godine. P-nivo (p-vrijednost) je indikator koji je in inverzni odnos na istinitost rezultata. Najviši koeficijent p-vrijednosti odgovara najnižem nivou povjerenja u uzorkovani odnos između varijabli.

Ova vrijednost odražava vjerovatnoću grešaka povezanih s interpretacijom rezultata. Pretpostavimo da je p-nivo = 0,05 (1/20). Pokazuje vjerovatnoću od pet posto da je odnos između varijabli pronađenih u uzorku samo nasumična karakteristika uzorka. Odnosno, ako ova zavisnost izostane, onda se kod ponovljenih sličnih eksperimenata, u prosjeku, u svakoj dvadesetoj studiji može očekivati ​​ista ili veća ovisnost između varijabli. P-nivo se često posmatra kao "margina" za stopu greške.

Usput, p-vrijednost možda ne odražava stvarni odnos između varijabli, već samo pokazuje određenu prosječnu vrijednost unutar pretpostavki. Konačna analiza podataka će posebno ovisiti o odabranim vrijednostima ovog koeficijenta. Na p-nivou = 0,05 bit će neki rezultati, a pri koeficijentu jednakom 0,01 bit će različiti rezultati.

Testiranje statističkih hipoteza

Nivo statističke značajnosti je posebno važan kada se testiraju hipoteze. Na primjer, prilikom izračunavanja dvostranog testa, područje odbijanja se dijeli jednako na oba kraja distribucije uzorkovanja (u odnosu na nultu koordinatu) i izračunava se istinitost rezultirajućih podataka.

Pretpostavimo da se prilikom praćenja određenog procesa (fenomena) ispostavi da nove statističke informacije ukazuju na male promjene u odnosu na prethodne vrijednosti. Istovremeno, odstupanja u rezultatima su mala, nisu očigledna, ali važna za studiju. Specijalista je suočen sa dilemom: da li se promene zaista dešavaju ili su to greške uzorkovanja (netačnost merenja)?

U ovom slučaju koriste ili odbacuju nultu hipotezu (sve pripisuju grešci, ili prepoznaju promjenu u sistemu kao gotov čin). Proces rješavanja problema zasniva se na omjeru ukupne statističke značajnosti (p-vrijednost) i nivoa značajnosti (α). Ako je p-nivo< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Korištene vrijednosti

Nivo značaja zavisi od materijala koji se analizira. U praksi se koriste sljedeće fiksne vrijednosti:

  • α = 0,1 (ili 10%);
  • α = 0,05 (ili 5%);
  • α = 0,01 (ili 1%);
  • α = 0,001 (ili 0,1%).

Što su proračuni precizniji, to je manji koeficijent α. Naravno, statističke prognoze u fizici, hemiji, farmaciji i genetici zahtijevaju veću tačnost nego u političkim naukama i sociologiji.

Pragovi značaja u određenim oblastima

U oblastima visoke preciznosti kao što su fizika čestica i proizvodnja, statistička značajnost se često izražava kao omjer standardne devijacije (označene sigma koeficijentom - σ) u odnosu na normalnu distribuciju vjerovatnoće (Gaussova raspodjela). σ je statistički pokazatelj koji određuje disperziju vrijednosti određene veličine u odnosu na matematička očekivanja. Koristi se za crtanje vjerovatnoće događaja.

U zavisnosti od oblasti znanja, koeficijent σ veoma varira. Na primjer, kada se predviđa postojanje Higgsovog bozona, parametar σ je jednak pet (σ = 5), što odgovara p-vrijednosti = 1/3,5 miliona U studijama genoma nivo značajnosti može biti 5 × 10 - 8, što nije neuobičajeno za ova područja.

Efikasnost

Mora se uzeti u obzir da koeficijenti α i p-vrijednost nisu tačne karakteristike. Koji god da je nivo značaja u statistici fenomena koji se proučava, to nije bezuslovna osnova za prihvatanje hipoteze. Na primjer, nego manje vrijednostiα, veća je šansa da je hipoteza značajna. Međutim, postoji rizik od greške, što smanjuje statističku snagu (značajnost) studije.

Istraživači koji se fokusiraju isključivo na statistički značajne rezultate mogu doći do pogrešnih zaključaka. Istovremeno, teško je provjeriti njihov rad, jer primjenjuju pretpostavke (koje su zapravo α i p-vrijednosti). Stoga se uvijek preporučuje, uz izračunavanje statističke značajnosti, odrediti još jedan pokazatelj – veličinu statističkog efekta. Veličina efekta je kvantitativna mjera jačina efekta.