Dom · Osvetljenje · Primjer pronalaženja varijanse. Očekivanje diskretne slučajne varijable

Primjer pronalaženja varijanse. Očekivanje diskretne slučajne varijable

Varijanca (rasipanje) slučajne varijable je matematičko očekivanje kvadratnog odstupanja slučajne varijable od njenog matematičkog očekivanja:

Da biste izračunali varijansu, možete koristiti malo izmijenjenu formulu

jer M(X), 2 i
– konstantne vrijednosti. dakle,

4.2.2. Svojstva disperzije

Nekretnina 1. Varijanca konstantne vrijednosti je nula. Zaista, po definiciji

Nekretnina 2. Konstantni faktor se može izvući iz znaka disperzije kvadraturom.

Dokaz

Centrirano slučajna varijabla je odstupanje slučajne varijable od njenog matematičkog očekivanja:

Centrirana veličina ima dva svojstva pogodna za transformaciju:

Nekretnina 3. Ako su slučajne varijable X i Y su dakle nezavisni

Dokaz. Označimo
. Onda.

U drugom terminu, zbog nezavisnosti slučajnih varijabli i svojstava centriranih slučajnih varijabli

Primjer 4.5. Ako a I b– konstante, zatim D (aX+b)= D(aX)+D(b)=
.

4.2.3. Standardna devijacija

Disperzija, kao karakteristika širenja slučajne varijable, ima jedan nedostatak. ako npr. X– greška mjerenja ima dimenziju MM, tada disperzija ima dimenziju
. Stoga često radije koriste drugu karakteristiku raspršivanja - standardna devijacija , što je jednako kvadratnom korijenu varijanse

Standardna devijacija ima istu dimenziju kao i sama slučajna varijabla.

Primjer 4.6. Varijanca broja pojavljivanja događaja u nezavisnom dizajnu ispitivanja

Proizvedeno n nezavisnih ispitivanja i vjerovatnoća da će se događaj dogoditi u svakom ispitivanju je R. Izrazimo, kao i ranije, broj pojavljivanja događaja X kroz broj pojavljivanja događaja u pojedinačnim eksperimentima:

Budući da su eksperimenti nezavisni, slučajne varijable su povezane s eksperimentima nezavisni. I to zbog nezavisnosti imamo

Ali svaka od slučajnih varijabli ima zakon distribucije (primjer 3.2)

I
(primjer 4.4). Dakle, po definiciji varijanse:

Gdje q=1- str.

Kao rezultat imamo
,

Standardna devijacija broja pojavljivanja događaja u n nezavisni eksperimenti jednaki
.

4.3. Trenuci slučajnih varijabli

Pored već razmatranih, slučajne varijable imaju mnoge druge numeričke karakteristike.

Početni trenutak k X (
) naziva se matematičko očekivanje k-ta snaga ove slučajne varijable.

Centralni trenutak k slučajna varijabla th reda X nazvano matematičko očekivanje k-ta snaga odgovarajuće centrirane veličine.

Lako je vidjeti da je centralni moment prvog reda uvijek jednak nuli, središnji moment drugog reda jednak je disperziji, jer .

Centralni moment trećeg reda daje ideju o asimetriji distribucije slučajne varijable. Trenuci reda veći od drugog koriste se relativno rijetko, pa ćemo se ograničiti samo na same pojmove.

4.4. Primjeri pronalaženja zakona distribucije

Razmotrimo primjere pronalaženja zakona distribucije slučajnih varijabli i njihovih numeričkih karakteristika.

Primjer 4.7.

Sastaviti zakon za raspodjelu broja pogodaka u metu sa tri hica u metu, ako je vjerovatnoća pogotka sa svakim hicem 0,4. Pronađite integralnu funkciju F(X) za rezultujuću distribuciju diskretne slučajne varijable X i nacrtaj njegov grafik. Pronađite očekivanu vrijednost M(X) , varijansa D(X) i standardnu ​​devijaciju
(X) slučajna varijabla X.

Rješenje

1) Diskretna slučajna varijabla X– broj pogodaka u metu sa tri hica – može imati četiri vrijednosti: 0, 1, 2, 3 . Vjerovatnoća da će prihvatiti svaku od njih nalazi se korištenjem Bernoullijeve formule sa: n=3,str=0,4,q=1- str=0,6 i m=0, 1, 2, 3:

Hajde da dobijemo verovatnoće mogućih vrednosti X:;

Sastavimo željeni zakon raspodjele slučajne varijable X:

Kontrola: 0,216+0,432+0,288+0,064=1.

Konstruirajmo poligon distribucije rezultirajuće slučajne varijable X. Da bismo to učinili, u pravougaonom koordinatnom sistemu označavamo tačke (0; 0,216), (1; 0,432), (2; 0,288), (3; 0,064). Povežimo ove tačke sa pravim segmentima, a rezultirajuća izlomljena linija je željeni poligon distribucije (slika 4.1).

2) Ako je x 0, onda F(X)=0. Zaista, za vrijednosti manje od nule, vrijednost X ne prihvata. Stoga, za sve X0, koristeći definiciju F(X), dobijamo F(X)=P(X< x) =0 (kao vjerovatnoća nemogućeg događaja).

Ako je 0 , To F(X) =0,216. Zaista, u ovom slučaju F(X)=P(X< x) = =P(- < X 0)+ P(0< X< x) =0,216+0=0,216.

Ako uzmemo npr. X=0,2, dakle F(0,2)=P(X<0,2) . Ali vjerovatnoća događaja X<0,2 равна 0,216, так как случайная величинаX samo u jednom slučaju uzima vrijednost manju od 0,2, tj 0 sa vjerovatnoćom 0,216.

Ako 1 , To

stvarno, X može uzeti vrijednost 0 sa vjerovatnoćom 0,216 i vrijednost 1 sa vjerovatnoćom 0,432; dakle, jedno od ovih značenja, bez obzira na koje, X može prihvatiti (prema teoremi sabiranja vjerovatnoća nespojivih događaja) sa vjerovatnoćom od 0,648.

Ako 2 , onda, argumentirajući slično, dobijamo F(X)=0,216+0,432 + + 0,288=0,936. Zaista, neka npr. X=3. Onda F(3)=P(X<3) izražava vjerovatnoću događaja X<3 – стрелок сделает меньше трех попаданий, т.е. ноль, один или два. Применяя теорему сложения вероятностей, получим указанное значение функцииF(X).

Ako x>3, onda F(X)=0,216+0,432+0,288+0,064=1. Zaista, događaj X
je pouzdan i njegova vjerovatnoća jednaka je jedan, i X>3 – nemoguće. S obzirom na to

F(X)=P(X< x) =P(X 3) + P(3< X< x) , dobijamo naznačeni rezultat.

Dakle, dobijena je tražena funkcija integralne distribucije slučajne varijable X:

F(x) =

čiji je grafikon prikazan na sl. 4.2.

3) Matematičko očekivanje diskretne slučajne varijable jednako je zbroju proizvoda svih mogućih vrijednosti X o njihovim vjerovatnoćama:

M(X)=0=1,2.

Odnosno, u prosjeku ima jedan pogodak u metu sa tri udarca.

Varijanca se može izračunati iz definicije varijanse D(X)= M(X- M(X)) ili koristite formulu D(X)= M(X
, što brže vodi do cilja.

Napišimo zakon raspodjele slučajne varijable X :

Nađimo matematičko očekivanje za X:

M(X ) = 04
= 2,16.

Izračunajmo potrebnu varijansu:

D(X) = M(X ) – (M(X)) = 2,16 – (1,2)= 0,72.

Standardnu ​​devijaciju pronalazimo pomoću formule

(X) =
= 0,848.

Interval ( M- ; M+ ) = (1,2-0,85; 1,2+0,85) = (0,35; 2,05) – interval najvjerovatnijih vrijednosti slučajne varijable X, sadrži vrijednosti 1 i 2.

Primjer 4.8.

Zadana je diferencijalna funkcija distribucije (funkcija gustoće) kontinuirane slučajne varijable X:

f(x) =

1) Odredite konstantni parametar a.

2) Naći integralnu funkciju F(x) .

3) Izgradite grafove funkcija f(x) I F(x) .

4) Nađite vjerovatnoću na dva načina P(0.5< X 1,5) I P(1,5< X<3,5) .

5). Pronađite očekivanu vrijednost M(X), varijansa D(X) i standardnu ​​devijaciju
slučajna varijabla X.

Rješenje

1) Diferencijalna funkcija po svojstvu f(x) mora zadovoljiti uslov
.

Izračunajmo ovaj nepravilni integral za ovu funkciju f(x) :

Zamjenom ovog rezultata u lijevu stranu jednakosti, dobijamo to A=1. U stanju za f(x) zamijenite parametar A do 1:

2) Pronaći F(x) upotrijebimo formulu

.

Ako je x
, To
, dakle,

Ako 1
To

Ako je x>2, onda

Dakle, tražena integralna funkcija F(x) ima oblik:

3) Napravimo grafove funkcija f(x) I F(x) (sl. 4.3 i 4.4).

4) Vjerovatnoća da slučajna varijabla padne u dati interval (A,b) izračunato po formuli
, ako je funkcija poznata f(x), i po formuli P(a < X < b) = F(b) – F(a), ako je funkcija poznata F(x).

Naći ćemo
koristeći dvije formule i uporedite rezultate. Po stanju a=0,5;b=1,5; funkcija f(X) navedeno u tački 1). Stoga je tražena vjerovatnoća prema formuli jednaka:

Ista vjerovatnoća se može izračunati korištenjem formule b) kroz prirast dobiven u koraku 2). integralna funkcija F(x) na ovom intervalu:

Jer F(0,5)=0.

Slično nalazimo

jer F(3,5)=1.

5) Pronaći matematičko očekivanje M(X) upotrijebimo formulu
Funkcija f(x) dat u rješenju tačke 1), jednak je nuli izvan intervala (1,2]:

Varijanca kontinuirane slučajne varijable D(X) određuje se jednakošću

, ili ekvivalentna jednakost


.

Za nalaz D(X) Koristimo posljednju formulu i uzmimo u obzir da su sve moguće vrijednosti f(x) pripadaju intervalu (1,2]:

Standardna devijacija
=
=0,276.

Interval najvjerovatnijih vrijednosti slučajne varijable X jednaki

(M-
,M+
) = (1,58-0,28; 1,58+0,28) = (1,3; 1,86).

Teorija vjerovatnoće je posebna grana matematike koju izučavaju samo studenti visokoškolskih ustanova. Volite kalkulacije i formule? Zar vas ne plaše izgledi da se upoznate sa normalnom distribucijom, entropijom ansambla, matematičkim očekivanjem i disperzijom diskretne slučajne varijable? Onda će vam ova tema biti veoma interesantna. Upoznajmo se sa nekoliko najvažnijih osnovnih pojmova ove grane nauke.

Prisjetimo se osnova

Čak i ako se sjećate najjednostavnijih koncepata teorije vjerojatnosti, nemojte zanemariti prve paragrafe članka. Poenta je da bez jasnog razumijevanja osnova nećete moći raditi sa formulama o kojima se govori u nastavku.

Dakle, dogodi se neki slučajni događaj, neki eksperiment. Kao rezultat akcija koje poduzimamo, možemo dobiti nekoliko ishoda – neki se javljaju češće, drugi rjeđe. Vjerovatnoća događaja je omjer broja stvarno dobijenih ishoda jedne vrste i ukupnog broja mogućih ishoda. Samo poznavajući klasičnu definiciju ovog koncepta možete početi proučavati matematičko očekivanje i disperziju kontinuiranih slučajnih varijabli.

Prosjek

Još u školi, na časovima matematike, počeli ste da radite sa aritmetičkom sredinom. Ovaj koncept se široko koristi u teoriji vjerovatnoće i stoga se ne može zanemariti. Za nas je trenutno najvažnije da ćemo ga susresti u formulama za matematičko očekivanje i disperziju slučajne varijable.

Imamo niz brojeva i želimo da pronađemo aritmetičku sredinu. Sve što se od nas traži je da zbrojimo sve dostupno i podijelimo brojem elemenata u nizu. Neka nam budu brojevi od 1 do 9. Zbir elemenata će biti jednak 45, a tu vrijednost ćemo podijeliti sa 9. Odgovor: - 5.

Disperzija

U naučnom smislu, disperzija je prosječni kvadrat odstupanja dobijenih vrijednosti karakteristike od aritmetičke sredine. Označava se jednim velikim latiničnim slovom D. Šta je potrebno da se izračuna? Za svaki element niza izračunavamo razliku između postojećeg broja i aritmetičke sredine i kvadriramo je. Bit će tačno onoliko vrijednosti koliko može biti ishoda za događaj koji razmatramo. Zatim zbrojimo sve primljeno i podijelimo s brojem elemenata u nizu. Ako imamo pet mogućih ishoda, onda podijelite sa pet.

Disperzija takođe ima svojstva koja se moraju zapamtiti da bi se koristila prilikom rešavanja problema. Na primjer, kada se slučajna varijabla povećava za X puta, varijansa se povećava za X puta na kvadrat (tj. X*X). Nikada nije manji od nule i ne zavisi od pomeranja vrednosti gore ili dole za jednake iznose. Dodatno, za nezavisna ispitivanja, varijansa sume je jednaka zbiru varijansi.

Sada svakako moramo razmotriti primjere varijanse diskretne slučajne varijable i matematičkog očekivanja.

Recimo da smo izveli 21 eksperiment i dobili 7 različitih ishoda. Svaku od njih smo posmatrali 1, 2, 2, 3, 4, 4 i 5 puta. Čemu će biti jednaka varijansa?

Prvo, izračunajmo aritmetičku sredinu: zbir elemenata je, naravno, 21. Podijelite ga sa 7 i dobijete 3. Sada oduzmite 3 od svakog broja u originalnom nizu, kvadrirajte svaku vrijednost i saberite rezultate. Rezultat je 12. Sada sve što treba da uradimo je da podelimo broj sa brojem elemenata, i, čini se, to je sve. Ali postoji kvaka! Hajde da razgovaramo o tome.

Ovisnost o broju eksperimenata

Ispostavilo se da prilikom izračunavanja varijanse nazivnik može sadržavati jedan od dva broja: ili N ili N-1. Ovdje je N broj izvedenih eksperimenata ili broj elemenata u nizu (što je u suštini ista stvar). Od čega ovo zavisi?

Ako se broj testova mjeri u stotinama, onda u nazivnik moramo staviti N. Ako je u jedinicama, onda N-1. Naučnici su odlučili da granicu povuku sasvim simbolično: danas ona prolazi kroz broj 30. Ako smo proveli manje od 30 eksperimenata, tada ćemo količinu podijeliti sa N-1, a ako više, onda sa N.

Zadatak

Vratimo se našem primjeru rješavanja problema varijanse i matematičkog očekivanja. Dobili smo srednji broj 12, koji je trebalo podijeliti sa N ili N-1. S obzirom da smo izveli 21 eksperiment, što je manje od 30, mi ćemo izabrati drugu opciju. Dakle, odgovor je: varijansa je 12 / 2 = 2.

Očekivana vrijednost

Prijeđimo na drugi koncept, koji moramo razmotriti u ovom članku. Matematičko očekivanje je rezultat zbrajanja svih mogućih ishoda pomnoženih odgovarajućim vjerovatnoćama. Važno je shvatiti da se dobijena vrijednost, kao i rezultat izračunavanja varijanse, dobiva samo jednom za cijeli problem, bez obzira na to koliko se ishoda u njemu razmatra.

Formula za matematičko očekivanje je prilično jednostavna: uzmemo ishod, pomnožimo ga njegovom vjerovatnoćom, dodamo isto za drugi, treći rezultat, itd. Sve što je vezano za ovaj koncept nije teško izračunati. Na primjer, zbir očekivanih vrijednosti jednak je očekivanoj vrijednosti sume. Isto važi i za rad. Ne dozvoljava vam svaka veličina u teoriji vjerovatnoće da izvodite tako jednostavne operacije. Uzmimo problem i izračunajmo značenje dva pojma koja smo proučavali odjednom. Osim toga, skrenula nam je pozornost teorija – vrijeme je za praksu.

Još jedan primjer

Proveli smo 50 ispitivanja i dobili 10 tipova ishoda – brojeva od 0 do 9 – koji se pojavljuju u različitim procentima. To su, respektivno: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. Podsjetimo da da biste dobili vjerovatnoće, trebate podijeliti procentualne vrijednosti sa 100. Dakle, dobijamo 0,02; 0,1 itd. Predstavimo primjer rješavanja problema za varijansu slučajne varijable i matematičko očekivanje.

Aritmetičku sredinu izračunavamo pomoću formule koju pamtimo iz osnovne škole: 50/10 = 5.

Sada hajde da pretvorimo vjerovatnoće u broj ishoda "u komadima" da bismo lakše brojali. Dobijamo 1, 5, 2, 7, 1, 9, 3, 8, 5 i 9. Od svake dobijene vrijednosti oduzimamo aritmetičku sredinu, nakon čega svaki dobijeni rezultat kvadriramo. Pogledajte kako to učiniti koristeći prvi element kao primjer: 1 - 5 = (-4). Sljedeće: (-4) * (-4) = 16. Za ostale vrijednosti, izvršite ove operacije sami. Ako ste sve uradili ispravno, onda nakon što ih sve zbrojite dobit ćete 90.

Nastavimo s izračunavanjem varijanse i očekivane vrijednosti dijeljenjem 90 sa N. Zašto biramo N umjesto N-1? Tačno, jer broj izvedenih eksperimenata prelazi 30. Dakle: 90/10 = 9. Dobili smo varijansu. Ako dobijete drugi broj, ne očajavajte. Najvjerovatnije ste napravili jednostavnu grešku u proračunima. Još jednom provjeri šta si napisao i vjerovatno će sve doći na svoje mjesto.

Na kraju, zapamtite formulu za matematičko očekivanje. Nećemo dati sve izračune, samo ćemo napisati odgovor s kojim možete provjeriti nakon što završite sve potrebne procedure. Očekivana vrijednost će biti 5,48. Prisjetimo se samo kako izvršiti operacije, koristeći prve elemente kao primjer: 0*0,02 + 1*0,1... i tako dalje. Kao što vidite, jednostavno pomnožimo vrijednost ishoda njegovom vjerovatnoćom.

Devijacija

Drugi koncept usko povezan sa disperzijom i matematičkim očekivanjem je standardna devijacija. Označava se ili latinskim slovima sd, ili grčkim malim slovima "sigma". Ovaj koncept pokazuje koliko u prosjeku vrijednosti odstupaju od središnje karakteristike. Da biste pronašli njegovu vrijednost, morate izračunati kvadratni korijen varijanse.

Ako nacrtate graf normalne distribucije i želite da vidite kvadratnu devijaciju direktno na njemu, to se može učiniti u nekoliko faza. Uzmite polovicu slike lijevo ili desno od moda (centralna vrijednost), nacrtajte okomicu na horizontalnu os tako da su površine rezultirajućih figura jednake. Veličina segmenta između sredine distribucije i rezultirajuće projekcije na horizontalnu osu predstavljat će standardnu ​​devijaciju.

Softver

Kao što se može vidjeti iz opisa formula i prikazanih primjera, izračunavanje varijanse i matematičkog očekivanja nije najjednostavniji postupak sa aritmetičke tačke gledišta. Kako ne biste gubili vrijeme, ima smisla koristiti program koji se koristi u visokoškolskim ustanovama - zove se "R". Ima funkcije koje vam omogućavaju da izračunate vrijednosti za mnoge koncepte iz statistike i teorije vjerojatnosti.

Na primjer, specificirate vektor vrijednosti. To se radi na sljedeći način: vektor<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Konačno

Disperzija i matematičko očekivanje su bez kojih je teško bilo šta izračunati u budućnosti. U glavnom kursu predavanja na univerzitetima o njima se govori već u prvim mjesecima izučavanja predmeta. Upravo zbog nerazumijevanja ovih jednostavnih pojmova i nemogućnosti njihovog izračunavanja mnogi studenti odmah počinju zaostajati u programu i kasnije dobijaju loše ocjene na kraju sesije, što ih lišava stipendija.

Vježbajte najmanje jednu sedmicu, pola sata dnevno, rješavajući zadatke slične onima predstavljenim u ovom članku. Tada ćete na bilo kojem testu iz teorije vjerojatnosti moći izaći na kraj s primjerima bez suvišnih savjeta i varalica.

Za grupisane podatke rezidualna varijansa- prosjek unutargrupnih varijansi:

Gdje je σ 2 j unutargrupna varijansa j-te grupe.

Za negrupisane podatke rezidualna varijansa– mjera tačnosti aproksimacije, tj. aproksimacija linije regresije originalnim podacima:
gdje je y(t) – prognoza prema jednačini trenda; y t – početni niz dinamike; n – broj bodova; p – broj koeficijenata regresijske jednačine (broj varijabli za objašnjenje).
U ovom primjeru se zove nepristrasni estimator varijanse.

Primjer br. 1. Raspodjelu radnika tri preduzeća jednog udruženja po tarifnim kategorijama karakterišu sljedeći podaci:

Radnička tarifna kategorijaBroj radnika u preduzeću
preduzeće 1preduzeće 2preduzeće 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Definiraj:
1. varijansa za svako preduzeće (unutargrupne varijanse);
2. prosjek varijansi unutar grupe;
3. međugrupna disperzija;
4. ukupna varijansa.

Rješenje.
Prije nego što počnete rješavati problem, potrebno je utvrditi koja je karakteristika efektivna, a koja faktorijalna. U primjeru koji se razmatra, rezultujući atribut je “Tarifna kategorija”, a faktor faktora je “Broj (naziv) preduzeća”.
Tada imamo tri grupe (preduzeća) za koje je potrebno izračunati grupni prosjek i unutargrupne varijanse:


KompanijaGrupni prosjek,Varijanca unutar grupe,
1 4 1,8

Prosjek varijansi unutar grupe ( rezidualna varijansa) će se izračunati pomoću formule:


gdje možete izračunati:
ili:


onda:
Ukupna varijansa će biti jednaka: s 2 = 1,6 + 0 = 1,6.
Ukupna varijansa se također može izračunati korištenjem jedne od sljedeće dvije formule:

Prilikom rješavanja praktičnih problema, često se mora suočiti sa osobinom koja ima samo dvije alternativne vrijednosti. U ovom slučaju ne govorimo o težini određene vrijednosti neke karakteristike, već o njenom udjelu u ukupnosti. Ako se udio jedinica stanovništva koje posjeduju karakteristiku koja se proučava označava sa “ R", a oni koji nemaju - kroz" q", tada se varijansa može izračunati pomoću formule:
s 2 = p×q

Primjer br. 2. Na osnovu podataka o proizvodnji šest radnika u timu utvrditi međugrupnu varijansu i procijeniti utjecaj radne smjene na njihovu produktivnost rada ako je ukupna varijansa 12,2.

Timski radnik br.Učinak radnika, kom.
u prvoj smjeniu drugoj smjeni
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Rješenje. Početni podaci

Xf 1f 2f 3f 4f 5f 6Ukupno
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Ukupno 31 33 37 37 40 38

Tada imamo 6 grupa za koje je potrebno izračunati grupnu srednju vrijednost i unutargrupne varijanse.
1. Pronađite prosječne vrijednosti svake grupe.







2. Pronađite srednji kvadrat svake grupe.







Sumiramo rezultate proračuna u tabeli:
Broj grupeGrupni prosjekVarijanca unutar grupe
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Varijanca unutar grupe karakteriše promenu (varijaciju) proučavane (rezultativne) karakteristike unutar grupe pod uticajem svih faktora na nju, osim faktora koji leži u osnovi grupisanja:
Prosjek varijansi unutar grupe izračunat će se pomoću formule:


4. Međugrupna varijansa karakteriše promenu (varijaciju) proučavane (rezultativne) karakteristike pod uticajem faktora (faktorske karakteristike) koji čini osnovu grupe.
Međugrupnu varijansu definiramo kao:

Gdje


Onda

Ukupna varijansa karakteriše promenu (varijaciju) proučavane (rezultativne) karakteristike pod uticajem svih faktora (faktorskih karakteristika) bez izuzetka. Prema uslovima zadatka, ona je jednaka 12,2.
Empirijska korelacija mjeri koji je dio ukupne varijabilnosti rezultirajuće karakteristike uzrokovan faktorom koji se proučava. Ovo je omjer varijanse faktora i ukupne varijanse:

Definiramo empirijsku korelaciju:

Veze između karakteristika mogu biti slabe i jake (bliske). Njihovi kriterijumi se ocjenjuju na Chaddock skali:
0,1 0,3 0,5 0,7 0,9 U našem primjeru, odnos između osobine Y i faktora X je slab
Koeficijent determinacije.

Odredimo koeficijent determinacije:

Tako je 0,67% varijacije rezultat razlika između osobina, a 99,37% drugih faktora.
Zaključak: u ovom slučaju učinak radnika ne zavisi od rada u određenoj smjeni, tj. uticaj radne smjene na njihovu produktivnost rada nije značajan i uzrokovan je drugim faktorima.

Primjer br. 3. Na osnovu podataka o prosječnim plaćama i kvadrata odstupanja od njene vrijednosti za dvije grupe radnika, pronađite ukupnu varijansu primjenom pravila sabiranja varijansi:

Rješenje:
Prosjek varijansi unutar grupe

Međugrupnu varijansu definiramo kao:


Ukupna varijansa će biti: 480 + 13824 = 14304

Disperzija u statistici nalazi se kao pojedinačne vrijednosti karakteristike na kvadrat iz . Ovisno o početnim podacima, određuje se korištenjem jednostavnih i ponderiranih formula varijanse:

1. (za negrupirane podatke) se izračunava pomoću formule:

2. Ponderirana varijansa (za serije varijacija):

gdje je n frekvencija (ponovljivost faktora X)

Primjer pronalaženja varijanse

Ova stranica opisuje standardni primjer pronalaženja varijanse, možete pogledati i druge probleme za njeno pronalaženje

Primjer 1. Za grupu od 20 dopisnih studenata dostupni su sljedeći podaci. Potrebno je konstruirati intervalni niz distribucije karakteristike, izračunati prosječnu vrijednost karakteristike i proučiti njenu disperziju

Hajde da napravimo intervalno grupisanje. Odredimo raspon intervala koristeći formulu:

gdje je X max maksimalna vrijednost karakteristike grupisanja;
X min – minimalna vrijednost karakteristike grupisanja;
n – broj intervala:

Prihvatamo n=5. Korak je: h = (192 - 159)/ 5 = 6,6

Kreirajmo intervalno grupiranje

Za dalje proračune napravićemo pomoćnu tabelu:

X'i je sredina intervala. (na primjer, sredina intervala 159 – 165,6 = 162,3)

Određujemo prosječnu visinu učenika koristeći ponderiranu formulu aritmetičkog prosjeka:

Odredimo varijansu koristeći formulu:

Formula disperzije se može transformirati na sljedeći način:

Iz ove formule slijedi da varijansa je jednaka razlika između prosjeka kvadrata opcija i kvadrata i prosjeka.

Disperzija u varijantnim serijama sa jednakim intervalima pomoću metode momenata može se izračunati na sljedeći način koristeći drugo svojstvo disperzije (dijeleći sve opcije vrijednošću intervala). Određivanje varijanse, izračunato metodom momenata, koristeći sljedeću formulu je manje naporno:

gdje je i vrijednost intervala;
A je konvencionalna nula, za koju je prikladno koristiti sredinu intervala s najvećom frekvencijom;
m1 je kvadrat momenta prvog reda;
m2 - trenutak drugog reda

(ako se u statističkoj populaciji karakteristika mijenja na takav način da postoje samo dvije međusobno isključive opcije, tada se takva varijabilnost naziva alternativa) može se izračunati pomoću formule:

Zamjenom q = 1- p u ovu formulu disperzije dobijamo:

Vrste varijanse

Ukupna varijansa mjeri varijaciju neke karakteristike u cijeloj populaciji kao cjelini pod utjecajem svih faktora koji uzrokuju ovu varijaciju. Ona je jednaka srednjem kvadratu odstupanja pojedinačnih vrednosti karakteristike x od ukupne srednje vrednosti x i može se definisati kao jednostavna varijansa ili ponderisana varijansa.

karakteriše slučajnu varijaciju, tj. dio varijacije koji je posljedica uticaja neuračunatih faktora i ne zavisi od faktora-atributa koji čini osnovu grupe. Takva disperzija jednaka je srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa unutar grupe X od aritmetičke sredine grupe i može se izračunati kao jednostavna disperzija ili kao ponderirana disperzija.

dakle, mjere varijance unutar grupe varijacija osobine unutar grupe i određena je formulom:

gdje je xi prosjek grupe;
ni je broj jedinica u grupi.

Na primjer, unutargrupne varijanse koje je potrebno utvrditi u zadatku proučavanja uticaja kvalifikacija radnika na nivo produktivnosti rada u radionici pokazuju varijacije u proizvodnji u svakoj grupi uzrokovane svim mogućim faktorima (tehničko stanje opreme, dostupnost alata i materijala, starosti radnika, intenziteta rada itd.), osim razlika u kategoriji kvalifikacija (unutar grupe svi radnici imaju iste kvalifikacije).

Prosjek varijansi unutar grupe odražava nasumičan, odnosno onaj dio varijacije koji je nastao pod utjecajem svih ostalih faktora, osim faktora grupisanja. Izračunava se pomoću formule:

Karakterizira sistematsku varijaciju rezultirajuće karakteristike, koja je posljedica utjecaja faktora-znaka koji čini osnovu grupe. Jednaka je srednjem kvadratu odstupanja grupnih srednjih vrijednosti od ukupne srednje vrijednosti. Međugrupna varijansa se izračunava pomoću formule:

Pravilo za dodavanje varijanse u statistiku

Prema pravilo dodavanja varijansi ukupna varijansa je jednaka zbroju prosjeka varijansi unutar grupe i između grupa:

Značenje ovog pravila je da je ukupna varijansa koja nastaje pod uticajem svih faktora jednaka zbiru varijansi koje nastaju pod uticajem svih ostalih faktora i varijanse koja nastaje usled faktora grupisanja.

Koristeći formulu za sabiranje varijansi, možete odrediti treću nepoznatu varijansu iz dvije poznate varijanse, a također procijeniti jačinu utjecaja karakteristike grupisanja.

Svojstva disperzije

1. Ako se sve vrijednosti neke karakteristike smanje (povećaju) za isti konstantni iznos, tada se disperzija neće promijeniti.
2. Ako se sve vrijednosti neke karakteristike smanje (povećaju) za isti broj puta n, tada će se varijansa shodno tome smanjiti (povećati) za n^2 puta.

Varijanca slučajne varijable je mjera širenja vrijednosti ove varijable. Mala varijansa znači da su vrijednosti grupisane blizu jedna drugoj. Velika disperzija ukazuje na snažno širenje vrijednosti. Koncept varijanse slučajne varijable koristi se u statistici. Na primjer, ako uporedite varijansu dviju vrijednosti (kao što je između muških i ženskih pacijenata), možete testirati značaj varijable. Varijanca se također koristi pri izgradnji statističkih modela, budući da niska varijansa može biti znak da previše prilagođavate vrijednosti.

Koraci

Izračunavanje varijanse uzorka

  1. Zabilježite vrijednosti uzorka. U većini slučajeva, statističari imaju pristup samo uzorcima određenih populacija. Na primjer, statističari po pravilu ne analiziraju troškove održavanja ukupnosti svih automobila u Rusiji - oni analiziraju slučajni uzorak od nekoliko hiljada automobila. Takav uzorak pomoći će u određivanju prosječne cijene automobila, ali najvjerovatnije će rezultirajuća vrijednost biti daleko od stvarne.

    • Na primjer, hajde da analiziramo broj peciva prodanih u kafiću tokom 6 dana, uzetih nasumično. Uzorak izgleda ovako: 17, 15, 23, 7, 9, 13. Ovo je uzorak, a ne populacija, jer nemamo podatke o prodatim pecivama za svaki dan rada kafića.
    • Ako vam je data populacija, a ne uzorak vrijednosti, nastavite na sljedeći odjeljak.
  2. Zapišite formulu za izračunavanje varijanse uzorka. Disperzija je mjera širenja vrijednosti određene količine. Što je vrijednost varijanse bliža nuli, to su vrijednosti bliže grupisane. Kada radite s uzorkom vrijednosti, koristite sljedeću formulu za izračunavanje varijanse:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))- x̅) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2))– ovo je disperzija. Disperzija se mjeri u kvadratnim jedinicama.
    • x i (\displaystyle x_(i))– svaku vrijednost u uzorku.
    • x i (\displaystyle x_(i)) trebate oduzeti x̅, kvadrirati ga, a zatim dodati rezultate.
    • x̅ – srednja vrijednost uzorka (srednja vrijednost uzorka).
    • n – broj vrijednosti u uzorku.
  3. Izračunajte srednju vrijednost uzorka. Označava se kao x̅. Srednja vrijednost uzorka se izračunava kao jednostavna aritmetička sredina: zbrojite sve vrijednosti u uzorku, a zatim podijelite rezultat s brojem vrijednosti u uzorku.

    • U našem primjeru dodajte vrijednosti u uzorku: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Sada podijelite rezultat s brojem vrijednosti u uzorku (u našem primjeru ima 6): 84 ÷ 6 = 14.
      Srednja vrijednost uzorka x̅ = 14.
    • Srednja vrijednost uzorka je središnja vrijednost oko koje se distribuiraju vrijednosti u uzorku. Ako se vrijednosti u uzorku grupišu oko srednje vrijednosti uzorka, tada je varijansa mala; inače je varijansa velika.
  4. Oduzmite srednju vrijednost uzorka od svake vrijednosti u uzorku. Sada izračunajte razliku x i (\displaystyle x_(i))- x̅, gdje x i (\displaystyle x_(i))– svaku vrijednost u uzorku. Svaki dobijeni rezultat ukazuje na stepen odstupanja određene vrijednosti od srednje vrijednosti uzorka, odnosno koliko je ta vrijednost udaljena od srednje vrijednosti uzorka.

    • U našem primjeru:
      x 1 (\displaystyle x_(1))- x = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Ispravnost dobijenih rezultata je lako provjeriti, jer njihov zbir treba biti jednak nuli. Ovo se odnosi na definiciju prosjeka, budući da su negativne vrijednosti (udaljenosti od prosjeka do manjih vrijednosti) potpuno nadoknađene pozitivnim vrijednostima (udaljenosti od prosjeka do većih vrijednosti).
  5. Kao što je gore navedeno, zbir razlika x i (\displaystyle x_(i))- x̅ mora biti jednako nuli. To znači da je prosječna varijansa uvijek nula, što ne daje nikakvu predstavu o širenju vrijednosti određene količine. Da biste riješili ovaj problem, kvadrirajte svaku razliku x i (\displaystyle x_(i))- x̅. Ovo će dovesti do toga da dobijete samo pozitivne brojeve, koji nikada neće biti zbirni do 0.

    • U našem primjeru:
      (x 1 (\displaystyle x_(1))- x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))- x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Našli ste kvadrat razlike - x̅) 2 (\displaystyle ^(2)) za svaku vrijednost u uzorku.
  6. Izračunajte zbir kvadrata razlika. Odnosno, pronađite onaj dio formule koji je napisan ovako: ∑[( x i (\displaystyle x_(i))- x̅) 2 (\displaystyle ^(2))]. Ovdje znak Σ označava zbir kvadrata razlika za svaku vrijednost x i (\displaystyle x_(i)) u uzorku. Već ste pronašli kvadratne razlike (x i (\displaystyle (x_(i))- x̅) 2 (\displaystyle ^(2)) za svaku vrijednost x i (\displaystyle x_(i)) u uzorku; sada samo dodajte ove kvadrate.

    • U našem primjeru: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Podijelite rezultat sa n - 1, gdje je n broj vrijednosti u uzorku. Prije nekog vremena, da bi izračunali varijansu uzorka, statističari su jednostavno podijelili rezultat sa n; u ovom slučaju dobićete srednju vrednost kvadratne varijanse, koja je idealna za opisivanje varijanse datog uzorka. Ali zapamtite da je svaki uzorak samo mali dio populacije vrijednosti. Ako uzmete drugi uzorak i izvršite iste proračune, dobit ćete drugačiji rezultat. Kako se ispostavilo, dijeljenje sa n - 1 (a ne samo s n) daje tačniju procjenu varijanse populacije, što vas zanima. Podjela sa n – 1 je postala uobičajena, pa je uključena u formulu za izračunavanje varijanse uzorka.

    • U našem primjeru uzorak uključuje 6 vrijednosti, odnosno n = 6.
      Varijanca uzorka = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Razlika između varijanse i standardne devijacije. Imajte na umu da formula sadrži eksponent, pa se disperzija mjeri u kvadratnim jedinicama vrijednosti koja se analizira. Ponekad je takva veličina prilično teška za rad; u takvim slučajevima koristite standardnu ​​devijaciju, koja je jednaka kvadratnom korijenu varijanse. Zbog toga se varijansa uzorka označava kao s 2 (\displaystyle s^(2)), a standardna devijacija uzorka je kao s (\displaystyle s).

    • U našem primjeru, standardna devijacija uzorka je: s = √33,2 = 5,76.

    Izračunavanje varijanse stanovništva

    1. Analizirajte neki skup vrijednosti. Skup uključuje sve vrijednosti količine koja se razmatra. Na primjer, ako proučavate starost stanovnika Lenjingradske regije, onda ukupno uključuje starost svih stanovnika ove regije. Kada radite sa populacijom, preporučuje se da napravite tabelu i u nju unesete vrednosti populacije. Razmotrite sljedeći primjer:

      • U jednoj prostoriji se nalazi 6 akvarijuma. Svaki akvarij sadrži sljedeći broj riba:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Zapišite formulu za izračunavanje varijanse populacije. Budući da populacija uključuje sve vrijednosti određene količine, formula u nastavku vam omogućava da dobijete točnu vrijednost varijanse populacije. Da bi razlikovali varijansu populacije od varijance uzorka (koja je samo procjena), statističari koriste različite varijable:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)))/n
      • σ 2 (\displaystyle ^(2))– disperzija stanovništva (čitati kao “sigma na kvadrat”). Disperzija se mjeri u kvadratnim jedinicama.
      • x i (\displaystyle x_(i))– svaka vrijednost u cijelosti.
      • Σ – znak zbira. Odnosno, od svake vrijednosti x i (\displaystyle x_(i)) trebate oduzeti μ, kvadrirati ga, a zatim dodati rezultate.
      • μ – srednja vrednost stanovništva.
      • n – broj vrijednosti u populaciji.
    3. Izračunajte srednju vrijednost stanovništva. Kada se radi sa populacijom, njena srednja vrednost se označava kao μ (mu). Srednja populacija se izračunava kao jednostavna aritmetička sredina: zbrojite sve vrijednosti u populaciji, a zatim podijelite rezultat s brojem vrijednosti u populaciji.

      • Imajte na umu da se prosjeci ne računaju uvijek kao aritmetička sredina.
      • U našem primjeru, populacija znači: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Oduzmite srednju vrijednost populacije od svake vrijednosti u populaciji.Što je vrijednost razlike bliža nuli, to je specifična vrijednost bliža srednjoj vrijednosti populacije. Pronađite razliku između svake vrijednosti u populaciji i njene srednje vrijednosti i dobit ćete prvu ideju o distribuciji vrijednosti.

      • U našem primjeru:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Kvadrirajte svaki dobijeni rezultat. Vrijednosti razlike bit će i pozitivne i negativne; Ako se ove vrijednosti nacrtaju na brojevnoj liniji, one će ležati desno i lijevo od srednje vrijednosti populacije. Ovo nije dobro za izračunavanje varijanse jer se pozitivni i negativni brojevi međusobno poništavaju. Dakle, kvadrirajte svaku razliku da dobijete isključivo pozitivne brojeve.

      • U našem primjeru:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) za svaku vrijednost populacije (od i = 1 do i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Gdje x n (\displaystyle x_(n))– posljednja vrijednost u populaciji.
      • Da biste izračunali prosječnu vrijednost dobijenih rezultata, potrebno je pronaći njihov zbir i podijeliti ga sa n:(( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)))/n
      • Zapišimo sada gornje objašnjenje koristeći varijable: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n i dobijete formulu za izračunavanje varijanse populacije.