rumah · Instalasi · Varians dari variabel acak. Dispersi variabel acak diskrit. Deviasi standar

Varians dari variabel acak. Dispersi variabel acak diskrit. Deviasi standar

Untuk data yang dikelompokkan varians sisa- rata-rata varians intragrup:

Dimana σ 2 j adalah varians intragrup dari grup ke-j.

Untuk data yang tidak dikelompokkan varians sisa– ukuran akurasi perkiraan, mis. perkiraan garis regresi terhadap data asli:
dimana y(t) – perkiraan menurut persamaan tren; yt – rangkaian dinamika awal; n – jumlah poin; p – jumlah koefisien persamaan regresi (jumlah variabel penjelas).
Dalam contoh ini disebut penduga varians yang tidak bias.

Contoh No.1. Sebaran pekerja di tiga perusahaan dalam satu asosiasi menurut kategori tarif ditandai dengan data sebagai berikut:

Kategori tarif pekerjaJumlah pekerja di perusahaan
perusahaan 1perusahaan 2perusahaan 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Mendefinisikan:
1. varians untuk setiap perusahaan (varians intra-grup);
2. rata-rata variansi dalam kelompok;
3. penyebaran antarkelompok;
4. varians total.

Larutan.
Sebelum memulai penyelesaian masalah, perlu diketahui fitur mana yang efektif dan mana yang faktorial. Dalam contoh yang dipertimbangkan, atribut yang dihasilkan adalah “Kategori tarif”, dan atribut faktornya adalah “Jumlah (nama) perusahaan”.
Kemudian kita memiliki tiga kelompok (perusahaan), yang perlu menghitung rata-rata kelompok dan varians intragrup:


PerusahaanRata-rata grup,Varians dalam kelompok,
1 4 1,8

Rata-rata varians dalam kelompok ( varians sisa) akan dihitung menggunakan rumus:


di mana Anda dapat menghitung:
atau:


Kemudian:
Varians totalnya akan sama dengan: s 2 = 1,6 + 0 = 1,6.
Varians total juga dapat dihitung menggunakan salah satu dari dua rumus berikut:

Saat memecahkan masalah praktis, sering kali kita harus berurusan dengan fitur yang hanya mengambil dua nilai alternatif. Dalam hal ini, kita tidak berbicara tentang bobot nilai tertentu dari suatu fitur, tetapi tentang bagiannya dalam totalitas. Jika proporsi unit populasi yang mempunyai sifat yang diteliti dilambangkan dengan “ R", dan mereka yang tidak memiliki - melalui" Q", maka variansnya dapat dihitung dengan menggunakan rumus:
s 2 = p×q

Contoh No.2. Berdasarkan data produksi enam pekerja dalam satu tim, tentukan varians antarkelompok dan evaluasi dampak shift kerja terhadap produktivitas tenaga kerja mereka jika varians totalnya adalah 12,2.

Pekerja tim no.Keluaran pekerja, pcs.
pada shift pertamapada shift kedua
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Larutan. Data awal

Xf 1f 2f 3f 4f 5f 6Total
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Total 31 33 37 37 40 38

Kemudian kita memiliki 6 kelompok yang perlu menghitung mean kelompok dan varian intragrup.
1. Carilah nilai rata-rata masing-masing kelompok.







2. Temukan mean square dari masing-masing kelompok.







Mari kita rangkum hasil perhitungan dalam sebuah tabel:
Nomor grupRata-rata kelompokVarians dalam kelompok
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Varians dalam kelompok mencirikan perubahan (variasi) sifat (hasil) yang dipelajari dalam suatu kelompok di bawah pengaruh semua faktor di dalamnya, kecuali faktor yang mendasari pengelompokan tersebut:
Rata-rata varians intragrup akan dihitung dengan menggunakan rumus:


4. Varians antarkelompok mencirikan perubahan (variasi) sifat yang dipelajari (resultatif) di bawah pengaruh suatu faktor (karakteristik faktorial) yang menjadi dasar kelompok.
Kami mendefinisikan varians antarkelompok sebagai:

Di mana


Kemudian

Varians total mencirikan perubahan (variasi) sifat yang dipelajari (resultantif) di bawah pengaruh semua faktor (karakteristik faktorial) tanpa kecuali. Menurut kondisi soal sama dengan 12.2.
Hubungan korelasi empiris mengukur bagian mana dari total variabilitas karakteristik yang dihasilkan yang disebabkan oleh faktor yang diteliti. Ini adalah rasio varians faktor terhadap varians total:

Kami mendefinisikan hubungan korelasi empiris:

Hubungan antar karakteristik bisa lemah dan kuat (dekat). Kriteria mereka dinilai pada skala Chaddock:
0,1 0,3 0,5 0,7 0,9 Dalam contoh kita, hubungan antara sifat Y dan faktor X adalah lemah
Koefisien determinasi.

Mari kita tentukan koefisien determinasi:

Jadi, 0,67% variasi tersebut disebabkan oleh perbedaan antar sifat, dan 99,37% disebabkan oleh faktor lain.
Kesimpulan: dalam hal ini output pekerja tidak bergantung pada pekerjaan pada shift tertentu, yaitu. pengaruh shift kerja terhadap produktivitas kerja mereka tidak signifikan dan disebabkan oleh faktor lain.

Contoh No.3. Berdasarkan data upah rata-rata dan kuadrat deviasi dari nilainya untuk dua kelompok pekerja, carilah varians total dengan menerapkan aturan penjumlahan varians:

Larutan:
Rata-rata varians dalam kelompok

Kami mendefinisikan varians antarkelompok sebagai:


Varians totalnya adalah: 480 + 13824 = 14304

.

Sebaliknya, if adalah ae non-negatif. berfungsi sedemikian rupa , maka ada ukuran probabilitas yang benar-benar kontinu sehingga menjadi kepadatannya.

    Mengganti ukuran dalam integral Lebesgue:

,

dimana adalah fungsi Borel yang dapat diintegralkan terhadap ukuran probabilitas.

Dispersi, Jenis dan Sifat Dispersi Konsep dispersi

Dispersi dalam statistik ditemukan sebagai deviasi standar dari nilai individu dari karakteristik yang dikuadratkan dari mean aritmatika. Bergantung pada data awal, ditentukan dengan menggunakan rumus varians sederhana dan tertimbang:

1. Varians sederhana(untuk data yang tidak dikelompokkan) dihitung menggunakan rumus:

2. Varians tertimbang (untuk rangkaian variasi):

dimana n adalah frekuensi (pengulangan faktor X)

Contoh mencari varians

Halaman ini menjelaskan contoh standar untuk menemukan varians, Anda juga dapat melihat masalah lain untuk menemukannya

Contoh 1. Penentuan kelompok, rata-rata kelompok, antarkelompok dan varians total

Contoh 2. Mencari varians dan koefisien variasi dalam tabel pengelompokan

Contoh 3. Mencari varians pada deret diskrit

Contoh 4. Data berikut tersedia untuk sekelompok 20 siswa korespondensi. Perlu dibuat deret interval sebaran suatu sifat, menghitung nilai rata-rata suatu sifat dan mempelajari penyebarannya

Mari kita membangun pengelompokan interval. Mari kita tentukan rentang intervalnya menggunakan rumus:

dimana X max adalah nilai maksimum dari karakteristik pengelompokan; X min – nilai minimum karakteristik pengelompokan; n – jumlah interval:

Kami menerima n=5. Langkahnya adalah: h = (192 - 159)/ 5 = 6,6

Mari buat pengelompokan interval

Untuk perhitungan lebih lanjut, kami akan membuat tabel tambahan:

X"i – titik tengah interval. (misalnya, titik tengah interval 159 – 165.6 = 162.3)

Kita menentukan rata-rata tinggi badan siswa menggunakan rumus rata-rata aritmatika tertimbang:

Mari kita tentukan variansnya menggunakan rumus:

Rumusnya dapat diubah seperti ini:

Dari rumus ini berikut ini varians sama dengan perbedaan antara rata-rata kuadrat pilihan dan kuadrat dan rata-rata.

Dispersi dalam deret variasi dengan interval yang sama menggunakan metode momen dapat dihitung dengan cara berikut menggunakan sifat dispersi kedua (membagi semua opsi dengan nilai interval). Menentukan varians, dihitung menggunakan metode momen, menggunakan rumus berikut ini tidak terlalu memakan waktu:

dimana i adalah nilai interval; A adalah nol konvensional, yang mana akan lebih mudah untuk menggunakan titik tengah interval dengan frekuensi tertinggi; m1 adalah kuadrat momen orde pertama; m2 - momen orde kedua

Varians sifat alternatif (jika dalam suatu populasi statistik suatu karakteristik berubah sedemikian rupa sehingga hanya terdapat dua pilihan yang saling eksklusif, maka variabilitas tersebut disebut alternatif) dapat dihitung dengan menggunakan rumus:

Mengganti q = 1- p ke dalam rumus dispersi ini, kita memperoleh:

Jenis varians

Varians total mengukur variasi suatu karakteristik pada seluruh populasi secara keseluruhan di bawah pengaruh semua faktor yang menyebabkan variasi tersebut. Ini sama dengan kuadrat rata-rata dari deviasi nilai individu suatu karakteristik x dari nilai rata-rata keseluruhan x dan dapat didefinisikan sebagai varians sederhana atau varians tertimbang.

Varians dalam kelompok mencirikan variasi acak, yaitu bagian dari variasi yang disebabkan oleh pengaruh faktor-faktor yang tidak terhitung dan tidak bergantung pada atribut-faktor yang menjadi dasar kelompoknya. Dispersi tersebut sama dengan kuadrat rata-rata deviasi nilai individu atribut dalam grup X dari mean aritmatika grup dan dapat dihitung sebagai dispersi sederhana atau sebagai dispersi tertimbang.

Dengan demikian, ukuran varians dalam kelompok variasi suatu sifat dalam suatu kelompok dan ditentukan dengan rumus:

dimana xi adalah rata-rata kelompok; ni adalah jumlah unit dalam grup.

Misalnya varians intragrup yang perlu ditentukan dalam tugas mempelajari pengaruh kualifikasi pekerja terhadap tingkat produktivitas tenaga kerja di suatu bengkel menunjukkan variasi output pada setiap kelompok yang disebabkan oleh semua faktor yang mungkin (kondisi teknis peralatan, ketersediaan peralatan). alat dan bahan, umur pekerja, intensitas tenaga kerja, dan lain-lain.), kecuali perbedaan kategori kualifikasi (dalam suatu kelompok semua pekerja mempunyai kualifikasi yang sama).

Rata-rata varians dalam kelompok mencerminkan variasi acak, yaitu bagian variasi yang terjadi karena pengaruh semua faktor lain, kecuali faktor pengelompokan. Itu dihitung menggunakan rumus:

Varians antarkelompok mencirikan variasi sistematis dari sifat yang dihasilkan, yang disebabkan oleh pengaruh faktor-atribut yang menjadi dasar kelompok. Nilai ini sama dengan kuadrat rata-rata deviasi rata-rata kelompok dari rata-rata keseluruhan. Varians antarkelompok dihitung dengan menggunakan rumus:

Mari kita hitungMSUNGGULvarians sampel dan deviasi standar. Kami juga akan menghitung varians suatu variabel acak jika distribusinya diketahui.

Mari kita pertimbangkan dulu penyebaran, Kemudian deviasi standar.

Varians sampel

Varians sampel (varians sampel,Sampelperbedaan) mencirikan penyebaran nilai dalam array relatif terhadap .

Ketiga rumus tersebut setara secara matematis.

Dari rumus pertama sudah jelas bahwa varians sampel adalah jumlah deviasi kuadrat setiap nilai dalam array dari rata-rata, dibagi dengan ukuran sampel dikurangi 1.

varians sampel fungsi DISP() digunakan, Bahasa Inggris. nama VAR, yaitu Perbedaan. Dari versi MS EXCEL 2010, disarankan untuk menggunakan analognya DISP.V(), Bahasa Inggris. nama VARS, yaitu Contoh VARIance. Selain itu, mulai versi MS EXCEL 2010, terdapat fungsi DISP.Г(), Bahasa Inggris. nama VARP, mis. VARIance Populasi, yang menghitung penyebaran Untuk populasi. Perbedaannya terletak pada penyebutnya: alih-alih n-1 seperti DISP.V(), DISP.G() hanya memiliki n pada penyebutnya. Sebelum MS EXCEL 2010, fungsi VAR() digunakan untuk menghitung varians populasi.

Varians sampel
=QUADROTCL(Sampel)/(JUMLAH(Sampel)-1)
=(SUM(Sampel)-COUNT(Sampel)*RATA-RATA(Sampel)^2)/ (COUNT(Sampel)-1)– rumus biasa
=SUM((Sampel -RATA-RATA(Sampel))^2)/ (JUMLAH(Sampel)-1) –

Varians sampel sama dengan 0, hanya jika semua nilai sama satu sama lain dan, karenanya, sama nilai rata-rata. Biasanya semakin besar nilainya varians, semakin besar penyebaran nilai dalam array.

Varians sampel adalah perkiraan poin varians distribusi variabel acak dari mana variabel itu dibuat Sampel. Tentang konstruksi interval kepercayaan saat menilai varians bisa dibaca di artikel.

Varians dari variabel acak

Menghitung penyebaran variabel acak, Anda perlu mengetahuinya.

Untuk varians variabel acak X sering dinotasikan dengan Var(X). Penyebaran sama dengan kuadrat deviasi dari mean E(X): Var(X)=E[(X-E(X)) 2 ]

penyebaran dihitung dengan rumus:

dimana x i adalah nilai yang dapat diambil oleh suatu variabel acak, dan μ adalah nilai rata-rata (), p(x) adalah peluang bahwa variabel acak tersebut akan mengambil nilai x.

Jika suatu variabel acak mempunyai , maka penyebaran dihitung dengan rumus:

Dimensi varians sesuai dengan kuadrat satuan pengukuran dari nilai aslinya. Misalnya, jika nilai dalam sampel mewakili pengukuran berat suatu bagian (dalam kg), maka dimensi variansnya adalah kg 2 . Hal ini mungkin sulit untuk ditafsirkan, sehingga untuk mengkarakterisasi penyebaran nilai, nilai sama dengan akar kuadrat variansdeviasi standar.

Beberapa properti varians:

Var(X+a)=Var(X), dengan X adalah variabel acak dan a adalah konstanta.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Properti dispersi ini digunakan dalam artikel tentang regresi linier.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), dengan X dan Y adalah variabel acak, Cov(X;Y) adalah kovarians dari variabel acak tersebut.

Jika variabel acak bersifat independen, maka variabel tersebut kovarians sama dengan 0, dan oleh karena itu Var(X+Y)=Var(X)+Var(Y). Sifat dispersi ini digunakan dalam derivasi.

Mari kita tunjukkan bahwa untuk besaran bebas Var(X-Y)=Var(X+Y). Memang benar, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Properti dispersi ini digunakan untuk membangun.

Contoh simpangan baku

Contoh simpangan baku adalah ukuran seberapa luas nilai-nilai yang tersebar dalam suatu sampel relatif terhadapnya.

A-priori, deviasi standar sama dengan akar kuadrat dari varians:

Deviasi standar tidak memperhitungkan besarnya nilai dalam Sampel, tetapi hanya derajat penyebaran nilai-nilai di sekitarnya rata-rata. Untuk mengilustrasikannya, mari kita berikan sebuah contoh.

Mari kita hitung simpangan baku untuk 2 sampel: (1; 5; 9) dan (1001; 1005; 1009). Dalam kedua kasus, s=4. Jelas terlihat bahwa rasio deviasi standar terhadap nilai array berbeda secara signifikan antar sampel. Untuk kasus seperti itu digunakan Koefisien variasi(Koefisien Variasi, CV) - rasio Deviasi Standar ke rata-rata hitung, dinyatakan dalam persentase.

Di MS EXCEL 2007 dan versi sebelumnya untuk penghitungan Contoh simpangan baku fungsi =STDEVAL() digunakan, bahasa Inggris. nama STDEV, mis. Deviasi Standar. Dari versi MS EXCEL 2010 disarankan menggunakan analognya =STDEV.B() , Bahasa Inggris. nama STDEV.S, mis. Contoh DEVIASI STANDAR.

Selain itu, mulai versi MS EXCEL 2010, terdapat fungsi STANDARDEV.G(), Bahasa Inggris. nama STDEV.P, mis. DEVIASI Standar Populasi, yang menghitung deviasi standar Untuk populasi. Seluruh perbedaan terletak pada penyebutnya: alih-alih n-1 seperti pada STANDARDEV.V(), STANDARDEVAL.G() hanya memiliki n pada penyebutnya.

Deviasi standar bisa juga dihitung langsung menggunakan rumus di bawah ini (lihat contoh file)
=ROOT(QUADROTCL(Sampel)/(JUMLAH(Sampel)-1))
=ROOT((SUM(Sampel)-COUNT(Sampel)*RATA-RATA(Sampel)^2)/(COUNT(Sampel)-1))

Ukuran penyebaran lainnya

Fungsi SQUADROTCL() menghitung dengan jumlah deviasi kuadrat nilai darinya rata-rata. Fungsi ini akan mengembalikan hasil yang sama seperti rumus =DISP.G( Sampel)*MEMERIKSA( Sampel) , Di mana Sampel- referensi ke rentang yang berisi larik nilai sampel(). Perhitungan pada fungsi QUADROCL() dilakukan sesuai dengan rumus:

Fungsi SROTCL() juga merupakan ukuran penyebaran kumpulan data. Fungsi SROTCL() menghitung rata-rata nilai absolut dari deviasi nilai rata-rata. Fungsi ini akan mengembalikan hasil yang sama seperti rumus =SUMPRODUK(ABS(Sampel-RATA-RATA(Sampel)))/COUNT(Sampel), Di mana Sampel- tautan ke rentang yang berisi larik nilai sampel.

Perhitungan pada fungsi SROTCL() dilakukan dengan rumus:

Varians suatu variabel acak merupakan ukuran penyebaran nilai-nilai variabel tersebut. Varians yang rendah berarti nilai-nilai tersebut mengelompok berdekatan. Sebaran yang besar menunjukkan penyebaran nilai yang kuat. Konsep varians variabel acak digunakan dalam statistik. Misalnya, jika Anda membandingkan varian dua nilai (misalnya antara pasien pria dan wanita), Anda dapat menguji signifikansi suatu variabel. Varians juga digunakan saat membuat model statistik, karena varians yang rendah dapat menjadi tanda bahwa Anda melakukan penyesuaian nilai secara berlebihan.

Langkah

Menghitung varians sampel

  1. Catat nilai sampel. Dalam kebanyakan kasus, ahli statistik hanya memiliki akses terhadap sampel populasi tertentu. Misalnya, sebagai aturan, ahli statistik tidak menganalisis biaya pemeliharaan total semua mobil di Rusia - mereka menganalisis sampel acak beberapa ribu mobil. Sampel seperti itu akan membantu menentukan harga rata-rata sebuah mobil, tetapi kemungkinan besar, nilai yang dihasilkan akan jauh dari nilai sebenarnya.

    • Misalnya, mari kita analisis jumlah roti yang terjual di sebuah kafe selama 6 hari, yang diambil secara acak. Sampelnya seperti ini: 17, 15, 23, 7, 9, 13. Ini adalah sampel, bukan populasi, karena kami tidak memiliki data roti yang terjual setiap hari kafe buka.
    • Jika Anda diberikan nilai populasi dan bukan sampel, lanjutkan ke bagian berikutnya.
  2. Tuliskan rumus untuk menghitung varians sampel. Dispersi adalah ukuran penyebaran nilai-nilai dalam besaran tertentu. Semakin dekat nilai variansnya dengan nol, maka semakin dekat pula nilai-nilai tersebut dikelompokkan. Saat mengerjakan sampel nilai, gunakan rumus berikut untuk menghitung varians:

    • s 2 (\gaya tampilan s^(2)) = ∑[(x saya (\gaya tampilan x_(i))- X) 2 (\gaya tampilan ^(2))] / (n - 1)
    • s 2 (\gaya tampilan s^(2))– ini adalah dispersi. Dispersi diukur dalam satuan persegi.
    • x saya (\gaya tampilan x_(i))– setiap nilai dalam sampel.
    • x saya (\gaya tampilan x_(i)) Anda perlu mengurangi x̅, mengkuadratkannya, lalu menjumlahkan hasilnya.
    • x̅ – mean sampel (rata-rata sampel).
    • n – jumlah nilai dalam sampel.
  3. Hitung mean sampel. Dilambangkan dengan x̅. Rata-rata sampel dihitung sebagai rata-rata aritmatika sederhana: jumlahkan semua nilai dalam sampel, lalu bagi hasilnya dengan jumlah nilai dalam sampel.

    • Dalam contoh kita, tambahkan nilai dalam sampel: 15+17+23+7+9+13=84
      Sekarang bagi hasilnya dengan banyaknya nilai dalam sampel (dalam contoh kita ada 6): 84 6 = 14.
      Rata-rata sampel x̅ = 14.
    • Rata-rata sampel adalah nilai sentral di mana nilai-nilai dalam sampel didistribusikan. Jika nilai-nilai dalam cluster sampel berada di sekitar mean sampel, maka variansnya kecil; jika tidak, variansnya besar.
  4. Kurangi mean sampel dari setiap nilai dalam sampel. Sekarang hitung selisihnya x saya (\gaya tampilan x_(i))- x̅, dimana x saya (\gaya tampilan x_(i))– setiap nilai dalam sampel. Setiap hasil yang diperoleh menunjukkan derajat penyimpangan suatu nilai tertentu dari mean sampel, yaitu seberapa jauh nilai tersebut dari mean sampel.

    • Dalam contoh kita:
      x 1 (\gaya tampilan x_(1))- x = 17 - 14 = 3
      x 2 (\gaya tampilan x_(2))- x̅ = 15 - 14 = 1
      x 3 (\gaya tampilan x_(3))- x = 23 - 14 = 9
      x 4 (\gaya tampilan x_(4))- x̅ = 7 - 14 = -7
      x 5 (\gaya tampilan x_(5))- x̅ = 9 - 14 = -5
      x 6 (\gaya tampilan x_(6))- x̅ = 13 - 14 = -1
    • Kebenaran hasil yang diperoleh mudah untuk diperiksa, karena jumlahnya harus sama dengan nol. Hal ini terkait dengan pengertian rata-rata, karena nilai negatif (jarak dari rata-rata ke nilai yang lebih kecil) sepenuhnya diimbangi oleh nilai positif (jarak dari rata-rata ke nilai yang lebih besar).
  5. Seperti disebutkan di atas, jumlah perbedaannya x saya (\gaya tampilan x_(i))- x̅ harus sama dengan nol. Artinya varians rata-rata selalu nol, sehingga tidak memberikan gambaran apapun tentang penyebaran nilai suatu besaran tertentu. Untuk mengatasi masalah ini, kuadratkan setiap perbedaannya x saya (\gaya tampilan x_(i))- X. Ini akan mengakibatkan Anda hanya mendapatkan angka positif, yang tidak akan pernah berjumlah 0.

    • Dalam contoh kita:
      (x 1 (\gaya tampilan x_(1))- X) 2 = 3 2 = 9 (\gaya tampilan ^(2)=3^(2)=9)
      (x 2 (\gaya tampilan (x_(2))- X) 2 = 1 2 = 1 (\gaya tampilan ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Anda menemukan kuadrat selisihnya - x̅) 2 (\gaya tampilan ^(2)) untuk setiap nilai dalam sampel.
  6. Hitung jumlah kuadrat selisihnya. Artinya, carilah bagian rumus yang ditulis seperti ini: ∑[( x saya (\gaya tampilan x_(i))- X) 2 (\gaya tampilan ^(2))]. Di sini tanda Σ berarti jumlah selisih kuadrat untuk setiap nilai x saya (\gaya tampilan x_(i)) dalam sampel. Anda telah menemukan perbedaan kuadratnya (xi (\gaya tampilan (x_(i))- X) 2 (\gaya tampilan ^(2)) untuk setiap nilai x saya (\gaya tampilan x_(i)) dalam sampel; sekarang tambahkan saja kotak-kotak ini.

    • Dalam contoh kita: 9+1+81+49+25+1= 166 .
  7. Bagilah hasilnya dengan n - 1, dimana n adalah banyaknya nilai dalam sampel. Beberapa waktu lalu, untuk menghitung varians sampel, ahli statistik cukup membagi hasilnya dengan n; dalam hal ini Anda akan mendapatkan rata-rata varians kuadrat, yang ideal untuk mendeskripsikan varians sampel tertentu. Namun perlu diingat bahwa sampel apa pun hanyalah sebagian kecil dari nilai populasi. Jika Anda mengambil sampel lain dan melakukan perhitungan yang sama, Anda akan mendapatkan hasil yang berbeda. Ternyata, membaginya dengan n - 1 (bukan hanya n) akan memberikan perkiraan varians populasi yang lebih akurat, dan itulah yang Anda minati. Pembagian dengan n – 1 sudah menjadi hal yang umum, sehingga dimasukkan dalam rumus menghitung varians sampel.

    • Dalam contoh kita, sampel mencakup 6 nilai, yaitu n = 6.
      Varians sampel = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Perbedaan antara varians dan deviasi standar. Perhatikan bahwa rumusnya mengandung eksponen, sehingga dispersi diukur dalam satuan kuadrat dari nilai yang dianalisis. Terkadang besarnya seperti itu cukup sulit untuk dioperasikan; dalam kasus seperti ini, gunakan deviasi standar, yang sama dengan akar kuadrat dari varians. Itulah sebabnya varians sampel dilambangkan sebagai s 2 (\gaya tampilan s^(2)), dan simpangan baku sampel adalah sebagai s (\gaya tampilan s).

    • Dalam contoh kita, simpangan baku sampel adalah: s = √33,2 = 5,76.

    Menghitung Varians Populasi

    1. Analisis serangkaian nilai. Himpunan mencakup semua nilai besaran yang dipertimbangkan. Misalnya, jika Anda mempelajari usia penduduk wilayah Leningrad, maka totalitasnya mencakup usia seluruh penduduk wilayah tersebut. Saat bekerja dengan suatu populasi, disarankan untuk membuat tabel dan memasukkan nilai populasi ke dalamnya. Perhatikan contoh berikut:

      • Dalam suatu ruangan terdapat 6 akuarium. Setiap akuarium berisi jumlah ikan berikut:
        x 1 = 5 (\gaya tampilan x_(1)=5)
        x 2 = 5 (\gaya tampilan x_(2)=5)
        x 3 = 8 (\gaya tampilan x_(3)=8)
        x 4 = 12 (\gaya tampilan x_(4)=12)
        x 5 = 15 (\gaya tampilan x_(5)=15)
        x 6 = 18 (\gaya tampilan x_(6)=18)
    2. Tuliskan rumus untuk menghitung varians populasi. Karena populasi mencakup semua nilai kuantitas tertentu, rumus di bawah ini memungkinkan Anda memperoleh nilai pasti dari varians populasi. Untuk membedakan varians populasi dari varians sampel (yang hanya merupakan perkiraan), ahli statistik menggunakan berbagai variabel:

      • σ 2 (\gaya tampilan ^(2)) = (∑(x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2)))/N
      • σ 2 (\gaya tampilan ^(2))– penyebaran penduduk (dibaca “sigma kuadrat”). Dispersi diukur dalam satuan persegi.
      • x saya (\gaya tampilan x_(i))– setiap nilai secara total.
      • Σ – tanda penjumlahan. Artinya, dari setiap nilai x saya (\gaya tampilan x_(i)) Anda perlu mengurangi μ, mengkuadratkannya, lalu menjumlahkan hasilnya.
      • μ – rata-rata populasi.
      • n – jumlah nilai dalam populasi.
    3. Hitung rata-rata populasi. Saat menangani suatu populasi, meannya dilambangkan sebagai μ (mu). Rata-rata populasi dihitung sebagai rata-rata aritmatika sederhana: jumlahkan semua nilai dalam populasi, lalu bagi hasilnya dengan banyaknya nilai dalam populasi.

      • Ingatlah bahwa rata-rata tidak selalu dihitung sebagai rata-rata aritmatika.
      • Dalam contoh kita, rata-rata populasi: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Kurangi mean populasi dari setiap nilai dalam populasi. Semakin dekat nilai selisihnya ke nol, maka semakin dekat nilai spesifiknya dengan rata-rata populasi. Temukan perbedaan antara setiap nilai dalam populasi dan rata-ratanya, dan Anda akan mendapatkan gambaran pertama tentang distribusi nilai.

      • Dalam contoh kita:
        x 1 (\gaya tampilan x_(1))- = 5 - 10,5 = -5,5
        x 2 (\gaya tampilan x_(2))- = 5 - 10,5 = -5,5
        x 3 (\gaya tampilan x_(3))- = 8 - 10,5 = -2,5
        x 4 (\gaya tampilan x_(4))- = 12 - 10,5 = 1,5
        x 5 (\gaya tampilan x_(5))- = 15 - 10,5 = 4,5
        x 6 (\gaya tampilan x_(6))- = 18 - 10,5 = 7,5
    5. Kuadratkan setiap hasil yang diperoleh. Nilai selisihnya akan positif dan negatif; Jika nilai-nilai tersebut diplot pada garis bilangan, maka nilai-nilai tersebut akan terletak di kanan dan kiri mean populasi. Ini tidak baik untuk menghitung varians karena bilangan positif dan negatif saling meniadakan. Jadi kuadratkan setiap selisih untuk mendapatkan bilangan positif saja.

      • Dalam contoh kita:
        (x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2)) untuk setiap nilai populasi (dari i = 1 sampai i = 6):
        (-5,5)2 (\gaya tampilan ^(2)) = 30,25
        (-5,5)2 (\gaya tampilan ^(2)), Di mana x n (\gaya tampilan x_(n))– nilai terakhir dalam populasi.
      • Untuk menghitung nilai rata-rata dari hasil yang diperoleh, Anda perlu mencari jumlahnya dan membaginya dengan n:(( x 1 (\gaya tampilan x_(1)) - μ) 2 (\gaya tampilan ^(2)) + (x 2 (\gaya tampilan x_(2)) - μ) 2 (\gaya tampilan ^(2)) + ... + (x n (\gaya tampilan x_(n)) - μ) 2 (\gaya tampilan ^(2)))/N
      • Sekarang mari kita tuliskan penjelasan di atas dengan menggunakan variabel: (∑( x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2))) / n dan dapatkan rumus untuk menghitung varians populasi.