Ev · ev aletleri · Rastgele bir değişkenin dağılım formülü. Varyans ve standart sapma

Rastgele bir değişkenin dağılım formülü. Varyans ve standart sapma

Rastgele bir değişkenin dağılımı, bu değişkenin değerlerinin dağılımının bir ölçüsüdür. Küçük varyans, değerlerin birbirine yakın kümelenmesi anlamına gelir. Büyük bir varyans, güçlü bir değer dağılımını gösterir. Rastgele bir değişkenin dağılımı kavramı istatistikte kullanılır. Örneğin, iki niceliğin değerlerinin varyansını karşılaştırırsanız (kadın ve erkek hastaların gözlem sonuçları gibi), bazı değişkenlerin anlamlılığını test edebilirsiniz. Varyans, istatistiksel modeller oluştururken de kullanılır, çünkü küçük varyans, değerleri fazla uydurduğunuzun bir işareti olabilir.

Adımlar

Örnek Varyans Hesaplaması

  1. Örnek değerleri kaydedin.Çoğu durumda, istatistikçiler için yalnızca belirli popülasyonların örnekleri mevcuttur. Örneğin, kural olarak, istatistikçiler Rusya'daki tüm arabaların nüfusunu korumanın maliyetini analiz etmezler - birkaç bin arabanın rastgele bir örneğini analiz ederler. Böyle bir örnek, araba başına ortalama maliyetin belirlenmesine yardımcı olacaktır, ancak büyük olasılıkla, ortaya çıkan değer gerçek değerden uzak olacaktır.

    • Örneğin bir kafede 6 günde satılan çörek sayısını rastgele sırayla inceleyelim. Örnek şu şekildedir: 17, 15, 23, 7, 9, 13. Bu bir nüfus değil, bir örnektir, çünkü kafenin açık olduğu her gün için satılan çörekler hakkında verimiz yoktur.
    • Size bir değer örneği değil de bir popülasyon verilirse, bir sonraki bölüme geçin.
  2. Örnek varyansı hesaplamak için formülü yazın. Dağılım, bazı miktarların değerlerinin yayılmasının bir ölçüsüdür. Dağılım değeri sıfıra ne kadar yakınsa, değerler o kadar birbirine yakın gruplanır. Bir değer örneğiyle çalışırken, varyansı hesaplamak için aşağıdaki formülü kullanın:

    • s 2 (\displaystyle s^(2)) = ∑[(x ben (\displaystyle x_(i))-X) 2 (\görüntü stili ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2)) dağılımdır. Dağılım, kare birimlerle ölçülür.
    • x ben (\displaystyle x_(i))- örnekteki her değer.
    • x ben (\displaystyle x_(i)) x̅'yi çıkarmanız, karesini almanız ve ardından sonuçları eklemeniz gerekir.
    • x̅ – örnek ortalama (örnek ortalama).
    • n, örnekteki değerlerin sayısıdır.
  3. Örnek ortalamayı hesaplayın. x̅ olarak gösterilir. Numune ortalaması, normal aritmetik ortalama gibi hesaplanır: numunedeki tüm değerleri toplayın ve ardından sonucu numunedeki değer sayısına bölün.

    • Örneğimizde örnekteki değerleri toplayın: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Şimdi sonucu örnekteki değer sayısına bölün (bizim örneğimizde 6 vardır): 84 ÷ 6 = 14.
      Örnek ortalama x̅ = 14.
    • Örnek ortalama, örnekteki değerlerin dağıldığı merkezi değerdir. Örnek ortalama etrafındaki örnek kümedeki değerler ise, varyans küçüktür; aksi takdirde, dağılım büyüktür.
  4. Numunedeki her değerden numune ortalamasını çıkarın.Şimdi farkı hesapla x ben (\displaystyle x_(i))- x̅, nerede x ben (\displaystyle x_(i))- örnekteki her değer. Elde edilen her sonuç, belirli bir değerin numune ortalamasından ne ölçüde saptığını, yani bu değerin numune ortalamasından ne kadar uzak olduğunu gösterir.

    • Örneğimizde:
      x 1 (\displaystyle x_(1))- x̅ = 17 - 14 = 3
      x 2 (\görüntü stili x_(2))- x̅ = 15 - 14 = 1
      x 3 (\görüntü stili x_(3))- x̅ = 23 - 14 = 9
      x 4 (\görüntü stili x_(4))- x̅ = 7 - 14 = -7
      x 5 (\görüntü stili x_(5))- x̅ = 9 - 14 = -5
      x 6 (\görüntü stili x_(6))- x̅ = 13 - 14 = -1
    • Elde edilen sonuçların doğruluğunu doğrulamak kolaydır, çünkü toplamlarının sıfıra eşit olması gerekir. Bu, ortalama değerin belirlenmesiyle ilgilidir, çünkü negatif değerler (ortalama değerden daha küçük değerlere olan mesafeler) pozitif değerlerle (ortalama değerden daha büyük değerlere olan mesafeler) tamamen dengelenir.
  5. Yukarıda belirtildiği gibi, farklılıkların toplamı x ben (\displaystyle x_(i))- x̅ sıfıra eşit olmalıdır. Bu, ortalama varyansın her zaman sıfır olduğu anlamına gelir, bu da bir niceliğin değerlerinin yayılması hakkında hiçbir fikir vermez. Bu sorunu çözmek için her bir farkın karesini alın x ben (\displaystyle x_(i))- X. Bu, yalnızca toplandığında asla 0'a ulaşmayacak olan pozitif sayılar elde etmenize neden olacaktır.

    • Örneğimizde:
      (x 1 (\displaystyle x_(1))-X) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))-X) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Farkın karesini buldunuz - x̅) 2 (\görüntü stili ^(2))Örnekteki her değer için.
  6. Kare farkların toplamını hesaplayın. Yani formülün şu şekilde yazılan kısmını bulun: ∑[( x ben (\displaystyle x_(i))-X) 2 (\görüntü stili ^(2))]. Burada Σ işareti, her değer için kare farklarının toplamı anlamına gelir x ben (\displaystyle x_(i))örnekte Kare farkları zaten buldunuz (x ben (\displaystyle (x_(i))-X) 2 (\görüntü stili ^(2)) her değer için x ben (\displaystyle x_(i))örnekte; şimdi sadece bu kareleri ekleyin.

    • Örneğimizde: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Sonucu n - 1'e bölün, burada n, örnekteki değerlerin sayısıdır. Bir süre önce, örneklem varyansını hesaplamak için istatistikçiler sonucu basitçe n'ye bölerdi; bu durumda, belirli bir örneğin varyansını açıklamak için ideal olan varyansın karesinin ortalamasını alırsınız. Ancak, herhangi bir örneğin genel değerler popülasyonunun yalnızca küçük bir parçası olduğunu unutmayın. Farklı bir numune alıp aynı hesaplamaları yaparsanız farklı bir sonuç elde edersiniz. Görünen o ki, n - 1'e bölmek (yalnızca n'den ziyade), nüfus varyansının daha iyi bir tahminini veriyor, peşinde olduğunuz şey de bu. n - 1'e bölmek olağan hale geldi, bu nedenle örneklem varyansının hesaplanması için formüle dahil edildi.

    • Örneğimizde, örnek 6 değer içerir, yani n = 6.
      Örnek varyans = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Varyans ve standart sapma arasındaki fark. Formülün bir üs içerdiğine dikkat edin, bu nedenle varyans, analiz edilen değerin kare birimlerinde ölçülür. Bazen böyle bir değeri çalıştırmak oldukça zordur; bu gibi durumlarda, varyansın kareköküne eşit olan standart sapma kullanılır. Bu nedenle örneklem varyansı şu şekilde gösterilir: s 2 (\displaystyle s^(2)) ve örnek standart sapması olarak s (\displaystyles).

    • Örneğimizde, numune standart sapması: s = √33,2 = 5,76.

    Nüfus varyansı hesaplaması

    1. Bazı değer kümelerini analiz edin. Set, dikkate alınan miktarın tüm değerlerini içerir. Örneğin, Leningrad bölgesi sakinlerinin yaşını inceliyorsanız, nüfus bu bölgenin tüm sakinlerinin yaşını içerir. Bir agrega ile çalışma durumunda, bir tablo oluşturulması ve agrega değerlerinin içine girilmesi önerilir. Aşağıdaki örneği göz önünde bulundurun:

      • Belirli bir odada 6 adet akvaryum bulunmaktadır. Her akvaryum aşağıdaki sayıda balık içerir:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Popülasyon varyansını hesaplamak için formülü yazın. Popülasyon belirli bir miktarın tüm değerlerini içerdiğinden, aşağıdaki formül popülasyonun varyansının tam değerini elde etmenizi sağlar. Nüfus varyansını (yalnızca bir tahmin olan) örneklem varyansından ayırt etmek için istatistikçiler çeşitli değişkenler kullanır:

      • σ 2 (\görüntü stili ^(2)) = (∑(x ben (\displaystyle x_(i)) - μ) 2 (\görüntü stili ^(2))) / N
      • σ 2 (\görüntü stili ^(2))- nüfus varyansı ("sigma kare" olarak okunur). Dağılım, kare birimlerle ölçülür.
      • x ben (\displaystyle x_(i))- toplamdaki her bir değer.
      • Σ toplamın işaretidir. Yani her bir değer için x ben (\displaystyle x_(i))μ çıkarın, karesini alın ve ardından sonuçları ekleyin.
      • μ popülasyon ortalamasıdır.
      • n, genel popülasyondaki değerlerin sayısıdır.
    3. Nüfus ortalamasını hesaplayın. Genel popülasyonla çalışırken, ortalama değeri μ (mu) olarak gösterilir. Popülasyon ortalaması, olağan aritmetik ortalama olarak hesaplanır: popülasyondaki tüm değerleri toplayın ve ardından sonucu popülasyondaki değer sayısına bölün.

      • Ortalamaların her zaman aritmetik ortalama olarak hesaplanmadığını unutmayın.
      • Örneğimizde, popülasyon şu anlama gelir: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Popülasyondaki her bir değerden popülasyon ortalamasını çıkarın. Fark değeri sıfıra ne kadar yakınsa, özel değer popülasyon ortalamasına o kadar yakındır. Popülasyondaki her bir değer ile ortalaması arasındaki farkı bulun ve değerlerin dağılımına ilk kez bakın.

      • Örneğimizde:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\görüntü stili x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\görüntü stili x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\görüntü stili x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\görüntü stili x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\görüntü stili x_(6))- μ = 18 - 10,5 = 7,5
    5. Elde ettiğiniz her sonucun karesini alın. Fark değerleri hem pozitif hem de negatif olacaktır; bu değerleri bir sayı doğrusuna koyarsanız, o zaman popülasyonun sağına ve soluna yalan söyleyeceklerdir. Pozitif ve negatif sayılar birbirini götürdüğü için bu, varyansı hesaplamak için iyi değildir. Bu nedenle, yalnızca pozitif sayılar elde etmek için her bir farkın karesini alın.

      • Örneğimizde:
        (x ben (\displaystyle x_(i)) - μ) 2 (\görüntü stili ^(2)) her popülasyon değeri için (i = 1'den i = 6'ya):
        (-5,5)2 (\görüntü stili ^(2)) = 30,25
        (-5,5)2 (\görüntü stili ^(2)), Nerede x n (\displaystyle x_(n)) popülasyondaki son değerdir.
      • Elde edilen sonuçların ortalama değerini hesaplamak için toplamlarını bulmanız ve n'ye bölmeniz gerekir: (( x 1 (\displaystyle x_(1)) - μ) 2 (\görüntü stili ^(2)) + (x 2 (\görüntü stili x_(2)) - μ) 2 (\görüntü stili ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\görüntü stili ^(2))) / N
      • Şimdi yukarıdaki açıklamayı değişkenleri kullanarak yazalım: (∑( x ben (\displaystyle x_(i)) - μ) 2 (\görüntü stili ^(2))) / n ve popülasyon varyansını hesaplamak için bir formül elde edin.

Varyasyon aralığı (veya varyasyon aralığı) -özelliğin maksimum ve minimum değerleri arasındaki farktır:

Örneğimizde, işçilerin vardiya çıktılarındaki değişim aralığı şu şekildedir: birinci ekipte R=105-95=10 çocuk, ikinci ekipte R=125-75=50 çocuk. (5 kat daha fazla). Bu, 1. tugayın çıktısının daha "istikrarlı" olduğunu, ancak ikinci tugayın çıktıyı artırmak için daha fazla rezerve sahip olduğunu gösteriyor çünkü. tüm işçiler bu tugay için maksimum çıktıya ulaşırsa 3 * 125 = 375 parça üretebilir ve 1. tugayda sadece 105 * 3 = 315 parça üretebilir.
Özniteliğin aşırı değerleri popülasyon için tipik değilse, çeyrek veya ondalık aralıklar kullanılır. Çeyrek aralığı RQ= Q3-Q1 popülasyonun %50'sini, birinci ondalık aralığı RD1 = D9-D1 verilerin %80'ini, ikinci ondalık aralığı RD2= D8-D2 ise %60'ını kapsar.
Varyasyon aralığı göstergesinin dezavantajı, ancak değerinin özelliğin tüm dalgalanmalarını yansıtmamasıdır.
Bir özelliğin tüm dalgalanmalarını yansıtan en basit genelleme göstergesi ortalama doğrusal sapma bireysel seçeneklerin ortalama değerlerinden mutlak sapmalarının aritmetik ortalamasıdır:

,
gruplandırılmış veriler için
,
burada хi, ayrı bir serideki özelliğin değeri veya aralık dağılımındaki aralığın ortasıdır.
Yukarıdaki formüllerde paydaki farklar modulo alınır, aksi takdirde aritmetik ortalamanın özelliğine göre pay her zaman sıfıra eşit olacaktır. Bu nedenle, istatistiksel uygulamada ortalama doğrusal sapma nadiren kullanılır, yalnızca göstergeleri hesaba katmadan göstergeleri toplamanın ekonomik açıdan mantıklı olduğu durumlarda. Yardımı ile örneğin çalışanların bileşimi, üretimin karlılığı ve dış ticaret cirosu analiz edilir.
Özellik farkı varyantın ortalama değerinden sapmalarının ortalama karesidir:
basit varyans
,
ağırlıklı varyans
.
Varyansı hesaplama formülü basitleştirilebilir:

Böylece varyans, varyantın karelerinin ortalaması ile popülasyon varyantının ortalamasının karesi arasındaki farka eşittir:
.
Bununla birlikte, sapmaların karelerinin toplamı nedeniyle, varyans sapmalar hakkında çarpık bir fikir verir, bu nedenle ortalama ondan hesaplanır. standart sapma, özelliğin belirli varyantlarının ortalama değerlerinden ortalama olarak ne kadar saptığını gösterir. Varyansın karekökü alınarak hesaplanır:
gruplandırılmamış veriler için
,
varyasyon serisi için

Varyans ve standart sapmanın değeri ne kadar küçükse, popülasyon o kadar homojen, ortalama değer o kadar güvenilir (tipik) olacaktır.
Ortalama doğrusal ve ortalama kare sapma, sayılar olarak adlandırılır, yani, özelliğin ölçüm birimlerinde ifade edilirler, içerik olarak aynıdırlar ve değer olarak yakındırlar.
Mutlak değişim göstergelerinin tabloları kullanarak hesaplanması önerilir.
Tablo 3 - Varyasyon özelliklerinin hesaplanması (çalışma ekiplerinin vardiya çıktısına ilişkin veri periyodu örneğinde)


Çalışan sayısı

Aralığın ortası

Tahmini değerler

Toplam:

İşçilerin ortalama vardiya çıktısı:

Ortalama doğrusal sapma:

Çıkış dağılımı:

Bireysel işçilerin çıktısının ortalama çıktıdan standart sapması:
.

1 Moment yöntemiyle dağılımın hesaplanması

Varyansların hesaplanması zahmetli hesaplamalarla ilişkilidir (özellikle ortalama, birkaç ondalık basamaklı büyük bir sayı olarak ifade ediliyorsa). Basitleştirilmiş bir formül ve dağılım özellikleri kullanılarak hesaplamalar basitleştirilebilir.
Dispersiyon aşağıdaki özelliklere sahiptir:

  1. özelliğin tüm değerleri aynı A değeri kadar azaltılır veya artırılırsa, varyans bundan azalmaz:

,

, o zaman veya
Varyansın özelliklerini kullanarak ve önce popülasyonun tüm değişkenlerini A değerine indirgeyip sonra h aralığının değerine bölerek, eşit aralıklarla varyasyon serilerindeki varyansı hesaplamak için bir formül elde ederiz. anların yolu:
,
moment yöntemiyle hesaplanan dağılım nerede;
h, varyasyon serisinin aralığının değeridir;
– yeni (dönüştürülmüş) varyant değerleri;
A, en yüksek frekansa sahip aralığın ortası olarak kullanılan sabit bir değerdir; veya en yüksek frekansa sahip varyant;
birinci dereceden anın karesidir;
ikinci dereceden bir andır.
Çalışma ekibinin vardiya çıktısındaki verilere göre momentler yöntemiyle varyansı hesaplayalım.
Tablo 4 - Momentler yöntemiyle dağılımın hesaplanması


Üretim işçisi grupları, adet.

Çalışan sayısı

Aralığın ortası

Tahmini değerler

Hesaplama prosedürü:


  1. varyansı hesapla:

2 Alternatif bir özelliğin varyansının hesaplanması

İstatistik tarafından incelenen işaretler arasında, birbirini dışlayan yalnızca iki anlama sahip olanlar vardır. Bunlar alternatif işaretlerdir. Sırasıyla iki nicel değer verilir: 1. seçenek ve 0. Seçenek 1'in p ile gösterilen frekansı, bu özelliğe sahip birimlerin oranıdır. 1-p=q farkı, 0 seçeneğinin frekansıdır. Böylece,


xi

Alternatif özelliğin aritmetik ortalaması
, çünkü p+q=1.

Özellik farkı
, Çünkü 1-p=q
Böylece, alternatif bir özelliğin varyansı, bu özelliğe sahip olan birimlerin oranı ile bu özelliğe sahip olmayan birimlerin oranının ürününe eşittir.
1 ve 0 değerleri eşit sıklıkta ise, yani p=q, varyans maksimum pq=0,25'e ulaşır.
Varyans değişkeni, örneğin ürün kalitesi gibi örnek araştırmalarda kullanılır.

3 Gruplar arası dağılım. Varyans toplama kuralı

Dağılım, varyasyonun diğer özelliklerinden farklı olarak, ek bir niceliktir. Yani faktör kriterine göre gruplara ayrılan agregada X , sonuç varyansı y her grup içindeki varyans (grup içi) ve gruplar arasındaki varyans (gruplar arası) olarak ayrıştırılabilir. Daha sonra, bir bütün olarak popülasyondaki özelliğin varyasyonunun incelenmesiyle birlikte, her gruptaki ve bu gruplar arasındaki varyasyonu incelemek mümkün hale gelir.

Toplam varyans bir özelliğin varyasyonunu ölçer de Bu varyasyona (sapmalara) neden olan tüm faktörlerin etkisi altında tüm popülasyon üzerinde. Özelliğin bireysel değerlerinin sapmalarının ortalama karesine eşittir de genel ortalamanın ve basit veya ağırlıklı varyans olarak hesaplanabilir.
Gruplar arası varyans etkili özelliğin varyasyonunu karakterize eder de, işaret faktörünün etkisinden kaynaklanır X gruplandırmanın temelini oluşturur. Grup araçlarının varyasyonunu karakterize eder ve grup araçlarının toplam ortalamadan sapmalarının ortalama karesine eşittir:
,
i'inci grubun aritmetik ortalaması nerede;
– i. gruptaki birimlerin sayısı (i. grubun sıklığı);
nüfusun toplam ortalamasıdır.
grup içi varyans rasgele varyasyonu yansıtır, yani, varyasyonun açıklanmayan faktörlerin etkisinin neden olduğu ve gruplamanın altında yatan nitelik faktörüne bağlı olmayan kısmı. Bireysel değerlerin grup ortalamalarına göre değişimini karakterize eder, özelliğin bireysel değerlerinin sapmalarının ortalama karesine eşittir. de bir grup içinde, bu grubun aritmetik ortalamasından (grup ortalaması) alınır ve her grup için basit veya ağırlıklı varyans olarak hesaplanır:
veya ,
gruptaki birimlerin sayısı nerede.
Her grup için grup içi varyanslara dayanarak, belirlemek mümkündür grup içi varyansların genel ortalaması:
.
Üç varyans arasındaki ilişki denir varyans toplama kuralları, buna göre toplam varyans, gruplar arası varyansın toplamına ve grup içi varyansların ortalamasına eşittir:

Örnek. İşçilerin tarife kategorisinin (yeterlilik) emeklerinin verimlilik düzeyi üzerindeki etkisini incelerken, aşağıdaki veriler elde edildi.
Tablo 5 - İşçilerin ortalama saatlik çıktıya göre dağılımı.



p/n

4. kategorideki işçiler

5. kategorideki işçiler

Egzersiz yapmak
işçi, adet,

Egzersiz yapmak
işçi, adet,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

Bu örnekte, işçiler faktöre göre iki gruba ayrılmıştır. X- derecelerine göre karakterize edilen nitelikler. Etkili özellik - üretim - hem etkisi (gruplar arası varyasyon) hem de diğer rastgele faktörler (grup içi varyasyon) nedeniyle değişir. Zorluk, bu varyasyonları üç varyans kullanarak ölçmektir: toplam, gruplar arası ve grup içi. Ampirik belirleme katsayısı, ortaya çıkan özelliğin varyasyonunun oranını gösterir. de faktör işaretinin etkisi altında X. Toplam varyasyonun geri kalanı de diğer faktörlerdeki değişikliklerden kaynaklanır.
Örnekte ampirik belirleme katsayısı şu şekildedir:
veya %66,7,
Bu, işçilerin işgücü verimliliğindeki değişimin %66,7'sinin nitelik farklılıklarından, %33,3'ünün ise diğer faktörlerin etkisinden kaynaklandığı anlamına gelir.
Ampirik korelasyon ilişkisi gruplandırma ve etkili özellikler arasındaki ilişkinin sıkılığını gösterir. Ampirik belirleme katsayısının karekökü olarak hesaplanır:

Ampirik korelasyon oranı , yanı sıra 0 ile 1 arasında değerler alabilir.
Bağlantı yoksa, o zaman =0. Bu durumda =0 yani grup ortalamaları birbirine eşittir ve gruplar arası değişim yoktur. Bu, gruplama işareti - faktörünün genel varyasyonun oluşumunu etkilemediği anlamına gelir.
İlişki fonksiyonel ise, o zaman = 1. Bu durumda, grup ortalamalarının varyansı toplam varyansa () eşittir, yani grup içi varyasyon yoktur. Bu, gruplandırma özelliğinin, incelenmekte olan sonuçtaki özelliğin varyasyonunu tamamen belirlediği anlamına gelir.
Korelasyon ilişkisinin değeri bire ne kadar yakınsa, özellikler arasındaki ilişki işlevsel bağımlılığa o kadar yakındır.
İşaretler arasındaki bağlantının yakınlığının niteliksel bir değerlendirmesi için Chaddock ilişkileri kullanılır.

örnekte Bu, işçilerin üretkenliği ile nitelikleri arasında yakın bir ilişki olduğunu gösterir.

Matematiksel beklenti ve varyans, rastgele bir değişkenin en sık kullanılan sayısal özellikleridir. Dağılımın en önemli özelliklerini karakterize ederler: konumu ve dağılım derecesi. Birçok uygulama probleminde, rastgele bir değişkenin tam ve kapsamlı bir tanımı - dağılım yasası - ya hiç elde edilemez ya da hiç gerekli değildir. Bu durumlarda, sayısal özellikler kullanılarak rastgele bir değişkenin yaklaşık bir tanımıyla sınırlıdırlar.

Matematiksel beklenti genellikle rastgele bir değişkenin ortalama değeri olarak adlandırılır. Rastgele bir değişkenin dağılımı, bir rasgele değişkenin matematiksel beklentisi etrafında dağılması olan dağılımın bir özelliğidir.

Ayrık bir rasgele değişkenin matematiksel beklentisi

Önce ayrı bir rasgele değişkenin dağılımının mekanik yorumundan yola çıkarak matematiksel beklenti kavramına yaklaşalım. Birim kütlenin x ekseninin noktaları arasında dağıtılmasına izin verin X1 , X 2 , ..., X N ve her malzeme noktasının kendisine karşılık gelen bir kütlesi vardır. P1 , P 2 , ..., P N. Kütlelerini dikkate alarak tüm malzeme noktaları sisteminin konumunu karakterize eden x ekseni üzerinde bir nokta seçmek gerekir. Maddi noktalar sisteminin kütle merkezini böyle bir nokta olarak almak doğaldır. Bu, rastgele değişkenin ağırlıklı ortalamasıdır X, her noktanın apsisi XBen karşılık gelen olasılığa eşit bir "ağırlık" ile girer. Bu şekilde elde edilen rastgele değişkenin ortalama değeri X matematiksel beklentisi olarak adlandırılır.

Ayrık bir rasgele değişkenin matematiksel beklentisi, tüm olası değerlerinin ve bu değerlerin olasılıklarının çarpımlarının toplamıdır:

örnek 1 Kazan-kazan çekilişi düzenlendi. 400'ü her biri 10 ruble olan 1000 kazanç var. Her biri 300 - 20 ruble Her biri 200 - 100 ruble. ve her biri 100-200 ruble. Bir bilet alan bir kişinin ortalama kazancı nedir?

Çözüm. 10*400 + 20*300 + 100*200 + 200*100 = 50.000 ruble'ye eşit olan toplam kazanç miktarı 1000'e (toplam kazanç miktarı) bölünürse ortalama kazancı bulacağız. Sonra 50000/1000 = 50 ruble alırız. Ancak ortalama kazancı hesaplama ifadesi aşağıdaki biçimde de gösterilebilir:

Öte yandan bu koşullar altında kazanç miktarı 10, 20, 100 ve 200 ruble değerlerini alabilen rastgele bir değişkendir. sırasıyla 0.4'e eşit olasılıklarla; 0,3; 0,2; 0.1. Bu nedenle, beklenen ortalama getiri, getirilerin boyutunun ve bunları alma olasılığının çarpımlarının toplamına eşittir.

Örnek 2 Yayıncı yeni bir kitap yayınlamaya karar verdi. Kitabı 280 rubleye satacak, bunun 200'ü kendisine, 50'si kitapçıya ve 30'u yazara verilecek. Tablo, bir kitabı yayınlamanın maliyeti ve kitabın belirli sayıda kopyasını satma olasılığı hakkında bilgi verir.

Yayıncının beklenen kârını bulun.

Çözüm. Rastgele değişken "kar", satıştan elde edilen gelir ile maliyetlerin maliyeti arasındaki farka eşittir. Örneğin, bir kitabın 500 kopyası satılırsa, satıştan elde edilen gelir 200 * 500 = 100.000 ve basım maliyeti 225.000 ruble olur. Böylece yayıncı 125.000 ruble zararla karşı karşıya kalır. Aşağıdaki tablo, rasgele değişkenin beklenen değerlerini özetlemektedir - kâr:

SayıKâr XBen olasılık PBen XBen P Ben
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Toplam: 1,00 25000

Böylece, yayıncının karının matematiksel beklentisini elde ederiz:

.

Örnek 3 Tek atışla vurma şansı P= 0.2 5'e eşit isabet sayısının matematiksel beklentisini sağlayan mermilerin tüketimini belirleyin.

Çözüm. Şimdiye kadar kullandığımız aynı beklenti formülünden, X- mermi tüketimi:

.

Örnek 4 Rastgele bir değişkenin matematiksel beklentisini belirleme X her atışta isabet olasılığı varsa, üç atışla yapılan vuruş sayısı P = 0,4 .

İpucu: rastgele bir değişkenin değerlerinin olasılığını şu şekilde bulun: Bernoulli formülü .

Beklenti Özellikleri

Matematiksel beklentinin özelliklerini göz önünde bulundurun.

Mülk 1. Sabit bir değerin matematiksel beklentisi şu sabite eşittir:

Mülk 2. Sabit çarpan, beklenti işaretinden çıkarılabilir:

Mülk 3. Rastgele değişkenlerin toplamının (farkının) matematiksel beklentisi, matematiksel beklentilerinin toplamına (farkına) eşittir:

Mülk 4. Rastgele değişkenlerin ürününün matematiksel beklentisi, matematiksel beklentilerinin ürününe eşittir:

Mülk 5. Rastgele değişkenin tüm değerleri ise X aynı sayı kadar azaltmak (arttırmak) İLE, o zaman matematiksel beklentisi aynı sayı kadar azalacaktır (artacaktır):

Sadece matematiksel beklenti ile sınırlı kalamayacağınız zaman

Çoğu durumda, yalnızca matematiksel beklenti bir rasgele değişkeni yeterince karakterize edemez.

Rastgele değişkenlere izin ver X Ve Y aşağıdaki dağıtım kanunları tarafından verilmektedir:

Anlam X olasılık
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Anlam Y olasılık
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Bu niceliklerin matematiksel beklentileri aynıdır - sıfıra eşittir:

Ancak dağılımları farklıdır. rastgele değer X yalnızca matematiksel beklentiden biraz farklı olan değerleri alabilir ve rastgele değişken Y matematiksel beklentiden önemli ölçüde sapan değerler alabilir. Benzer bir örnek: ortalama ücret, yüksek ve düşük ücretli çalışanların oranını yargılamayı mümkün kılmaz. Başka bir deyişle, matematiksel beklentiyle, en azından ortalama olarak, ondan hangi sapmaların mümkün olduğu yargılanamaz. Bunu yapmak için rastgele bir değişkenin varyansını bulmanız gerekir.

Ayrı bir rasgele değişkenin dağılımı

dağılım Ayrık rassal değişken X matematiksel beklentiden sapmasının karesinin matematiksel beklentisi olarak adlandırılır:

Rastgele bir değişkenin standart sapması X varyansının karekökünün aritmetik değeridir:

.

Örnek 5 Rastgele değişkenlerin varyanslarını ve standart sapmalarını hesaplayın X Ve Y, dağıtım yasaları yukarıdaki tablolarda verilmiştir.

Çözüm. Rastgele değişkenlerin matematiksel beklentileri X Ve Y, yukarıda bulunduğu gibi, sıfıra eşittir. Dispersiyon formülüne göre E(X)=E(y)=0 elde ederiz:

Daha sonra rastgele değişkenlerin standart sapmaları X Ve Y oluşturmak

.

Böylece, aynı matematiksel beklentilerle, rastgele değişkenin varyansı Xçok küçük ve rastgele Y- önemli. Bu, dağılımlarındaki farklılığın bir sonucudur.

Örnek 6 Yatırımcının 4 adet alternatif yatırım projesi bulunmaktadır. Tablo, bu projelerde beklenen karla ilgili verileri karşılık gelen olasılıkla özetlemektedir.

1. ProjeProje 2Proje 3Proje 4
500, P=1 1000, P=0,5 500, P=0,5 500, P=0,5
0, P=0,5 1000, P=0,25 10500, P=0,25
0, P=0,25 9500, P=0,25

Her alternatif için matematiksel beklenti, varyans ve standart sapmayı bulun.

Çözüm. 3. alternatif için bu miktarların nasıl hesaplandığını gösterelim:

Tablo, tüm alternatifler için bulunan değerleri özetlemektedir.

Tüm alternatifler aynı matematiksel beklentiye sahiptir. Bu, uzun vadede herkesin aynı gelire sahip olduğu anlamına gelir. Standart sapma, bir risk ölçüsü olarak yorumlanabilir - ne kadar büyükse, yatırımın riski de o kadar büyük olur. Fazla risk istemeyen bir yatırımcı, en küçük standart sapmaya (0) sahip olduğu için proje 1'i seçecektir. Yatırımcı kısa vadede riski ve yüksek getiriyi tercih ediyorsa, standart sapması en büyük olan projeyi seçecektir - proje 4.

Dispersiyon Özellikleri

Dispersiyonun özelliklerini sunalım.

Mülk 1. Sabit bir değerin dağılımı sıfırdır:

Mülk 2. Sabit faktör, karesi alınarak dağılım işaretinden çıkarılabilir:

.

Mülk 3. Rastgele bir değişkenin varyansı, bu değerin karesinin matematiksel beklentisine eşittir ve değerin kendisinin matematiksel beklentisinin karesi çıkarılır:

,

Nerede .

Mülk 4. Rastgele değişkenlerin toplamının (farkı) varyansı, varyanslarının toplamına (farkına) eşittir:

Örnek 7 Ayrık bir rasgele değişken olduğu bilinmektedir. X sadece iki değer alır: -3 ve 7. Ek olarak, matematiksel beklenti bilinmektedir: E(X) = 4 . Ayrık bir rastgele değişkenin varyansını bulun.

Çözüm. ile göster P rastgele bir değişkenin bir değer alma olasılığı X1 = −3 . O zaman değerin olasılığı X2 = 7 1 olacak - P. Matematiksel beklenti için denklemi türetelim:

E(X) = X 1 P + X 2 (1 − P) = −3P + 7(1 − P) = 4 ,

olasılıkları nereden alırız: P= 0,3 ve 1 - P = 0,7 .

Rastgele bir değişkenin dağılım yasası:

X −3 7
P 0,3 0,7

Bu rastgele değişkenin varyansını, varyansın 3. özelliğindeki formülü kullanarak hesaplıyoruz:

D(X) = 2,7 + 34,3 − 16 = 21 .

Rastgele bir değişkenin matematiksel beklentisini kendiniz bulun ve ardından çözümü görün

Örnek 8 Ayrık rassal değişken X sadece iki değer alır. 0.4 olasılıkla 3'ün büyük değerini alır. Ayrıca rastgele değişkenin varyansı da bilinmektedir. D(X) = 6 Rastgele bir değişkenin matematiksel beklentisini bulun.

Örnek 9 Bir vazoda 6 beyaz ve 4 siyah top vardır. Torbadan 3 top çekiliyor. Çekilen toplar arasındaki beyaz topların sayısı ayrı bir rasgele değişkendir. X. Bu rastgele değişkenin matematiksel beklentisini ve varyansını bulun.

Çözüm. rastgele değer X 0, 1, 2, 3 değerlerini alabilir. Karşılık gelen olasılıklar şu şekilde hesaplanabilir: olasılıkların çarpımı kuralı. Rastgele bir değişkenin dağılım yasası:

X 0 1 2 3
P 1/30 3/10 1/2 1/6

Dolayısıyla bu rastgele değişkenin matematiksel beklentisi:

M(X) = 3/10 + 1 + 1/2 = 1,8 .

Belirli bir rasgele değişkenin varyansı:

D(X) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Sürekli bir rastgele değişkenin matematiksel beklentisi ve dağılımı

Sürekli bir rasgele değişken için, matematiksel beklentinin mekanik yorumu aynı anlamı koruyacaktır: yoğunluğa sahip x ekseni üzerinde sürekli olarak dağıtılan birim kütle için kütle merkezi F(X). İşlev bağımsız değişkeninin kendisi için geçerli olduğu ayrı bir rasgele değişkenin aksine XBen aniden değişir, sürekli bir rasgele değişken için bağımsız değişken sürekli olarak değişir. Ancak sürekli bir rasgele değişkenin matematiksel beklentisi, ortalama değeriyle de ilişkilidir.

Sürekli bir rasgele değişkenin matematiksel beklentisini ve varyansını bulmak için belirli integralleri bulmanız gerekir. . Sürekli bir rastgele değişkenin yoğunluk fonksiyonu verilirse, doğrudan integrale girer. Bir olasılık dağılım fonksiyonu verilmişse, o zaman bunun türevini alarak yoğunluk fonksiyonunu bulmanız gerekir.

Sürekli bir rastgele değişkenin tüm olası değerlerinin aritmetik ortalamasına onun adı verilir. matematiksel beklenti veya ile gösterilir.

İstatistikteki değişimin ana genelleştirici göstergeleri, dağılım ve standart sapmadır.

Dağılım o aritmetik ortalama toplam ortalamadan her özellik değerinin kare sapmaları. Varyans genellikle sapmaların ortalama karesi olarak adlandırılır ve  2 ile gösterilir. İlk verilere bağlı olarak varyans, basit veya ağırlıklı aritmetik ortalamadan hesaplanabilir:

 ağırlıklandırılmamış (basit) dağılım;

 ağırlıklı varyans.

Standart sapma mutlak boyutların genelleştirici bir özelliğidir varyasyonlar toplamda özellik. İşaretle aynı birimlerde ifade edilir (metre, ton, yüzde, hektar vb. cinsinden).

Standart sapma, varyansın kareköküdür ve  ile gösterilir:

 ağırlıklandırılmamış standart sapma;

 ağırlıklı standart sapma.

Standart sapma, ortalamanın güvenilirliğinin bir ölçüsüdür. Standart sapma ne kadar küçük olursa, aritmetik ortalama temsil edilen popülasyonun tamamını o kadar iyi yansıtır.

Standart sapmanın hesaplanmasından önce varyansın hesaplanması gelir.

Ağırlıklı varyansı hesaplama prosedürü aşağıdaki gibidir:

1) aritmetik ağırlıklı ortalamayı belirleyin:

2) seçeneklerin ortalamadan sapmalarını hesaplayın:

3) her seçeneğin ortalamadan sapmasının karesini alın:

4) kareli sapmaları ağırlıklarla (frekanslar) çarpın:

5) alınan çalışmaları özetleyin:

6) elde edilen miktar, ağırlıkların toplamına bölünür:

Örnek 2.1

Aritmetik ağırlıklı ortalamayı hesaplayın:

Ortalamadan sapmaların değerleri ve kareleri tabloda sunulmuştur. Varyansı tanımlayalım:

Standart sapma şuna eşit olacaktır:

Kaynak veriler bir aralık olarak sunulursa dağıtım serisi , o zaman önce özelliğin ayrık değerini belirlemeniz ve ardından açıklanan yöntemi uygulamanız gerekir.

Örnek 2.2

Kollektif çiftliğin ekilen alanının buğday verimine göre dağılımına ilişkin veriler üzerindeki aralık serisi için varyansın hesaplanmasını gösterelim.

Aritmetik ortalama:

Varyansı hesaplayalım:

6.3. Bireysel veriler için formüle göre dağılımın hesaplanması

hesaplama tekniği dağılım karmaşık ve büyük seçenekler ve frekanslar için hantal olabilir. Hesaplamalar, dağılım özellikleri kullanılarak basitleştirilebilir.

Dispersiyon aşağıdaki özelliklere sahiptir.

1. Değişken bir özelliğin ağırlıklarının (frekanslarının) belirli sayıda azalması veya artması dağılımı değiştirmez.

2. Her özellik değerini aynı sabit değer kadar azaltma veya artırma A dağılım değişmez.

3. Her özellik değerini belirli sayıda azaltma veya artırma k sırasıyla varyansı azaltır veya artırır k 2 kez standart sapma  içinde k bir kere.

4. Bir özelliğin rastgele bir değere göre varyansı, her zaman aritmetik ortalamaya göre ortalama ve rastgele değerler arasındaki farkın karesi oranındaki varyanstan daha büyüktür:

Eğer A 0, sonra aşağıdaki eşitliğe ulaşırız:

yani bir özelliğin varyansı, özellik değerlerinin ortalama karesi ile ortalamanın karesi arasındaki farka eşittir.

Varyans hesaplanırken her özellik tek başına veya diğerleriyle birlikte kullanılabilir.

Varyansı hesaplama prosedürü basittir:

1) belirlemek aritmetik ortalama :

2) aritmetik ortalamanın karesi:

3) serinin her varyantının sapmasının karesini alın:

X Ben 2 .

4) seçeneklerin karelerinin toplamını bulun:

5) seçeneklerin karelerinin toplamını sayılarına bölün, yani ortalama kareyi belirleyin:

6) özelliğin ortalama karesi ile ortalamanın karesi arasındaki farkı belirleyin:

Örnek 3.1İşçilerin üretkenliği hakkında aşağıdaki verilere sahibiz:

Aşağıdaki hesaplamaları yapalım:

Örnek ankete göre, mevduat sahipleri şehrin Sberbank'ındaki mevduatın büyüklüğüne göre gruplandırıldı:

Tanımlamak:

1) varyasyon aralığı;

2) ortalama depozito miktarı;

3) ortalama doğrusal sapma;

4) dağılım;

5) standart sapma;

6) katkıların değişim katsayısı.

Çözüm:

Bu dağıtım serisi açık aralıklar içerir. Bu tür serilerde, birinci grubun aralığının değerinin geleneksel olarak bir sonrakinin aralığının değerine eşit olduğu ve son grubun aralığının değerinin bir öncekinin aralığının değerine eşit olduğu varsayılır.

İkinci grubun aralık değeri 200, dolayısıyla birinci grubun değeri de 200'dür. Sondan bir önceki grubun aralık değeri 200'dür, bu da son aralığın da 200'e eşit bir değere sahip olacağı anlamına gelir.

1) Varyasyon aralığını, özelliğin en büyük ve en küçük değeri arasındaki fark olarak tanımlayın:

Katkının büyüklüğündeki değişiklik aralığı 1000 ruble.

2) Katkı payının ortalama büyüklüğü, aritmetik ağırlıklı ortalama formülü ile belirlenir.

Her aralıktaki özniteliğin ayrık değerini önceden belirleyelim. Bunu yapmak için basit aritmetik ortalama formülünü kullanarak aralıkların orta noktalarını buluruz.

İlk aralığın ortalama değeri şuna eşit olacaktır:

ikinci - 500, vb.

Hesaplamaların sonuçlarını tabloya koyalım:

Depozito miktarı, ovmak.Katkıda bulunanların sayısı, fAralığın ortası, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Toplam 400 - 312000

Şehrin Sberbank'ındaki ortalama depozito 780 ruble olacak:

3) Ortalama doğrusal sapma, özelliğin bireysel değerlerinin toplam ortalamadan mutlak sapmalarının aritmetik ortalamasıdır:

Aralık dağılım serilerindeki ortalama doğrusal sapmayı hesaplama prosedürü aşağıdaki gibidir:

1. Aritmetik ağırlıklı ortalama, 2. paragrafta gösterildiği gibi hesaplanır.

2. Değişkenin ortalamadan mutlak sapmaları belirlenir:

3. Elde edilen sapmalar frekanslarla çarpılır:

4. Ağırlıklı sapmaların toplamı, işaret dikkate alınmadan bulunur:

5. Ağırlıklı sapmaların toplamı, frekansların toplamına bölünür:

Hesaplanan veriler tablosunu kullanmak uygundur:

Depozito miktarı, ovmak.Katkıda bulunanların sayısı, fAralığın ortası, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Toplam 400 - - - 81280

Sberbank müşterilerinin mevduat boyutunun ortalama doğrusal sapması 203,2 ruble.

4) Dağılım, her özellik değerinin aritmetik ortalamadan sapmalarının karelerinin aritmetik ortalamasıdır.

Aralık dağılım serisindeki varyansın hesaplanması aşağıdaki formüle göre yapılır:

Bu durumda varyansı hesaplama prosedürü aşağıdaki gibidir:

1. Paragraf 2'de gösterildiği gibi aritmetik ağırlıklı ortalamayı belirleyin).

2. Ortalamadan sapmaları bulun:

3. Her seçeneğin ortalamadan sapmasının karesini almak:

4. Kareli sapmaları ağırlıklarla (frekanslar) çarpın:

5. Alınan çalışmaları özetleyin:

6. Ortaya çıkan miktar, ağırlıkların (frekansların) toplamına bölünür:

Hesaplamaları bir tabloya koyalım:

Depozito miktarı, ovmak.Katkıda bulunanların sayısı, fAralığın ortası, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Toplam 400 - - - 23040000