Ev · Ölçümler · İstatistiksel anlamlılık düzeyi. İstatistiksel anlamlılık ve istatistiksel kriter kavramları

İstatistiksel anlamlılık düzeyi. İstatistiksel anlamlılık ve istatistiksel kriter kavramları

Hipotezler istatistiksel analiz kullanılarak test edilir. İstatistiksel anlamlılık, bazı ifadelerin (boş hipotez) doğru olduğu varsayılarak belirli bir olayın olasılığına karşılık gelen P değeri kullanılarak bulunur. P değeri belirli bir istatistiksel anlamlılık seviyesinden (genellikle 0,05) düşükse, deneyci güvenli bir şekilde sıfır hipotezinin yanlış olduğu sonucuna varabilir ve alternatif hipotezi değerlendirmeye devam edebilir. Öğrenci t testini kullanarak P değerini hesaplayabilir ve iki veri kümesinin önemini belirleyebilirsiniz.

Adımlar

Bölüm 1

Denemeyi ayarlama

    Hipotezinizi tanımlayın.İstatistiksel anlamlılığı değerlendirmenin ilk adımı, cevaplamak istediğiniz soruyu seçmek ve bir hipotez formüle etmektir. Hipotez deneysel veriler, bunların dağılımı ve özellikleri hakkında yapılan bir açıklamadır. Herhangi bir deney için hem boş hem de alternatif bir hipotez vardır. Genel olarak konuşursak, benzer mi yoksa farklı mı olduklarını belirlemek için iki veri kümesini karşılaştırmanız gerekecektir.

    • Sıfır hipotezi (H 0) tipik olarak iki veri kümesi arasında hiçbir fark olmadığını belirtir. Örneğin: materyali dersten önce okuyan öğrenciler daha yüksek notlar alamazlar.
    • Alternatif hipotez (Ha), sıfır hipotezinin tersidir ve deneysel verilerle desteklenmesi gereken bir ifadedir. Örneğin: materyali dersten önce okuyan öğrenciler daha yüksek notlar alırlar.
  1. Önemli bir sonuç olarak değerlendirilmesi için veri dağılımının normalden ne kadar farklı olması gerektiğini belirlemek üzere anlamlılık düzeyini ayarlayın. Önem düzeyi (aynı zamanda α (\displaystyle \alpha )-level), istatistiksel anlamlılık için tanımladığınız eşiktir. P değeri anlamlılık seviyesinden küçük veya ona eşitse veriler istatistiksel olarak anlamlı kabul edilir.

    • Kural olarak anlamlılık düzeyi (değer α (\displaystyle \alpha )) 0,05'e eşit alınır ve bu durumda aralarında rastgele bir fark tespit etme olasılığı farklı setler veriler sadece %5'tir.
    • Anlamlılık düzeyi ne kadar yüksek olursa (ve buna bağlı olarak P değeri ne kadar düşük olursa), sonuçlar o kadar güvenilir olur.
    • Daha güvenilir sonuçlar istiyorsanız P değerini 0,01'e düşürün. Kural olarak daha fazla düşük P değerleriÜrünlerdeki kusurların tanımlanması gerektiğinde üretimde kullanılır. Bu durumda tüm parçaların beklendiği gibi çalıştığından emin olmak için yüksek güvenilirlik gerekir.
    • Çoğu hipotez deneyi için 0,05 anlamlılık düzeyi yeterlidir.
  2. Hangi kriteri kullanacağınıza karar verin: tek taraflı veya iki taraflı. Öğrenci t testindeki varsayımlardan biri verilerin normal dağıldığıdır. Normal dağılım, maksimum sonuç sayısının eğrinin ortasında olduğu çan şeklinde bir eğridir. Öğrenci t testi, verilerin normal dağılımın (daha fazla, daha az veya eğrinin "kuyruklarında" olup olmadığını) belirlemenize olanak tanıyan matematiksel bir veri test etme yöntemidir.

    • Verilerin kontrol grubu değerlerinin üstünde mi yoksa altında mı olduğundan emin değilseniz iki kuyruklu bir test kullanın. Bu, her iki yönde de önemi belirlemenizi sağlayacaktır.
    • Verilerin hangi yönde normal dağılımın dışına çıkabileceğini biliyorsanız tek kuyruklu testi kullanın. Yukarıdaki örnekte öğrencilerin notlarının artmasını bekliyoruz, dolayısıyla tek kuyruklu bir test kullanılabilir.
  3. İstatistiksel gücü kullanarak örnek boyutunu belirleyin. Bir çalışmanın istatistiksel gücü, örneklem büyüklüğü göz önüne alındığında beklenen sonucun elde edilme olasılığıdır. Ortak bir güç eşiği (veya β) %80'dir. İstatistiksel gücü önceden herhangi bir veri olmadan analiz etmek zor olabilir çünkü her veri grubunda beklenen ortalamalar ve bunların standart sapmaları hakkında bazı bilgiler gerektirir. Verileriniz için en uygun örnek boyutunu belirlemek için çevrimiçi bir güç analizi hesaplayıcısı kullanın.

    • Tipik olarak araştırmacılar, istatistiksel güç analizi için veri sağlayan ve daha büyük, daha eksiksiz bir çalışma için gereken örnek boyutunu belirleyen küçük bir pilot çalışma yürütürler.
    • Bir pilot çalışma yürütemiyorsanız, literatüre ve diğer kişilerin sonuçlarına dayanarak olası ortalamaları tahmin etmeye çalışın. Bu, optimum örnek boyutunu belirlemenize yardımcı olabilir.

    Bölüm 2

    Hesaplamak standart sapma
    1. Standart sapmanın formülünü yazın. Standart sapma verilerde ne kadar yayılım olduğunu gösterir. Belirli bir örnekten elde edilen verilerin ne kadar yakın olduğu sonucuna varmanızı sağlar. İlk bakışta formül oldukça karmaşık görünebilir ancak aşağıdaki açıklamalar bunu anlamanıza yardımcı olacaktır. Formül var sonraki görünüm: s = √∑((x ben – µ) 2 /(N – 1)).

      • s - standart sapma;
      • ∑ işareti örnekten elde edilen tüm verilerin eklenmesi gerektiğini belirtir;
      • x i, i'inci değere, yani elde edilen ayrı bir sonuca karşılık gelir;
      • µ belirli bir grup için ortalama değerdir;
      • N, örnekteki toplam veri sayısıdır.
    2. Her grubun ortalamasını bulun. Standart sapmayı hesaplamak için öncelikle her çalışma grubunun ortalamasını bulmanız gerekir. Ortalama değer gösterilir Yunan harfi u (mu). Ortalamayı bulmak için, ortaya çıkan tüm değerleri toplayın ve bunları veri miktarına (örneklem boyutuna) bölün.

      • Örneğin, dersten önce ders çalışan bir grup öğrencinin ortalama notunu bulmak için küçük bir veri kümesini düşünün. Basit olması açısından beş noktadan oluşan bir set kullanıyoruz: 90, 91, 85, 83 ve 94.
      • Tüm değerleri toplayalım: 90 + 91 + 85 + 83 + 94 = 443.
      • Toplamı değer sayısına bölelim, N = 5: 443/5 = 88,6.
      • Böylece bu grubun ortalaması 88,6'dır.
    3. Elde edilen her değeri ortalamadan çıkarın. Bir sonraki adım farkı (x i – µ) hesaplamaktır. Bunu yapmak için bulunanlardan çıkarın ortalama boyut alınan her değer. Örneğimizde beş fark bulmamız gerekiyor:

      • (90 – 88,6), (91 – 88,6), (85 – 88,6), (83 – 88,6) ve (94 – 88,6).
      • Sonuç olarak şu değerleri elde ediyoruz: 1,4, 2,4, -3,6, -5,6 ve 5,4.
    4. Elde edilen her değerin karesini alın ve bunları toplayın. Az önce bulunan miktarların her birinin karesi alınmalıdır. Bu adımda herkes kaybolacak negatif değerler. Bu adımdan sonra hala sahipseniz negatif sayılar, bu onların karesini almayı unuttuğunuz anlamına gelir.

      • Örneğimizde 1,96, 5,76, 12,96, 31,36 ve 29,16 elde ediyoruz.
      • Ortaya çıkan değerleri topluyoruz: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Örneklem büyüklüğü eksi 1'e bölün. Formülde genel popülasyonu dikkate almadığımız ve değerlendirme için tüm öğrencilerden bir örnek aldığımız için toplam N - 1'e bölünüyor.

      • Çıkarma: N – 1 = 5 – 1 = 4
      • Böl: 81,2/4 = 20,3
    6. Kaldırmak Kare kök. Toplamı örneklem büyüklüğü eksi bire böldükten sonra bulunan değerin karekökünü alın. Bu son adım standart sapmanın hesaplanmasında. İlk verileri girdikten sonra gerekli tüm hesaplamaları gerçekleştiren istatistiksel programlar vardır.

      • Örneğimizde materyali dersten önce okuyan öğrencilerin notlarının standart sapması s =√20,3 = 4,51'dir.

      Bölüm 3

      Önemini belirleyin
      1. İki veri grubu arasındaki varyansı hesaplayın. Bu adımdan önce sadece bir grup veriye yönelik bir örneğe baktık. İki grubu karşılaştırmak istiyorsanız elbette her iki gruptan da veri almalısınız. İkinci veri grubu için standart sapmayı hesaplayın ve ardından iki deney grubu arasındaki varyansı bulun. Varyans aşağıdaki formül kullanılarak hesaplanır: s d = √((s 1 /N 1) + (s 2 /N 2)).

Görev 3. Beş okul öncesi çocuğa bir test uygulanır. Her bir görevi çözmek için harcanan süre kaydedilir. İlk üç test maddesini çözme süreleri arasında istatistiksel olarak anlamlı farklar bulunacak mı?

Konu sayısı

Referans malzemesi

Bu ödev varyans analizi teorisine dayanmaktadır. Genel olarak varyans analizinin görevi, deneyin sonucu üzerinde önemli etkisi olan faktörleri belirlemektir. İkiden fazla örnek varsa, birkaç örneğin ortalamalarını karşılaştırmak için varyans analizi kullanılabilir. Bu amaçla tek yönlü varyans analizi kullanılmaktadır.

Atanan görevleri çözmek için aşağıdakiler kabul edilir. Faktörlerin etkisi durumunda optimizasyon parametresinin elde edilen değerlerinin varyansları, faktörlerin etkisinin yokluğunda sonuçların varyanslarından farklıysa, böyle bir faktörün önemli olduğu kabul edilir.

Problemin formülasyonundan da anlaşılacağı üzere burada doğrulama yöntemleri kullanılmıştır. istatistiksel hipotezler yani iki deneysel varyansın test edilmesi görevi. Bu nedenle varyans analizi, varyansların Fisher testi kullanılarak test edilmesine dayanmaktadır. Bu görevde, altı okul öncesi çocuğun her birinin ilk üç test görevini çözme süreleri arasındaki farkların istatistiksel olarak anlamlı olup olmadığını kontrol etmek gerekir.

Sıfır (ana) hipoteze ileri sürülen hipotez H o denir. E'nin özü, karşılaştırılan parametreler arasındaki farkın sıfır olduğu (dolayısıyla hipotezin adı - sıfır) ve gözlemlenen farklılıkların rastgele olduğu varsayımına dayanır.

Rakip (alternatif) bir hipoteze H1 adı verilir ve bu, sıfır hipoteziyle çelişir.

Çözüm:

Varyans analizi yöntemini α = 0,05 anlamlılık düzeyinde kullanarak, altı okul öncesi çocuk için ilk üç test görevini çözme süreleri arasında istatistiksel olarak anlamlı farkların varlığına ilişkin sıfır hipotezini (H o) test edeceğiz.

Üç test görevinin her birini çözmek için ortalama süreyi bulacağımız görev koşulları tablosuna bakalım.

Konu sayısı

Faktör seviyeleri

İlk test görevini çözme süresi (saniye cinsinden).

İkinci test görevini çözme süresi (saniye cinsinden).

Üçüncü test görevini çözme süresi (saniye cinsinden).

Grup ortalaması

Genel ortalamayı bulma:

Her testteki zaman farklılıklarının önemini hesaba katmak için, toplam örneklem varyansı iki parçaya bölünür; bunlardan ilki faktöriyel, ikincisi ise artık olarak adlandırılır.

Formülü kullanarak genel ortalamadan sapmaların karelerinin toplamını hesaplayalım.

veya burada p, test görevlerini çözmek için yapılan zaman ölçümlerinin sayısıdır, q, teste girenlerin sayısıdır. Bunu yapmak için karelerden oluşan bir tablo oluşturalım

Konu sayısı

Faktör seviyeleri

İlk test görevini çözme süresi (saniye cinsinden).

İkinci test görevini çözme süresi (saniye cinsinden).

Üçüncü test görevini çözme süresi (saniye cinsinden).

FCC'nin hesaplama uygulamalarında istatistiksel güvenilirlik esastır. Daha önce aynı popülasyondan birden fazla numunenin seçilebileceği belirtilmişti:

Doğru seçilirlerse, ortalama göstergeleri ve genel nüfusun göstergeleri, kabul edilen güvenilirlik dikkate alınarak temsil edilebilirlik hatasının büyüklüğü açısından birbirinden biraz farklıdır;

Farklı popülasyonlardan seçilirlerse aralarındaki fark anlamlı olur. İstatistik tamamen örnekleri karşılaştırmakla ilgilidir;

Eğer bunlar önemsiz, prensip dışı, önemsiz derecede farklılık gösteriyorsa, yani aslında aynı genel popülasyona aitlerse, aralarındaki farka istatistiksel olarak güvenilmez denir.

İstatistiksel olarak güvenilir Örnek farkı, önemli ölçüde ve temel olarak farklılık gösteren, yani farklı genel popülasyonlara ait olan bir örnektir.

FCC'de örnek farklılıkların istatistiksel öneminin değerlendirilmesi, bir dizi çözümün çözülmesi anlamına gelir. pratik problemler. Örneğin, yeni öğretim yöntemlerinin, programların, alıştırma setlerinin, testlerin, kontrol alıştırmalarının tanıtılması, deneysel testleriyle ilişkilidir; bu, test grubunun temelde kontrol grubundan farklı olduğunu göstermelidir. Bu nedenle, numuneler arasında istatistiksel olarak anlamlı bir farkın varlığının veya yokluğunun tespit edilmesi için istatistiksel anlamlılık kriterleri adı verilen özel istatistiksel yöntemler kullanılır.

Tüm kriterler iki gruba ayrılır: parametrik ve parametrik olmayan. Parametrik kriterler normal dağılım yasasının varlığını gerektirir; Bu, normal yasanın ana göstergelerinin - aritmetik ortalama ve standart sapma - zorunlu olarak belirlenmesi anlamına gelir. Parametrik kriterler en doğru ve doğrudur. Parametrik olmayan testler, örnek öğeler arasındaki sıra (sıra) farklılıklarına dayanır.

FCC uygulamasında istatistiksel anlamlılık için kullanılan ana kriterler şunlardır: Öğrenci testi ve Fisher testi.

Öğrenci t testi Adını bu yöntemi keşfeden İngiliz bilim adamı K. Gosset'ten (Öğrenci - takma ad) almıştır. Öğrenci t testi parametriktir ve karşılaştırma amacıyla kullanılır mutlak göstergelerörnekler. Numunelerin boyutları farklılık gösterebilir.

Öğrenci t testi bu şekilde tanımlanır.

1. Aşağıdaki formülü kullanarak Öğrenci t testini bulun:


karşılaştırılan örneklerin aritmetik ortalamaları nerede; t 1, t 2 - karşılaştırılan örneklerin göstergelerine göre belirlenen temsiliyet hataları.

2. FCC'deki uygulama, spor çalışmaları için P = 0,95 hesabının güvenilirliğini kabul etmenin yeterli olduğunu göstermiştir.

Sayma güvenilirliği için: P = 0,95 (a = 0,05), serbestlik derecesi sayısıyla birlikte

k = n 1 + n 2 - 2 Ek 4'teki tabloyu kullanarak kriterin sınır değerinin değerini buluyoruz ( t gr).

3. Normal dağılım yasasının özelliklerine dayanarak Öğrenci kriteri t ve t gr'yi karşılaştırır.

Sonuç çıkarıyoruz:

t t gr ise, karşılaştırılan örnekler arasındaki fark istatistiksel olarak anlamlıdır;

t t gr ise fark istatistiksel olarak anlamsızdır.

FCS alanındaki araştırmacılar için istatistiksel anlamlılığın değerlendirilmesi, belirli bir problemin çözümünde ilk adımdır: karşılaştırılan numunelerin birbirlerinden temel olarak mı yoksa temelden farklı mı olduğu. Bir sonraki adım, bu farklılığın, görevin koşulları tarafından belirlenen pedagojik açıdan değerlendirilmesidir.

Belirli bir örnek kullanarak Öğrenci testinin uygulanmasını ele alalım.

Örnek 2.14. 18 kişiden oluşan bir grup, xi'den önce ve sonra kalp atış hızı (bpm) açısından değerlendirildi sen benısınmak.

Isınmanın etkinliğini kalp atış hızına göre değerlendirin. İlk veriler ve hesaplamalar tabloda sunulmaktadır. 2.30 ve 2.31.

Tablo 2.30

Isınmadan önce kalp atış hızı göstergelerinin işlenmesi


Örneklem büyüklükleri eşit olduğundan (aynı grup aynı grupta çalışılıyor) her iki grup için de hatalar çakıştı farklı koşullar) ve ortalama Standart sapmaşuna ulaştı: s x = s y = 3 atım/dakika. Öğrenci testini tanımlamaya geçelim:

Hesabın güvenilirliğini belirledik: P = 0,95.

Serbestlik derecesi sayısı k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. Ek 4'teki tablodan şunu buluyoruz: t gr= 2,02.

İstatiksel sonuç. t = 11,62 ve sınır t gr = 2,02 olduğuna göre 11,62 > 2,02, yani. t > t gr olduğundan örnekler arasındaki fark istatistiksel olarak anlamlıdır.

Pedagojik sonuç. Kalp atım hızı açısından grubun ısınma öncesi ve sonrası durumu arasındaki farkın istatistiksel olarak anlamlı olduğu bulundu. önemli, temel. Dolayısıyla kalp atış hızı göstergesine dayanarak ısınmanın etkili olduğu sonucuna varabiliriz.

Fisher kriteri parametriktir. Numune dağılım oranlarını karşılaştırırken kullanılır. Bu genellikle spor performansının stabilitesi veya fonksiyonel ve fonksiyonel stabilite açısından bir karşılaştırma anlamına gelir. teknik göstergeler uygulamada fiziksel Kültür ve spor. Numuneler farklı boyutlarda olabilir.

Fisher kriteri aşağıdaki sırayla tanımlanır.

1. Formülü kullanarak Fisher kriteri F'yi bulun


burada , karşılaştırılan örneklerin varyanslarıdır.

Fisher kriterinin koşulları, formülün payında şunu şart koşar: F büyük bir dağılım var, yani F sayısı her zaman birden büyüktür.

Hesaplamanın güvenilirliğini belirledik: P = 0,95 - ve her iki örnek için serbestlik derecesi sayısını belirledik: k 1 = n 1 - 1, k 2 = n 2 - 1.

Ek 4'teki tablodan şunu buluyoruz: sınır değeri F kriteri gr.

F ve F kriterlerinin karşılaştırılması gr sonuçları formüle etmemizi sağlar:

F > F gr ise numuneler arasındaki fark istatistiksel olarak anlamlıdır;

eğer F< F гр, то различие между выборками статически недо­стоверно.

Spesifik bir örnek verelim.

Örnek 2.15. İki grup hentbol oyuncusunu analiz edelim: x ben (n 1= 16 kişi) ve y i (n 2 = 18 kişi). Bu sporcu gruplarına, topu kaleye atarken kalkış süreleri incelendi.

İtme göstergeleri aynı türden mi?

İlk veriler ve temel hesaplamalar tabloda sunulmaktadır. 2.32 ve 2.33.

Tablo 2.32

Birinci grup hentbol oyuncularının itme göstergelerinin işlenmesi


Fisher kriterini tanımlayalım:





Ek 6'daki tabloda sunulan verilere göre Fgr: Fgr = 2,4'ü buluyoruz.

Ek 6'daki tabloda, hem büyük hem de küçük dağılımların serbestlik derecesi sayılarının sıralamasının, büyük sayılara yaklaştıkça kabalaştığına dikkat edelim. Böylece, daha büyük dağılımın serbestlik derecesi sayısı şu sırayla gelir: 8, 9, 10, 11, 12, 14, 16, 20, 24, vb. ve daha küçük olan - 28, 29, 30, 40 , 50 vb. d.

Bu durum örneklem büyüklüğü arttıkça F-testindeki farklılıkların azalması ve orijinal verilere yakın tablo değerlerinin kullanılmasının mümkün olmasıyla açıklanmaktadır. Yani örnek 2.15 =17 yoktur ve buna en yakın değeri k = 16 alabiliriz ve buradan Fgr = 2.4 elde ederiz.

İstatiksel sonuç. Fisher testi F= 2,5 > F= 2,4 olduğundan örnekler istatistiksel olarak ayırt edilebilir.

Pedagojik sonuç. Her iki gruptaki hentbolcular için topu kaleye atarken kalkış süresi (süreleri) değerleri önemli ölçüde farklılık göstermektedir. Bu gruplar farklı değerlendirilmelidir.

Daha fazla araştırma bu farklılığın sebebinin ne olduğunu göstermek gerekir.

Örnek 2.20.(numunenin istatistiksel güvenilirliği hakkında ). Antrenmanın başında sinyalin verilmesinden topa vurmaya kadar geçen süre (ler) x i ve sonunda y i ise futbolcunun nitelikleri gelişmiş midir?

İlk veriler ve temel hesaplamalar tabloda verilmiştir. 2.40 ve 2.41.

Tablo 2.40

Antrenman başında sinyal vermekten topa vurmaya kadar geçen süre göstergelerinin işlenmesi


Öğrenci kriterini kullanarak gösterge grupları arasındaki farkı belirleyelim:

Güvenilirlik P = 0,95 ve serbestlik derecesi k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42 ile Ek 4'teki tabloyu kullanarak şunu buluruz: t gr= 2,02. t = 8,3 olduğundan > t gr= 2,02 - fark istatistiksel olarak anlamlıdır.

Fisher kriterini kullanarak gösterge grupları arasındaki farkı belirleyelim:


Ek 2'deki tabloya göre güvenilirlik P = 0,95 ve serbestlik derecesi k = 22-1 = 21 ile F gr = 21 değeri olur. F = 1,53 olduğundan< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

İstatiksel sonuç. Aritmetik ortalamaya göre gösterge grupları arasındaki fark istatistiksel olarak anlamlıdır. Dağılım (dağılım) açısından gösterge grupları arasındaki fark istatistiksel olarak güvenilmezdir.

Pedagojik sonuç. Futbolcunun nitelikleri önemli ölçüde gelişti ancak ifadesinin istikrarına dikkat edilmesi gerekiyor.

İşe hazırlanma

Bundan önce laboratuvar işi"Spor Metrolojisi" disiplininde Çalışma grubundaki tüm öğrenciler 3-4 kişilik çalışma takımları oluşturmalıdır., tüm laboratuvar çalışmalarının iş atamasını ortaklaşa tamamlamak.

İşe hazırlanırken Önerilen literatürün ilgili bölümlerini okuyun (bkz. veri bölümünün 6. bölümü) metodolojik talimatlar) ve ders notları. Bu laboratuvar çalışması için bölüm 1 ve 2'yi ve bunun için iş atamasını (bölüm 4) inceleyin.

Rapor formu hazırlayın Açık standart sayfalar A4 formatında kağıt yazma ve iş için gerekli malzemeleri içine koyma.

Raporun içermesi gerekenler :

Baş sayfa Bölümü (UC ve TR), çalışma grubunu, öğrencinin soyadını, adını, soyadını, laboratuvar çalışmasının sayısını ve unvanını, tamamlanma tarihini, ayrıca soyadını, akademik derecesini, akademik unvanını ve pozisyonunu belirten işi kabul eden öğretmen;

Çalışmanın amacı;

Formüller Sayısal değerler hesaplamaların ara ve nihai sonuçlarının açıklanması;

Ölçülen ve hesaplanan değerlerin tabloları;

Ödevin gerektirdiği grafik materyali;

İş atamasının her aşamasının sonuçları ve genel olarak yapılan çalışma hakkında kısa sonuçlar.

Tüm grafikler ve tablolar çizim araçları kullanılarak dikkatlice çizilir. Koşullu grafik ve harf atamaları GOST standartlarına uygun olmalıdır. Bilgisayar teknolojisi kullanılarak rapor hazırlanmasına izin verilmektedir.

İş ataması

Tüm ölçümleri gerçekleştirmeden önce takımın her üyesi, Ek 7'de verilen Dart spor oyununun aşağıdaki araştırma aşamalarını gerçekleştirmek için gerekli olan kullanım kurallarını incelemelidir.

Araştırmanın I. Aşaması“Dart sporu oyununda takımın her bir üyesinin hedefi vurma sonuçlarının normal dağılım kanununa uygunluk açısından kriterlerine göre incelenmesi χ2 Pearson ve üç sigma kriteri"

1. (Kişisel) hızınızı ve eylemlerin koordinasyonunu ölçün (test edin), Dart spor oyununda dairesel bir hedefe 30-40 kez dart atılarak yapılır.

2. Ölçüm sonuçları (testler) x ben(bardaklarda) bir varyasyon serisi şeklinde formüle edin ve tablo 4.1'e (sütunlar, tümünü tamamlayın) girin gerekli hesaplamalar, gerekli tabloları doldurun ve elde edilen ampirik dağılımın normal dağılım yasasına uygunluğuna ilişkin uygun sonuçları, bu kılavuzun 7-10. sayfalarındaki 2. bölümünde verilen örnek 2.12'deki benzer hesaplamalar, tablolar ve sonuçlara benzeterek çıkarın.

Tablo 4.1

Deneklerin eylemlerinin hızı ve koordinasyonunun normal dağılım yasasına uygunluğu

HAYIR. yuvarlak
Toplam

II – araştırma aşaması

“Bir takımın üyelerinin ölçüm sonuçlarına dayanarak, çalışma grubunun tüm öğrencilerinin Dart spor oyununun hedefindeki genel isabet popülasyonunun ortalama göstergelerinin değerlendirilmesi”

İlk aşamada elde edilen tüm ekip üyelerinin Dart hedefine ulaşma sonuçlarına dayanarak, çalışma grubundaki tüm öğrencilerin ortalama hız ve eylem koordinasyon göstergelerini (sınıf dergisindeki çalışma grubu listesine göre) değerlendirin. Bu laboratuvar çalışmasının araştırması.

1. Hız ölçümlerinin sonuçlarını ve eylemlerin koordinasyonunu belgeleyin Spor oyununda dairesel bir hedefe dart atarken Genel popülasyondan alınan ölçüm sonuçlarının bir örneğini temsil eden takımınızın tüm üyelerinin (2 - 4 kişi) dartları (bir çalışma grubundaki tüm öğrencilerin ölçüm sonuçları - örneğin, 15 kişi), bunları ikinci ve üçüncü sütunlara girerek Tablo 4.2.

Tablo 4.2

Hız göstergelerinin işlenmesi ve eylemlerin koordinasyonu

tugay üyeleri

HAYIR.
Toplam

Aşağıdaki tablo 4.2'de anlaşılmalıdır , eşleşen ortalama puan (Tablo 4.1'deki hesaplama sonuçlarına bakın) ekibinizin üyeleri ( , araştırmanın ilk aşamasında elde edilmiştir. Bu not alınmalı, genellikle, Tablo 4.2, araştırmanın ilk aşamasında ekibin bir üyesi tarafından elde edilen ölçüm sonuçlarının hesaplanan ortalama değerini içermektedir. Çünkü farklı ekip üyelerinin ölçüm sonuçlarının çakışma olasılığı çok düşüktür. Daha sonra, Kural olarak, değerler sütunda Tablo 4.2 her satır için - 1'e eşit, A “Toplam "sütunlar" " yazılır ekibinizin üye sayısı.

2. Tablo 4.2'yi doldurmak için gerekli tüm hesaplamaları ve ayrıca bu belgenin 2. bölümünde verilen örnek 2.13'teki hesaplamalara ve sonuçlara benzer diğer hesaplamaları ve sonuçları gerçekleştirin. metodolojik gelişim 13-14. sayfalarda. Temsil edilebilirlik hatası hesaplanırken dikkate alınmalıdır. "M" örneklem küçük olduğundan (n ve genel popülasyonun element sayısı N biliniyor ve çalışma grubundaki öğrenci sayısına eşit olduğundan) bu metodolojik geliştirmenin 13. sayfasında verilen formül 2.4'ün kullanılması gerekir, çalışma grubunun dergi listesine göre.

III – araştırma aşaması

Isınmanın etkinliğinin, her takım üyesi tarafından Öğrenci t-testi kullanılarak “Eylemlerin hızı ve koordinasyonu” göstergesine göre değerlendirilmesi

Bu laboratuvar çalışmasının araştırmasının ilk aşamasında gerçekleştirilen "Dart" spor oyununun hedefine dart atmak için ısınmanın etkinliğini ekibin her üyesi tarafından "Hız ve Hız" göstergesine göre değerlendirmek. Eylemlerin koordinasyonu", Öğrenci kriterini kullanarak - ampirik dağılım yasasının normal dağılım yasasına istatistiksel güvenilirliği için parametrik bir kriter.

… Toplam

2. farklılıklar ve RMS , ısınma sonuçlarına göre “Hız ve eylemlerin koordinasyonu” göstergesinin ölçüm sonuçları, Tablo 4.3'te verilmiştir, (bu metodolojik geliştirmenin 16. sayfasındaki örnek 2.14'ün tablo 2.30'undan hemen sonra verilen benzer hesaplamalara bakın).

3. Çalışma ekibinin her üyesi Isındıktan sonra (kişisel) hızınızı ve eylemlerin koordinasyonunu ölçün (test edin),

… Toplam

5. Ortalama hesaplamaları gerçekleştirin farklılıklar ve RMS ,Isınma sonrası “Hız ve eylemlerin koordinasyonu” göstergesinin ölçüm sonuçları, Tablo 4.4'te verilmiştir, Isınma sonuçlarına göre genel ölçüm sonucunu yazın (bu metodolojik geliştirmenin 17. sayfasındaki örnek 2.14'ün tablo 2.31'inden hemen sonra verilen benzer hesaplamalara bakın).

6. Bu metodolojik gelişimin 2. bölümünde 16-17. sayfalarda verilen örnek 2.14'teki hesaplamalara ve sonuçlara benzer tüm gerekli hesaplamaları ve sonuçları gerçekleştirin. Temsil edilebilirlik hatası hesaplanırken dikkate alınmalıdır. "M" Örnek n olduğundan ve popülasyondaki N ( elementlerin sayısı bilinmediğinden, bu metodolojik geliştirmenin 12. sayfasında verilen formül 2.1'in kullanılması gereklidir.

IV – araştırma aşaması

İki ekip üyesinin “Eylemlerin hızı ve koordinasyonu” göstergelerinin tekdüzeliğinin (kararlılığının) Fisher kriteri kullanılarak değerlendirilmesi

Bu laboratuvar çalışmasında araştırmanın üçüncü aşamasında elde edilen ölçüm sonuçlarına dayanarak, iki ekip üyesinin "Eylemlerin hızı ve koordinasyonu" göstergelerinin tekdüzeliğini (kararlılığını) Fisher kriterini kullanarak değerlendirin.

Bunu yapmak için aşağıdakileri yapmanız gerekir.

Tablo 4.3 ve 4.4'teki veriler kullanılarak, araştırmanın üçüncü aşamasında elde edilen bu tablolardan varyansların hesaplanmasının sonuçları ve ayrıca spor göstergelerinin tek biçimliliğini (istikrarlılığını) değerlendirmek için Fisher kriterini hesaplama ve uygulama metodolojisi, Bu metodolojik gelişimin 18-19. sayfalarındaki örnek 2.15'ten uygun istatistiksel ve pedagojik sonuçları çıkarın.

V – araştırma aşaması

Bir takım üyesinin ısınmadan önce ve sonra “Hız ve eylemlerin koordinasyonu” gösterge gruplarının değerlendirilmesi

Bir sonucun istatistiksel anlamlılığı (p-değeri), onun “doğruluğuna” (“örneklemin temsil edilebilirliği” anlamında) olan güvenin tahmini bir ölçüsüdür. Daha teknik konuşursak, p değeri, sonucun güvenilirliğine göre azalan büyüklük sırasına göre değişen bir ölçüdür. Daha yüksek bir p değeri, örnekte bulunan değişkenler arasındaki ilişkide daha düşük bir güven düzeyine karşılık gelir. Spesifik olarak p değeri, gözlemlenen sonucun tüm popülasyona genelleştirilmesiyle ilişkili hata olasılığını temsil eder. Örneğin, 0,05'lik bir p değeri (yani 1/20), numunede bulunan değişkenler arasındaki ilişkinin numunenin yalnızca rastgele bir özelliği olma ihtimalinin %5 olduğunu gösterir. Başka bir deyişle, bir popülasyonda belirli bir ilişki mevcut değilse ve benzer deneyleri birçok kez yaparsanız, o zaman deneyin yaklaşık yirmi tekrarından birinde değişkenler arasında aynı veya daha güçlü bir ilişki olmasını beklersiniz.

Birçok çalışmada hata düzeyi için 0,05'lik bir p değeri "kabul edilebilir marj" olarak kabul edilir.

Hangi önem düzeyinin gerçekten "önemli" olarak kabul edilmesi gerektiğine karar verirken keyfilikten kaçınmanın bir yolu yoktur. Üzerinde sonuçların yanlış olarak reddedildiği belirli bir anlamlılık düzeyinin seçimi oldukça keyfidir. Uygulamada, nihai karar genellikle sonucun önceden mi tahmin edildiğine (yani deney gerçekleştirilmeden önce) veya çeşitli veriler üzerinde yapılan birçok analiz ve karşılaştırmanın bir sonucu olarak sonradan mı keşfedildiğine bağlıdır. çalışma alanının geleneği. Tipik olarak birçok alanda p 0,05 sonucu, istatistiksel anlamlılık açısından kabul edilebilir bir sınırdır, ancak bu düzeyin hala oldukça büyük bir hata oranı (%5) içerdiği unutulmamalıdır. p 0,01 düzeyinde anlamlı olan sonuçlar genellikle istatistiksel olarak anlamlı kabul edilir ve p 0,005 veya p 0,001 düzeyindeki sonuçlar genellikle oldukça anlamlı kabul edilir. Bununla birlikte, bu önem düzeyi sınıflandırmasının oldukça keyfi olduğu ve yalnızca belirli bir araştırma alanındaki pratik deneyime dayanarak kabul edilen resmi olmayan bir anlaşma olduğu anlaşılmalıdır.

Daha önce de belirtildiği gibi, bağımlılığın ve güvenilirliğin büyüklüğü iki şeyi temsil eder: çeşitli özellikler değişkenler arasındaki bağımlılıklar. Ancak tamamen bağımsız oldukları söylenemez. Konuşuyorum ortak dil normal büyüklükteki bir örneklemdeki değişkenler arasındaki bağımlılığın (bağlantının) büyüklüğü ne kadar büyük olursa, o kadar güvenilir olur.

Eğer popülasyonda karşılık gelen değişkenler arasında bir ilişki olmadığını varsayarsak, o zaman incelenen örneklemde de bu değişkenler arasında bir ilişkinin olmayacağını beklemek büyük olasılıkla muhtemeldir. Bu nedenle, bir örnekte ne kadar güçlü bir ilişki bulunursa, ilişkinin alındığı popülasyonda var olmama olasılığı da o kadar az olur.


Örneklem büyüklüğü ilişkinin önemini etkiler. Az sayıda gözlem varsa, o zaman bu değişkenler için buna uygun olarak az sayıda olası değer kombinasyonu vardır ve bu nedenle, güçlü bir ilişki gösteren bir değer kombinasyonunun kazara keşfedilme olasılığı nispeten yüksektir.

İstatistiksel anlamlılık düzeyi nasıl hesaplanır? İki değişken arasındaki bağımlılığın ölçüsünü zaten hesapladığınızı varsayalım (yukarıda açıklandığı gibi). Sonraki soru, önünüzde duruyor: "Bu ilişki ne kadar önemli?" Örneğin, iki değişken arasındaki açıklanan varyansın %40'ı ilişkinin anlamlı olduğunu düşünmek için yeterli midir? Cevap: "Durumlara göre." Yani anlamlılık esas olarak örneklem büyüklüğüne bağlıdır. Daha önce açıklandığı gibi, çok büyük örneklemlerde değişkenler arasındaki çok zayıf ilişkiler bile anlamlı olurken, küçük örneklemlerde çok güçlü ilişkiler bile güvenilir değildir. Bu nedenle, istatistiksel anlamlılık düzeyini belirlemek amacıyla, her örnek boyutu için değişkenler arasındaki ilişkinin "büyüklüğü" ve "anlamlılığı" arasındaki ilişkiyi temsil eden bir fonksiyona ihtiyacınız vardır. Bu işlev size tam olarak "popülasyonda böyle bir bağımlılığın olmadığı varsayılarak, belirli büyüklükteki bir örneklemde belirli bir değere (veya daha fazlasına) bağımlılık elde etmenin ne kadar muhtemel olduğunu" gösterir. Başka bir deyişle, bu fonksiyon anlamlılık düzeyini (p-değeri) ve dolayısıyla belirli bir ilişkinin popülasyonda mevcut olmadığı varsayımının hatalı bir şekilde reddedilme olasılığını verecektir. Bu "alternatif" hipoteze (popülasyonda hiçbir ilişkinin bulunmadığına) genellikle sıfır hipotezi denir. Hata olasılığını hesaplayan fonksiyonun doğrusal olması ve farklı örneklem büyüklükleri için yalnızca farklı eğimlere sahip olması ideal olacaktır. Ne yazık ki bu işlev çok daha karmaşıktır ve her zaman tam olarak aynı değildir. Ancak çoğu durumda biçimi bilinir ve belirli bir büyüklükteki numunelerle yapılan çalışmalarda anlamlılık düzeylerini belirlemek için kullanılabilir. Bu işlevlerin çoğu çok ilgilidir. önemli sınıf dağılımlara normal denir.

İstatistiklerde anlamlılık düzeyi, elde edilen (tahmin edilen) verilerin doğruluğuna ve doğruluğuna olan güvenin derecesini yansıtan önemli bir göstergedir. Konsept çeşitli alanlarda yaygın olarak kullanılmaktadır: sosyolojik araştırma Bilimsel hipotezlerin istatistiksel olarak test edilmesinden önce.

Tanım

İstatistiksel anlamlılık düzeyi (veya istatistiksel olarak anlamlı sonuç), bunun ne kadar muhtemel olduğunu gösterir. tesadüfi olay göstergeleri inceledik. Bir olgunun genel istatistiksel önemi, p değeri katsayısı (p düzeyi) ile ifade edilir. Herhangi bir deney veya gözlemde, elde edilen verilerin örnekleme hatalarından kaynaklanma ihtimali vardır. Bu özellikle sosyoloji için geçerlidir.

Yani, istatistiksel olarak anlamlı bir değer, rastgele oluşma olasılığı son derece küçük olan veya uç noktaya varan bir değerdir. Bu bağlamda en uç nokta, istatistiklerin sıfır hipotezinden (elde edilen örnek verilerle tutarlılığı test edilen bir hipotez) sapma derecesidir. Bilimsel uygulamada anlamlılık düzeyi veri toplamadan önce seçilir ve kural olarak katsayısı 0,05 (%5)'tir. Son derece önemli olduğu sistemler için kesin değerler, bu gösterge 0,01 (%1) veya daha az olabilir.

Arka plan

Anlamlılık düzeyi kavramı, 1925 yılında İngiliz istatistikçi ve genetikçi Ronald Fisher tarafından istatistiksel hipotezleri test etmek için bir teknik geliştirirken tanıtıldı. Herhangi bir süreci analiz ederken, belirli olayların belirli bir olasılığı vardır. "Ölçüm hatası" kavramı kapsamına giren küçük (veya belirgin olmayan) olasılık yüzdeleriyle çalışırken zorluklar ortaya çıkar.

Bilim adamları, onları test edecek kadar spesifik olmayan istatistiksel verilerle çalışırken, küçük miktarlarla çalışmayı "engelleyen" sıfır hipotezi sorunuyla karşı karşıya kalırlar. Fisher, bu tür sistemler için, uygun bir örnekleme kesimi olarak olay olasılığının %5 (0,05) düzeyinde belirlenmesini önerdi ve hesaplamalarda sıfır hipotezinin reddedilmesine olanak tanıdı.

Sabit oranların tanıtılması

1933'te Jerzy bilim adamları Neyman ve Egon Pearson, çalışmalarında önceden (veri toplamadan önce) belirli bir önem düzeyinin belirlenmesini önerdiler. Bu kuralların kullanım örnekleri seçimler sırasında açıkça görülmektedir. Diyelim ki iki aday var, biri çok popüler, diğeri ise az tanınıyor. Seçimi ilk adayın kazanacağı aşikar, ikinci adayın şansı ise sıfıra yakın. Çabalıyorlar - ancak eşit değiller: her zaman mücbir sebep, sansasyonel bilgi olasılığı vardır, beklenmedik kararlar tahmin edilen seçim sonuçlarını değiştirebilir.

Neyman ve Pearson, Fisher'in önem düzeyi olan 0,05'in (α ile gösterilir) en uygun olduğu konusunda hemfikirdi. Ancak Fischer'in kendisi 1956'da bu değerin sabitlenmesine karşı çıktı. α seviyesinin belirli koşullara göre ayarlanması gerektiğine inanıyordu. Örneğin parçacık fiziğinde 0,01'dir.

p düzeyi değeri

P-değeri terimi ilk kez 1960 yılında Brownlee tarafından kullanılmıştır. P-seviyesi (p-değeri) bir göstergedir ters ilişki sonuçların doğruluğu hakkında. En yüksek p değeri katsayısı, değişkenler arasındaki örneklenen ilişkideki en düşük güven düzeyine karşılık gelir.

Bu değer, sonuçların yorumlanmasında hata olasılığını yansıtır. P-seviyesinin = 0,05 (1/20) olduğunu varsayalım. Örnekte bulunan değişkenler arasındaki ilişkinin yalnızca örneklemin rastgele bir özelliği olma olasılığını yüzde beş olarak gösterir. Yani, eğer bu bağımlılık yoksa, tekrarlanan benzer deneylerle ortalama olarak her yirminci çalışmada değişkenler arasında aynı veya daha fazla bağımlılığın beklenmesi mümkündür. P seviyesi genellikle hata oranı için bir "marj" olarak görülür.

Bu arada p değeri değişkenler arasındaki gerçek ilişkiyi yansıtmayabilir, sadece varsayımlar dahilinde belirli bir ortalama değeri gösterir. Özellikle verilerin nihai analizi de bu katsayının seçilen değerlerine bağlı olacaktır. p-seviyesi = 0,05'te bazı sonuçlar olacaktır ve 0,01'e eşit bir katsayıda farklı sonuçlar olacaktır.

İstatistiksel hipotezlerin test edilmesi

Hipotezleri test ederken istatistiksel anlamlılık düzeyi özellikle önemlidir. Örneğin, iki taraflı bir test hesaplanırken, reddetme bölgesi örnekleme dağılımının her iki ucunda (sıfır koordinatına göre) eşit olarak bölünür ve ortaya çıkan verilerin doğruluğu hesaplanır.

Diyelim ki, belirli bir süreci (fenomen) izlerken, yeni istatistiksel bilgilerin önceki değerlere göre küçük değişiklikler gösterdiğinin ortaya çıktığını varsayalım. Aynı zamanda, sonuçlardaki farklılıklar küçüktür, belirgin değildir ancak çalışma için önemlidir. Uzman bir ikilemle karşı karşıyadır: Değişiklikler gerçekten mi oluyor yoksa örnekleme hataları mı (ölçüm yanlışlığı)?

Bu durumda sıfır hipotezini kullanırlar veya reddederler (her şeyi bir hataya bağlarlar veya sistemdeki değişikliği oldu bitti olarak kabul ederler). Problem çözme süreci genel istatistiksel anlamlılığın (p-değeri) ve anlamlılık düzeyinin (α) oranına dayanmaktadır. Eğer p seviyesi< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Kullanılan değerler

Önem düzeyi analiz edilen materyale bağlıdır. Uygulamada aşağıdaki sabit değerler kullanılır:

  • a = 0,1 (veya %10);
  • a = 0,05 (veya %5);
  • a = 0,01 (veya %1);
  • α = 0,001 (veya %0,1).

Hesaplamaların ne kadar doğru olması gerekiyorsa, α katsayısı o kadar düşük kullanılır. Doğal olarak fizik, kimya, ilaç ve genetik alanlarındaki istatistiksel tahminler, siyaset bilimi ve sosyolojidekinden daha fazla doğruluk gerektirir.

Belirli alanlardaki önem eşikleri

Parçacık fiziği ve imalat gibi yüksek hassasiyetli alanlarda, istatistiksel anlamlılık genellikle standart sapmanın (sigma katsayısı - σ ile gösterilir) normal olasılık dağılımına (Gauss dağılımı) oranı olarak ifade edilir. σ, belirli bir miktarın değerlerinin göreli dağılımını belirleyen istatistiksel bir göstergedir matematiksel beklentiler. Olayların olasılığını çizmek için kullanılır.

Bilgi alanına bağlı olarak σ katsayısı büyük ölçüde değişir. Örneğin Higgs bozonunun varlığını tahmin ederken σ parametresi beşe eşit olur (σ = 5), bu da p-değeri = 1/3,5 milyona karşılık gelir. Genom çalışmalarında anlamlılık düzeyi 5 × 10 olabilir - 8, bu alanlar için alışılmadık bir durum değil.

Yeterlik

α ve p-değeri katsayılarının kesin özellikler olmadığı dikkate alınmalıdır. İncelenen olgunun istatistiklerindeki önem düzeyi ne olursa olsun, bu, hipotezin kabul edilmesi için koşulsuz bir temel değildir. Örneğin, daha daha az değerα ise, kurulan hipotezin anlamlı olma şansı o kadar yüksektir. Ancak çalışmanın istatistiksel gücünü (anlamlılığını) azaltan hata riski vardır.

Yalnızca istatistiksel olarak anlamlı sonuçlara odaklanan araştırmacılar hatalı sonuçlara varabilir. Aynı zamanda, varsayımları (aslında α ve p değerleridir) uyguladıkları için çalışmalarını tekrar kontrol etmek zordur. Bu nedenle, istatistiksel anlamlılığın hesaplanmasıyla birlikte her zaman başka bir göstergenin (istatistiksel etkinin büyüklüğü) belirlenmesi önerilir. Etkinin büyüklüğü niceliksel ölçü etki gücü.