rumah · Pengukuran · Tingkat signifikansi statistik. Konsep signifikansi statistik dan kriteria statistik

Tingkat signifikansi statistik. Konsep signifikansi statistik dan kriteria statistik

Hipotesis diuji dengan menggunakan analisis statistik. Signifikansi statistik ditemukan dengan menggunakan nilai P, yang sesuai dengan probabilitas suatu peristiwa tertentu dengan asumsi bahwa beberapa pernyataan (hipotesis nol) benar. Jika nilai P kurang dari tingkat signifikansi statistik yang ditentukan (biasanya 0,05), pelaku eksperimen dapat dengan aman menyimpulkan bahwa hipotesis nol salah dan melanjutkan untuk mempertimbangkan hipotesis alternatif. Dengan menggunakan uji t Student, Anda dapat menghitung nilai P dan menentukan signifikansi untuk dua kumpulan data.

Langkah

Bagian 1

Menyiapkan eksperimen

    Tentukan hipotesis Anda. Langkah pertama dalam menilai signifikansi statistik adalah memilih pertanyaan yang ingin Anda jawab dan merumuskan hipotesis. Hipotesis adalah pernyataan tentang data eksperimen, sebaran dan sifat-sifatnya. Untuk eksperimen apa pun, terdapat hipotesis nol dan hipotesis alternatif. Secara umum, Anda harus membandingkan dua kumpulan data untuk menentukan apakah keduanya serupa atau berbeda.

    • Hipotesis nol (H 0) biasanya menyatakan bahwa tidak ada perbedaan antara dua kumpulan data. Misalnya: siswa yang membaca materi sebelum kelas tidak mendapat nilai lebih tinggi.
    • Hipotesis alternatif (H a) merupakan kebalikan dari hipotesis nol dan merupakan pernyataan yang perlu didukung oleh data eksperimen. Misalnya: siswa yang membaca materi sebelum kelas mendapat nilai lebih tinggi.
  1. Tetapkan tingkat signifikansi untuk menentukan seberapa besar perbedaan distribusi data dari normal agar dapat dianggap sebagai hasil yang signifikan. Tingkat signifikansi (juga disebut α (\gaya tampilan \alfa )-level) adalah ambang batas yang Anda tetapkan untuk signifikansi statistik. Jika nilai P kurang dari atau sama dengan tingkat signifikansi, maka data tersebut dianggap signifikan secara statistik.

    • Sebagai aturan, tingkat signifikansi (nilai α (\gaya tampilan \alfa )) diambil sama dengan 0,05, dan dalam hal ini probabilitas mendeteksi perbedaan acak antara set yang berbeda datanya hanya 5%.
    • Semakin tinggi tingkat signifikansinya (dan semakin rendah nilai P-nya), semakin dapat diandalkan hasilnya.
    • Jika ingin hasil yang lebih dapat diandalkan, turunkan nilai P menjadi 0,01. Biasanya lebih banyak nilai P yang rendah digunakan dalam produksi ketika perlu untuk mengidentifikasi cacat pada produk. Dalam hal ini, keandalan yang tinggi diperlukan untuk memastikan seluruh bagian berfungsi sesuai harapan.
    • Untuk sebagian besar eksperimen hipotesis, tingkat signifikansi 0,05 sudah cukup.
  2. Putuskan kriteria mana yang akan Anda gunakan: satu sisi atau dua sisi. Salah satu asumsi dalam uji t Student adalah data berdistribusi normal. Distribusi normal adalah kurva berbentuk lonceng yang jumlah hasil maksimumnya berada di tengah kurva. Uji-t Student adalah metode matematis untuk menguji data yang memungkinkan Anda menentukan apakah data berada di luar distribusi normal (lebih besar, lebih kecil, atau berada di “ekor” kurva).

    • Jika Anda tidak yakin apakah data berada di atas atau di bawah nilai kelompok kontrol, gunakan uji dua sisi. Ini akan memungkinkan Anda menentukan signifikansi di kedua arah.
    • Jika Anda mengetahui ke arah mana data mungkin berada di luar distribusi normal, gunakan uji satu sisi. Pada contoh di atas, kita mengharapkan nilai siswa meningkat, sehingga tes satu sisi dapat digunakan.
  3. Tentukan ukuran sampel menggunakan kekuatan statistik. Kekuatan statistik suatu penelitian adalah probabilitas bahwa, dengan mempertimbangkan ukuran sampel, hasil yang diharapkan akan diperoleh. Ambang batas daya umum (atau β) adalah 80%. Menganalisis kekuatan statistik tanpa data sebelumnya dapat menjadi tantangan karena memerlukan beberapa informasi tentang rata-rata yang diharapkan dalam setiap kelompok data dan standar deviasinya. Gunakan kalkulator analisis kekuatan online untuk menentukan ukuran sampel optimal untuk data Anda.

    • Biasanya, peneliti melakukan studi percontohan kecil yang menyediakan data untuk analisis kekuatan statistik dan menentukan ukuran sampel yang diperlukan untuk studi yang lebih besar dan lengkap.
    • Jika Anda tidak dapat melakukan studi percontohan, cobalah memperkirakan kemungkinan rata-rata berdasarkan literatur dan hasil orang lain. Ini dapat membantu Anda menentukan ukuran sampel yang optimal.

    Bagian 2

    Menghitung deviasi standar
    1. Tuliskan rumus simpangan baku. Standar deviasi menunjukkan seberapa besar penyebaran data. Hal ini memungkinkan Anda untuk menyimpulkan seberapa dekat data yang diperoleh dari sampel tertentu. Sekilas rumusnya terkesan cukup rumit, namun penjelasan di bawah ini akan membantu Anda memahaminya. Rumusnya punya tampilan selanjutnya: s = √∑((xi – µ) 2 /(N – 1)).

      • s - standar deviasi;
      • tanda ∑ menunjukkan bahwa semua data yang diperoleh dari sampel harus dijumlahkan;
      • x i sesuai dengan nilai ke-i, yaitu hasil terpisah yang diperoleh;
      • µ adalah nilai rata-rata untuk kelompok tertentu;
      • N adalah jumlah total data dalam sampel.
    2. Temukan rata-rata di setiap kelompok. Untuk menghitung simpangan baku, Anda harus terlebih dahulu mencari mean untuk setiap kelompok belajar. Nilai rata-rata ditunjukkan surat Yunaniμ (mu). Untuk mencari rata-rata, cukup jumlahkan semua nilai yang dihasilkan dan bagi dengan jumlah data (ukuran sampel).

      • Misalnya, untuk mencari nilai rata-rata sekelompok siswa yang belajar sebelum kelas dimulai, pertimbangkan kumpulan data kecil. Untuk mempermudah, kami menggunakan himpunan lima titik: 90, 91, 85, 83, dan 94.
      • Mari kita jumlahkan semua nilainya: 90+91+85+83+94=443.
      • Mari kita bagi jumlah tersebut dengan banyaknya nilai, N = 5: 443/5 = 88,6.
      • Jadi, rata-rata kelompok ini adalah 88,6.
    3. Kurangi setiap nilai yang diperoleh dari rata-rata. Langkah selanjutnya adalah menghitung selisihnya (xi – µ). Untuk melakukan ini, kurangi dari yang ditemukan ukuran rata-rata setiap nilai yang diterima. Dalam contoh kita, kita perlu menemukan lima perbedaan:

      • (90 – 88.6), (91 – 88.6), (85 – 88.6), (83 – 88.6) dan (94 – 88.6).
      • Hasilnya, kita mendapatkan nilai berikut: 1.4, 2.4, -3.6, -5.6 dan 5.4.
    4. Kuadratkan setiap nilai yang diperoleh dan jumlahkan semuanya. Setiap besaran yang baru ditemukan harus dikuadratkan. Pada langkah ini semua orang akan menghilang nilai-nilai negatif. Jika setelah langkah ini Anda masih memilikinya angka negatif, yang berarti Anda lupa mengkuadratkannya.

      • Sebagai contoh, kita mendapatkan 1,96, 5,76, 12,96, 31,36, dan 29,16.
      • Kami menjumlahkan nilai yang dihasilkan: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Bagi dengan ukuran sampel dikurangi 1. Dalam rumusnya, jumlah tersebut dibagi N – 1 karena kita tidak memperhitungkan populasi umum, tetapi mengambil sampel seluruh siswa untuk evaluasi.

      • Kurangi: N – 1 = 5 – 1 = 4
      • Bagilah: 81,2/4 = 20,3
    6. Menghapus Akar pangkat dua. Setelah Anda membagi jumlah tersebut dengan ukuran sampel dikurangi satu, ambil akar kuadrat dari nilai yang ditemukan. Ini langkah terakhir dalam menghitung standar deviasi. Ada program statistik yang, setelah memasukkan data awal, melakukan semua perhitungan yang diperlukan.

      • Dalam contoh kita, simpangan baku nilai siswa yang membaca materi sebelum kelas adalah s =√20.3 = 4.51.

      Bagian 3

      Tentukan signifikansinya
      1. Hitung varians antara kedua kelompok data. Sebelum langkah ini, kita melihat contoh untuk satu kelompok data saja. Jika Anda ingin membandingkan dua kelompok, Anda tentu harus mengambil data dari kedua kelompok tersebut. Hitung simpangan baku untuk kelompok data kedua, lalu temukan varians antara kedua kelompok eksperimen. Varians dihitung dengan menggunakan rumus berikut: s d = √((s 1 /N 1) + (s 2 /N 2)).

Tugas 3. Lima anak prasekolah diberikan tes. Waktu yang dibutuhkan untuk menyelesaikan setiap tugas dicatat. Akankah ditemukan perbedaan yang signifikan secara statistik antara waktu penyelesaian tiga soal tes pertama?

Jumlah mata pelajaran

Materi referensi

Penugasan ini didasarkan pada teori analisis varians. Secara umum, tugas analisis varians adalah mengidentifikasi faktor-faktor yang mempunyai pengaruh signifikan terhadap hasil percobaan. Analisis varians dapat digunakan untuk membandingkan mean beberapa sampel jika terdapat lebih dari dua sampel. Analisis varians satu arah digunakan untuk tujuan ini.

Untuk menyelesaikan tugas yang diberikan, berikut ini diterima. Jika varians dari nilai yang diperoleh dari parameter optimasi jika dipengaruhi oleh faktor berbeda dengan varians hasil tanpa adanya pengaruh faktor, maka faktor tersebut dianggap signifikan.

Terlihat dari rumusan masalah, disini digunakan metode verifikasi hipotesis statistik, yaitu tugas menguji dua varian empiris. Oleh karena itu, analisis varians didasarkan pada pengujian varians dengan menggunakan uji Fisher. Dalam tugas ini, perlu untuk memeriksa apakah perbedaan waktu penyelesaian tiga tugas tes pertama oleh masing-masing dari enam anak prasekolah signifikan secara statistik.

Hipotesis nol (utama) disebut hipotesis yang diajukan H o. Inti dari e adalah asumsi bahwa perbedaan antara parameter yang dibandingkan adalah nol (maka nama hipotesisnya adalah nol) dan bahwa perbedaan yang diamati adalah acak.

Hipotesis (alternatif) yang bersaing disebut H1, yang bertentangan dengan hipotesis nol.

Larutan:

Dengan menggunakan metode analisis varians pada tingkat signifikansi = 0,05, kami akan menguji hipotesis nol (H o) tentang adanya perbedaan yang signifikan secara statistik antara waktu penyelesaian tiga tugas tes pertama untuk enam anak prasekolah.

Mari kita lihat tabel kondisi tugas, di mana kita akan menemukan waktu rata-rata untuk menyelesaikan masing-masing dari tiga tugas tes

Jumlah mata pelajaran

Tingkat faktor

Waktu untuk menyelesaikan tugas tes pertama (dalam hitungan detik).

Waktu untuk menyelesaikan tugas tes kedua (dalam hitungan detik).

Waktu untuk menyelesaikan tugas tes ketiga (dalam hitungan detik).

Rata-rata kelompok

Menemukan rata-rata keseluruhan:

Untuk memperhitungkan signifikansi perbedaan waktu dalam setiap pengujian, total varians sampel dibagi menjadi dua bagian, yang pertama disebut faktorial, dan yang kedua disebut residu.

Mari kita hitung jumlah total deviasi kuadrat dari rata-rata keseluruhan menggunakan rumus

atau , dimana p adalah banyaknya pengukuran waktu penyelesaian tugas tes, q adalah jumlah peserta tes. Untuk melakukan ini, mari buat tabel kotak

Jumlah mata pelajaran

Tingkat faktor

Waktu untuk menyelesaikan tugas tes pertama (dalam hitungan detik).

Waktu untuk menyelesaikan tugas tes kedua (dalam hitungan detik).

Waktu untuk menyelesaikan tugas tes ketiga (dalam hitungan detik).

Keandalan statistik sangat penting dalam praktik penghitungan FCC. Telah disebutkan sebelumnya bahwa beberapa sampel dapat dipilih dari populasi yang sama:

Jika mereka dipilih dengan benar, maka indikator rata-rata dan indikator populasi umum sedikit berbeda satu sama lain dalam besarnya kesalahan keterwakilan, dengan mempertimbangkan keandalan yang diterima;

Jika mereka dipilih dari populasi yang berbeda, perbedaan di antara mereka menjadi signifikan. Statistik adalah tentang membandingkan sampel;

Jika perbedaannya tidak signifikan, tidak mendasar, tidak signifikan, yaitu, mereka sebenarnya berasal dari populasi umum yang sama, maka perbedaan di antara mereka disebut tidak dapat diandalkan secara statistik.

Dapat diandalkan secara statistik Perbedaan sampel adalah sampel yang berbeda secara signifikan dan mendasar, yaitu milik populasi umum yang berbeda.

Di FCC, menilai signifikansi statistik dari perbedaan sampel berarti menyelesaikan serangkaian masalah masalah praktis. Misalnya, pengenalan metode pengajaran baru, program, rangkaian latihan, tes, latihan kontrol dikaitkan dengan pengujian eksperimentalnya, yang seharusnya menunjukkan bahwa kelompok tes pada dasarnya berbeda dari kelompok kontrol. Oleh karena itu, digunakan metode statistik khusus, yang disebut kriteria signifikansi statistik, untuk mendeteksi ada tidaknya perbedaan signifikan secara statistik antar sampel.

Semua kriteria dibagi menjadi dua kelompok: parametrik dan non-parametrik. Kriteria parametrik memerlukan adanya hukum distribusi normal, yaitu Ini berarti penentuan wajib indikator utama hukum normal - mean aritmatika dan deviasi standar s. Kriteria parametrik adalah yang paling akurat dan benar. Uji nonparametrik didasarkan pada perbedaan peringkat (ordinal) antar elemen sampel.

Berikut adalah kriteria utama signifikansi statistik yang digunakan dalam praktik FCC: Tes Student dan Tes Fisher.

Tes t siswa dinamai ilmuwan Inggris K. Gosset (Mahasiswa - nama samaran), yang menemukan metode ini. Uji t Student bersifat parametrik dan digunakan untuk perbandingan indikator absolut sampel. Ukuran sampel mungkin berbeda.

Tes t siswa didefinisikan seperti ini.

1. Carilah uji Student t dengan menggunakan rumus berikut:


dimana rata-rata aritmatika dari sampel yang dibandingkan; t 1, t 2 - kesalahan keterwakilan diidentifikasi berdasarkan indikator sampel yang dibandingkan.

2. Latihan di FCC menunjukkan bahwa untuk olahraga olahraga cukup menerima reliabilitas akun P = 0,95.

Untuk keandalan penghitungan: P = 0,95 (a = 0,05), dengan jumlah derajat kebebasan

k = n 1 + n 2 - 2 menggunakan tabel pada Lampiran 4 kita mencari nilai nilai batas kriteria ( t gr).

3. Berdasarkan sifat-sifat hukum distribusi normal, kriteria Student membandingkan t dan t gr.

Kami menarik kesimpulan:

jika t t gr, maka perbedaan antara sampel yang dibandingkan adalah signifikan secara statistik;

jika t t gr, maka perbedaannya tidak signifikan secara statistik.

Bagi peneliti di bidang FCS, menilai signifikansi statistik adalah langkah pertama dalam memecahkan masalah tertentu: apakah sampel yang dibandingkan berbeda secara fundamental atau non-fundamental satu sama lain. Langkah selanjutnya adalah mengevaluasi perbedaan ini dari sudut pandang pedagogi, yang ditentukan oleh kondisi tugas.

Mari kita pertimbangkan penerapan tes Siswa menggunakan contoh spesifik.

Contoh 2.14. Sekelompok 18 subjek dinilai detak jantungnya (bpm) sebelum x i dan sesudahnya kamu aku pemanasan.

Nilai efektivitas pemanasan berdasarkan detak jantung. Data awal dan perhitungan disajikan pada tabel. 2.30 dan 2.31.

Tabel 2.30

Memproses indikator detak jantung sebelum melakukan pemanasan


Kesalahan untuk kedua kelompok terjadi bersamaan, karena ukuran sampelnya sama (kelompok yang sama diteliti kondisi yang berbeda), dan rata-rata deviasi standar sebesar s x = s y = 3 denyut/menit. Mari kita lanjutkan ke pendefinisian tes Siswa:

Kami menetapkan keandalan akun: P = 0,95.

Banyaknya derajat kebebasan k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. Dari tabel pada Lampiran 4 kita temukan t gr= 2,02.

Inferensi statistik. Karena t = 11,62, dan batas t gr = 2,02, maka 11,62 > 2,02, yaitu. t > t gr, oleh karena itu perbedaan antar sampel signifikan secara statistik.

Kesimpulan pedagogis. Ditemukan bahwa dalam hal detak jantung, perbedaan antara keadaan kelompok sebelum dan sesudah pemanasan adalah signifikan secara statistik, yaitu. signifikan, mendasar. Jadi, berdasarkan indikator detak jantung, kita dapat menyimpulkan bahwa pemanasan itu efektif.

Kriteria Fisher adalah parametrik. Ini digunakan ketika membandingkan tingkat dispersi sampel. Ini biasanya berarti perbandingan dalam hal stabilitas performa olahraga atau stabilitas fungsional dan indikator teknis dalam praktek budaya fisik dan olahraga. Sampel dapat memiliki ukuran yang berbeda.

Kriteria Fisher didefinisikan dalam urutan berikut.

1. Temukan kriteria Fisher F menggunakan rumus


di mana , adalah varian dari sampel yang dibandingkan.

Ketentuan kriteria Fisher mengatur hal itu di dalam pembilang rumus F ada dispersi yang besar, yaitu angka F selalu lebih besar dari satu.

Kami menetapkan keandalan perhitungan: P = 0,95 - dan menentukan jumlah derajat kebebasan untuk kedua sampel: k 1 = n 1 - 1, k 2 = n 2 - 1.

Dari tabel di Lampiran 4 kita temukan nilai batas kriteria F gr.

Perbandingan kriteria F dan F gr memungkinkan kita untuk merumuskan kesimpulan:

jika F > F gr, maka perbedaan antar sampel signifikan secara statistik;

jika F< F гр, то различие между выборками статически недо­стоверно.

Mari kita beri contoh spesifik.

Contoh 2.15. Mari kita analisa dua kelompok pemain bola tangan: x saya (n 1= 16 orang) dan yi (n 2 = 18 orang). Kelompok atlet ini dipelajari waktu take-off pada saat melempar bola ke gawang.

Apakah indikator tolakan memiliki tipe yang sama?

Data awal dan perhitungan dasar disajikan pada tabel. 2.32 dan 2.33.

Tabel 2.32

Pengolahan indikator tolakan pemain bola tangan kelompok pertama


Mari kita definisikan kriteria Fisher:





Berdasarkan data yang disajikan pada tabel di Lampiran 6, kita menemukan Fgr: Fgr = 2.4

Mari kita perhatikan fakta bahwa pada tabel di Lampiran 6, daftar bilangan derajat kebebasan baik dispersi yang lebih besar maupun yang lebih kecil menjadi lebih kasar ketika kita mendekati bilangan yang lebih besar. Jadi, jumlah derajat kebebasan dispersi yang lebih besar mengikuti urutan ini: 8, 9, 10, 11, 12, 14, 16, 20, 24, dst., dan yang lebih kecil - 28, 29, 30, 40 , 50, dst.

Hal ini dijelaskan oleh fakta bahwa seiring bertambahnya ukuran sampel, perbedaan uji F berkurang dan dimungkinkan untuk menggunakan nilai tabel yang mendekati data asli. Jadi, pada contoh 2.15 =17 tidak ada dan kita dapat mengambil nilai yang paling dekat dengannya k = 16, dari situ kita memperoleh Fgr = 2.4.

Inferensi statistik. Karena uji Fisher F= 2.5 > F= 2.4, sampel dapat dibedakan secara statistik.

Kesimpulan pedagogis. Nilai waktu take-off (s) saat melempar bola ke gawang bagi pemain bola tangan kedua kelompok berbeda secara signifikan. Kelompok-kelompok ini harus dianggap berbeda.

Penelitian lebih lanjut harus menunjukkan apa alasan perbedaan ini.

Contoh 2.20.(pada keandalan statistik sampel ). Apakah kualifikasi pemain sepak bola meningkat jika waktu mulai dari memberi isyarat hingga menendang bola pada awal latihan adalah x i , dan pada akhirnya y i .

Data awal dan perhitungan dasar diberikan dalam tabel. 2.40 dan 2.41.

Tabel 2.40

Indikator waktu pemrosesan mulai dari pemberian sinyal hingga memukul bola di awal latihan


Mari kita tentukan perbedaan antara kelompok indikator dengan menggunakan kriteria Siswa:

Dengan reliabilitas P = 0,95 dan derajat kebebasan k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42, menggunakan tabel pada Lampiran 4 kita temukan t gr= 2,02. Karena t = 8,3 > t gr= 2,02 - perbedaannya signifikan secara statistik.

Mari kita tentukan perbedaan antara kelompok indikator dengan menggunakan kriteria Fisher:


Berdasarkan tabel pada Lampiran 2, dengan reliabilitas P = 0,95 dan derajat kebebasan k = 22-1 = 21, maka nilai F gr = 21. Karena F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Inferensi statistik. Berdasarkan rata-rata aritmatika, perbedaan antar kelompok indikator signifikan secara statistik. Dari segi sebaran (dispersi), perbedaan antar kelompok indikator secara statistik tidak dapat diandalkan.

Kesimpulan pedagogis. Kualifikasi pemain sepak bola telah meningkat secara signifikan, namun perhatian harus diberikan pada stabilitas kesaksiannya.

Mempersiapkan pekerjaan

Sebelum ini Pekerjaan laboratorium dalam disiplin "Metrologi Olahraga" seluruh siswa dalam kelompok belajar harus membentuk tim kerja yang masing-masing beranggotakan 3-4 siswa, untuk bersama-sama menyelesaikan tugas pekerjaan seluruh pekerjaan laboratorium.

Dalam persiapan untuk bekerja baca bagian yang relevan dari literatur yang direkomendasikan (lihat bagian 6 dari data instruksi metodologis) dan catatan kuliah. Pelajarilah bagian 1 dan 2 untuk pekerjaan laboratorium ini, serta tugas kerjanya (bagian 4).

Siapkan formulir laporan pada lembar standar kertas tulis dalam format A4 dan masukkan ke dalamnya bahan-bahan yang diperlukan untuk pekerjaan.

Laporan tersebut harus memuat :

Judul Halaman menunjukkan jurusan (UC dan TR), kelompok belajar, nama belakang, nama depan, patronimik mahasiswa, nomor dan gelar pekerjaan laboratorium, tanggal penyelesaian, serta nama belakang, gelar akademik, gelar akademik dan jabatan mahasiswa. guru menerima pekerjaan;

Tujuan pekerjaan;

Rumus dengan nilai numerik, menjelaskan hasil antara dan hasil akhir perhitungan;

Tabel nilai yang diukur dan dihitung;

Materi grafis yang dibutuhkan oleh tugas;

Kesimpulan singkat tentang hasil setiap tahapan penugasan pekerjaan dan pekerjaan yang dilakukan secara umum.

Semua grafik dan tabel digambar dengan cermat menggunakan alat gambar. Grafik bersyarat dan sebutan surat harus mematuhi standar Gost. Penyusunan laporan diperbolehkan dengan menggunakan teknologi komputer.

Tugas kerja

Sebelum melakukan seluruh pengukuran, setiap anggota tim harus mempelajari aturan penggunaan permainan olah raga Dart yang diberikan pada Lampiran 7, yang diperlukan untuk melaksanakan tahapan penelitian di bawah ini.

Penelitian tahap I“Studi tentang hasil pencapaian sasaran permainan olahraga Darts oleh masing-masing anggota tim untuk memenuhi hukum distribusi normal menurut kriteria χ 2 Pearson dan kriteria tiga sigma"

1. mengukur (menguji) kecepatan (pribadi) dan koordinasi tindakan Anda, dengan melempar anak panah sebanyak 30-40 kali pada sasaran berbentuk lingkaran dalam permainan olah raga Darts.

2. Hasil pengukuran (tes) x saya(dalam gelas) rumuskan dalam bentuk deret variasi dan masukkan ke dalam tabel 4.1 (kolom, lengkapi semua perhitungan yang diperlukan, isi tabel-tabel yang diperlukan dan tarik kesimpulan yang sesuai tentang kesesuaian distribusi empiris yang dihasilkan dengan hukum distribusi normal, dengan analogi dengan perhitungan serupa, tabel dan kesimpulan dari contoh 2.12, yang diberikan pada bagian 2 pedoman ini di halaman 7 -10.

Tabel 4.1

Kesesuaian kecepatan dan koordinasi tindakan subjek dengan hukum distribusi normal

TIDAK. bulat
Total

II – tahap penelitian

“Penilaian rata-rata indikator populasi umum mengenai sasaran permainan olah raga Dart seluruh siswa kelompok belajar berdasarkan hasil pengukuran anggota satu tim”

Menilai rata-rata indikator kecepatan dan koordinasi tindakan seluruh siswa dalam kelompok belajar (sesuai daftar kelompok belajar di majalah kelas) berdasarkan hasil pencapaian sasaran Darts seluruh anggota tim, yang diperoleh pada tahap pertama. penelitian pekerjaan laboratorium ini.

1. Dokumentasikan hasil pengukuran kecepatan dan koordinasi tindakan saat melempar dart ke sasaran melingkar dalam permainan olah raga Dart seluruh anggota tim anda (2 - 4 orang), yang mewakili sampel hasil pengukuran dari populasi umum (hasil pengukuran seluruh siswa dalam suatu kelompok belajar - misalnya, 15 orang), isikan pada kolom kedua dan ketiga Tabel 4.2.

Tabel 4.2

Memproses indikator kecepatan dan koordinasi tindakan

anggota brigade

TIDAK.
Total

Pada tabel 4.2 dibawah harus dipahami , skor rata-rata yang cocok (lihat hasil perhitungan pada Tabel 4.1) anggota tim Anda ( , diperoleh pada penelitian tahap pertama. Perlu dicatat bahwa, biasanya, Tabel 4.2 memuat nilai rata-rata hitung hasil pengukuran yang diperoleh salah satu anggota tim pada penelitian tahap pertama , karena kemungkinan hasil pengukuran anggota tim yang berbeda akan sama sangat kecil. Kemudian, sebagai aturan, nilai-nilai di kolom Tabel 4.2 untuk setiap baris - sama dengan 1, A di baris “Jumlah "kolom" ", ditulis jumlah anggota tim Anda.

2. Lakukan semua perhitungan yang diperlukan untuk mengisi tabel 4.2, serta perhitungan dan kesimpulan lain yang serupa dengan perhitungan dan kesimpulan contoh 2.13 yang diberikan pada bagian ke-2 ini pengembangan metodologi di halaman 13-14. Hal ini harus diingat ketika menghitung kesalahan keterwakilan "M" perlu menggunakan rumus 2.4 yang diberikan pada halaman 13 pengembangan metodologi ini, karena sampelnya kecil (n, dan diketahui jumlah elemen populasi umum N, dan sama dengan jumlah siswa dalam kelompok belajar, sesuai dengan daftar jurnal kelompok belajar.

III – tahap penelitian

Evaluasi efektivitas pemanasan menurut indikator “Kecepatan dan koordinasi tindakan” oleh masing-masing anggota tim menggunakan uji-t Student

Untuk mengevaluasi efektivitas pemanasan lempar dart pada sasaran permainan olah raga “Darts”, yang dilakukan pada penelitian tahap pertama pekerjaan laboratorium ini, oleh setiap anggota tim sesuai dengan indikator “Kecepatan dan koordinasi tindakan", menggunakan kriteria Student - kriteria parametrik untuk keandalan statistik dari hukum distribusi empiris ke hukum distribusi normal .

… Total

2. varians dan RMS , hasil pengukuran indikator “Kecepatan dan koordinasi tindakan” berdasarkan hasil pemanasan, diberikan pada tabel 4.3, (lihat perhitungan serupa yang diberikan segera setelah tabel 2.30 dari contoh 2.14 di halaman 16 pengembangan metodologi ini).

3. Setiap anggota tim kerja mengukur (menguji) kecepatan (pribadi) dan koordinasi tindakan Anda setelah pemanasan,

… Total

5. Lakukan perhitungan rata-rata varians dan RMS ,hasil pengukuran indikator “Kecepatan dan koordinasi tindakan” setelah pemanasan, diberikan pada tabel 4.4, tuliskan hasil pengukuran keseluruhan berdasarkan hasil pemanasan (lihat perhitungan serupa yang diberikan segera setelah tabel 2.31 dari contoh 2.14 di halaman 17 pengembangan metodologi ini).

6. Lakukan semua perhitungan dan kesimpulan yang diperlukan serupa dengan perhitungan dan kesimpulan dari contoh 2.14 yang diberikan pada bagian ke-2 pengembangan metodologi ini di halaman 16-17. Hal ini harus diingat ketika menghitung kesalahan keterwakilan "M" perlu menggunakan rumus 2.1 yang diberikan pada halaman 12 pengembangan metodologi ini, karena sampelnya adalah n dan jumlah elemen dalam populasi N ( tidak diketahui.

IV – tahap penelitian

Penilaian keseragaman (stabilitas) indikator “Kecepatan dan koordinasi tindakan” dua anggota tim menggunakan kriteria Fisher

Menilai keseragaman (stabilitas) indikator “Kecepatan dan koordinasi tindakan” dua anggota tim dengan menggunakan kriteria Fisher, berdasarkan hasil pengukuran yang diperoleh pada penelitian tahap ketiga di laboratorium ini.

Untuk melakukan ini, Anda perlu melakukan hal berikut.

Dengan menggunakan data tabel 4.3 dan 4.4, hasil penghitungan varians dari tabel tersebut diperoleh pada penelitian tahap ketiga, serta metodologi penghitungan dan penerapan kriteria Fisher untuk menilai keseragaman (stabilitas) indikator olahraga, diberikan pada contoh 2.15 di halaman 18-19 pengembangan metodologi ini, buatlah kesimpulan statistik dan pedagogis yang sesuai.

V – tahap penelitian

Penilaian kelompok indikator “Kecepatan dan koordinasi tindakan” salah satu anggota tim sebelum dan sesudah pemanasan

Signifikansi statistik dari suatu hasil (nilai-p) adalah perkiraan ukuran keyakinan terhadap “kebenaran” (dalam arti “keterwakilan sampel”). Secara lebih teknis, nilai p adalah ukuran yang bervariasi dalam urutan besarnya menurun sesuai dengan keandalan hasilnya. Nilai p yang lebih tinggi berarti tingkat kepercayaan yang lebih rendah terhadap hubungan antar variabel yang ditemukan dalam sampel. Secara khusus, nilai p mewakili kemungkinan kesalahan yang terkait dengan generalisasi hasil pengamatan ke seluruh populasi. Misalnya, nilai p sebesar 0,05 (yaitu 1/20) menunjukkan bahwa terdapat kemungkinan 5% bahwa hubungan antar variabel yang ditemukan dalam sampel hanyalah fitur acak dari sampel. Dengan kata lain, jika hubungan tertentu tidak ada dalam suatu populasi, dan Anda melakukan eksperimen serupa berkali-kali, maka dalam sekitar satu dari dua puluh pengulangan eksperimen Anda akan mengharapkan hubungan yang sama atau lebih kuat antar variabel.

Dalam banyak penelitian, nilai p 0,05 dianggap sebagai “margin yang dapat diterima” untuk tingkat kesalahan.

Tidak ada cara untuk menghindari kesewenang-wenangan dalam memutuskan tingkat signifikansi apa yang benar-benar dianggap “signifikan”. Pemilihan tingkat signifikansi tertentu yang di atasnya hasilnya ditolak karena salah merupakan pilihan yang sewenang-wenang. Dalam praktiknya, keputusan akhir biasanya bergantung pada apakah hasilnya diprediksi secara apriori (yaitu, sebelum eksperimen dilakukan) atau ditemukan secara a posteriori sebagai hasil dari banyak analisis dan perbandingan yang dilakukan pada berbagai data, serta pada data. tradisi bidang studi. Biasanya, di banyak bidang, hasil p 0,05 merupakan batas signifikansi statistik yang dapat diterima, namun perlu diingat bahwa tingkat ini masih mencakup tingkat kesalahan yang cukup besar (5%). Hasil yang signifikan pada tingkat p 0,01 umumnya dianggap signifikan secara statistik, dan hasil dengan tingkat p 0,005 atau p 0,001 umumnya dianggap sangat signifikan. Namun perlu dipahami bahwa klasifikasi tingkat signifikansi ini cukup bersyarat dan hanya merupakan kesepakatan informal yang diadopsi berdasarkan pengalaman praktis dalam bidang penelitian tertentu.

Seperti telah disebutkan, besarnya ketergantungan dan keandalan mewakili dua berbagai karakteristik ketergantungan antar variabel. Namun demikian, tidak dapat dikatakan bahwa mereka sepenuhnya independen. Berbicara bahasa umum, semakin besar besarnya ketergantungan (koneksi) antar variabel dalam sampel berukuran normal, maka semakin dapat diandalkan.

Jika kita berasumsi bahwa tidak ada hubungan antara variabel-variabel yang bersesuaian dalam populasi, maka kemungkinan besar diharapkan bahwa dalam sampel yang diteliti juga tidak akan ada hubungan antara variabel-variabel tersebut. Oleh karena itu, semakin kuat suatu hubungan ditemukan dalam suatu sampel, semakin kecil kemungkinan bahwa hubungan tersebut tidak ada dalam populasi asal sampel tersebut.


Ukuran sampel mempengaruhi signifikansi hubungan. Jika observasinya sedikit, maka kemungkinan kombinasi nilai untuk variabel-variabel tersebut juga sedikit dan dengan demikian kemungkinan ditemukannya kombinasi nilai yang menunjukkan hubungan kuat secara tidak sengaja relatif tinggi.

Bagaimana tingkat signifikansi statistik dihitung. Anggaplah Anda telah menghitung ukuran ketergantungan antara dua variabel (seperti dijelaskan di atas). Pertanyaan selanjutnya, berdiri di depan Anda: “seberapa pentingkah hubungan ini?” Misalnya, apakah 40% varian yang dijelaskan antara dua variabel cukup untuk menganggap hubungan tersebut signifikan? Jawabannya: “tergantung keadaan”. Artinya, signifikansinya terutama bergantung pada ukuran sampel. Seperti yang telah dijelaskan, dalam sampel yang sangat besar hubungan antar variabel yang sangat lemah sekalipun akan menjadi signifikan, sedangkan dalam sampel yang kecil sekalipun, hubungan yang sangat kuat pun tidak dapat diandalkan. Jadi, untuk menentukan tingkat signifikansi statistik, Anda memerlukan fungsi yang merepresentasikan hubungan antara "besarnya" dan "signifikansi" hubungan antar variabel untuk setiap ukuran sampel. Fungsi ini akan menunjukkan kepada Anda secara tepat “seberapa besar kemungkinan memperoleh ketergantungan dengan nilai tertentu (atau lebih) dalam sampel dengan ukuran tertentu, dengan asumsi bahwa tidak ada ketergantungan seperti itu dalam populasi.” Dengan kata lain, fungsi ini akan memberikan tingkat signifikansi (nilai-p), dan oleh karena itu kemungkinan menolak asumsi bahwa suatu hubungan tertentu tidak ada dalam populasi. Hipotesis “alternatif” ini (bahwa tidak ada hubungan dalam populasi) biasanya disebut hipotesis nol. Idealnya jika fungsi yang menghitung probabilitas kesalahan bersifat linier dan hanya memiliki kemiringan yang berbeda untuk ukuran sampel yang berbeda. Sayangnya, fungsi ini jauh lebih kompleks dan tidak selalu sama persis. Namun, dalam banyak kasus, bentuknya diketahui dan dapat digunakan untuk menentukan tingkat signifikansi dalam studi sampel dengan ukuran tertentu. Sebagian besar fungsi ini terkait dengan sangat kelas penting distribusi disebut normal.

Tingkat signifikansi dalam statistik merupakan indikator penting yang mencerminkan tingkat keyakinan terhadap keakuratan dan kebenaran data yang diperoleh (diprediksi). Konsep ini banyak digunakan di berbagai bidang: mulai dari penyelenggaraan penelitian sosiologi, sebelum pengujian statistik hipotesis ilmiah.

Definisi

Tingkat signifikansi statistik (atau hasil signifikan secara statistik) menunjukkan seberapa besar kemungkinan hal tersebut terjadi kejadian yang tidak disengaja indikator yang dipelajari. Signifikansi statistik keseluruhan dari suatu fenomena dinyatakan dengan koefisien nilai p (p-level). Dalam setiap percobaan atau pengamatan, ada kemungkinan bahwa data yang diperoleh disebabkan oleh kesalahan pengambilan sampel. Hal ini terutama berlaku untuk sosiologi.

Artinya, nilai signifikan secara statistik adalah nilai yang probabilitas kemunculannya secara acak sangat kecil atau cenderung ekstrim. Ekstrem dalam konteks ini adalah sejauh mana statistik menyimpang dari hipotesis nol (hipotesis yang diuji konsistensinya dengan data sampel yang diperoleh). Dalam praktik ilmiah, tingkat signifikansi dipilih sebelum pengumpulan data dan, biasanya, koefisiennya adalah 0,05 (5%). Untuk sistem yang sangat penting nilai yang tepat, indikator ini bisa 0,01 (1%) atau kurang.

Latar belakang

Konsep tingkat signifikansi diperkenalkan oleh ahli statistik dan genetika Inggris Ronald Fisher pada tahun 1925, ketika ia mengembangkan teknik untuk menguji hipotesis statistik. Saat menganalisis proses apa pun, ada kemungkinan tertentu terjadinya fenomena tertentu. Kesulitan muncul ketika bekerja dengan persentase probabilitas yang kecil (atau tidak jelas) yang termasuk dalam konsep “kesalahan pengukuran”.

Saat bekerja dengan data statistik yang tidak cukup spesifik untuk mengujinya, para ilmuwan dihadapkan pada masalah hipotesis nol, yang “mencegah” pengoperasian dengan jumlah kecil. Fisher mengusulkan sistem seperti itu untuk menentukan probabilitas kejadian pada 5% (0,05) sebagai potongan pengambilan sampel yang mudah, sehingga memungkinkan seseorang untuk menolak hipotesis nol dalam perhitungan.

Pengenalan peluang tetap

Pada tahun 1933 Ilmuwan Jerzy Neyman dan Egon Pearson dalam karyanya merekomendasikan untuk menetapkan tingkat signifikansi tertentu terlebih dahulu (sebelum pengumpulan data). Contoh penggunaan aturan tersebut terlihat jelas pada saat pemilu. Katakanlah ada dua kandidat, yang satu sangat populer dan yang lainnya kurang dikenal. Jelas bahwa kandidat pertama akan memenangkan pemilu, dan peluang kandidat kedua cenderung nol. Mereka berusaha keras - tetapi tidak setara: selalu ada kemungkinan force majeure, informasi sensasional, keputusan yang tidak terduga, yang dapat mengubah prediksi hasil pemilu.

Neyman dan Pearson sepakat bahwa tingkat signifikansi Fisher sebesar 0,05 (dilambangkan dengan α) adalah yang paling tepat. Namun, Fischer sendiri pada tahun 1956 menentang penetapan nilai ini. Ia percaya bahwa tingkat α harus diatur sesuai dengan keadaan tertentu. Misalnya, dalam fisika partikel, nilainya adalah 0,01.

nilai tingkat p

Istilah nilai p pertama kali digunakan oleh Brownlee pada tahun 1960. P-level (p-value) merupakan indikator yang masuk hubungan terbalik pada kebenaran hasilnya. Koefisien nilai p tertinggi berhubungan dengan tingkat kepercayaan terendah dalam hubungan sampel antar variabel.

Nilai ini mencerminkan kemungkinan kesalahan yang terkait dengan interpretasi hasil. Misalkan p-level = 0,05 (1/20). Ini menunjukkan kemungkinan lima persen bahwa hubungan antar variabel yang ditemukan dalam sampel hanyalah fitur acak dari sampel. Artinya, jika ketergantungan ini tidak ada, maka dengan mengulangi percobaan serupa, rata-rata, dalam setiap penelitian kedua puluh, kita dapat mengharapkan ketergantungan yang sama atau lebih besar antar variabel. Level-p sering kali dilihat sebagai "margin" untuk tingkat kesalahan.

Omong-omong, nilai p mungkin tidak mencerminkan hubungan nyata antar variabel, tetapi hanya menunjukkan nilai rata-rata tertentu dalam asumsi. Secara khusus, analisis akhir data juga akan bergantung pada nilai yang dipilih dari koefisien ini. Pada p-level = 0,05 akan ada beberapa hasil, dan pada koefisien sama dengan 0,01 akan ada hasil yang berbeda.

Menguji hipotesis statistik

Tingkat signifikansi statistik sangat penting ketika menguji hipotesis. Misalnya, saat menghitung pengujian dua sisi, daerah penolakan dibagi rata di kedua ujung distribusi pengambilan sampel (relatif terhadap koordinat nol) dan kebenaran data yang dihasilkan dihitung.

Misalkan, ketika memantau suatu proses (fenomena), ternyata informasi statistik baru menunjukkan perubahan kecil dibandingkan nilai sebelumnya. Pada saat yang sama, perbedaan hasil kecil, tidak jelas, namun penting untuk penelitian. Spesialis dihadapkan pada dilema: apakah perubahan benar-benar terjadi atau apakah ini kesalahan pengambilan sampel (ketidakakuratan pengukuran)?

Dalam hal ini, mereka menggunakan atau menolak hipotesis nol (menghubungkan semuanya dengan kesalahan, atau mengakui perubahan dalam sistem sebagai fait accompli). Proses penyelesaian masalah didasarkan pada rasio signifikansi statistik secara keseluruhan (p-value) dan tingkat signifikansi (α). Jika tingkat p< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Nilai yang digunakan

Tingkat signifikansinya tergantung pada materi yang dianalisis. Dalam praktiknya, nilai tetap berikut digunakan:

  • α = 0,1 (atau 10%);
  • α = 0,05 (atau 5%);
  • α = 0,01 (atau 1%);
  • α = 0,001 (atau 0,1%).

Semakin akurat perhitungan yang diperlukan maka semakin rendah koefisien α yang digunakan. Tentu saja, perkiraan statistik dalam fisika, kimia, farmasi, dan genetika memerlukan akurasi yang lebih besar dibandingkan dalam ilmu politik dan sosiologi.

Ambang batas signifikansi pada area tertentu

Dalam bidang presisi tinggi seperti fisika partikel dan manufaktur, signifikansi statistik sering dinyatakan sebagai rasio deviasi standar (dilambangkan dengan koefisien sigma - σ) relatif terhadap distribusi probabilitas normal (distribusi Gaussian). σ adalah indikator statistik yang menentukan sebaran nilai besaran tertentu relatif terhadap ekspektasi matematis. Digunakan untuk memplot kemungkinan kejadian.

Tergantung pada bidang ilmunya, koefisien σ sangat bervariasi. Misalnya, ketika memprediksi keberadaan Higgs boson, parameter σ sama dengan lima (σ = 5), yang sesuai dengan nilai p = 1/3,5 juta Dalam studi genom, tingkat signifikansinya bisa 5 × 10 - 8, hal yang biasa terjadi di wilayah ini.

Efisiensi

Harus diingat bahwa koefisien α dan nilai p bukanlah karakteristik yang pasti. Apapun tingkat signifikansi dalam statistik dari fenomena yang diteliti, hal ini bukanlah dasar tanpa syarat untuk menerima hipotesis. Misalnya, dari nilainya lebih sedikitα, semakin besar kemungkinan hipotesis yang diajukan adalah signifikan. Namun, terdapat risiko kesalahan yang mengurangi kekuatan statistik (signifikansi) penelitian.

Peneliti yang hanya fokus pada hasil yang signifikan secara statistik mungkin akan mengambil kesimpulan yang salah. Pada saat yang sama, sulit untuk memeriksa ulang pekerjaan mereka, karena mereka menerapkan asumsi (yang sebenarnya adalah nilai α dan p). Oleh karena itu, selalu disarankan, bersamaan dengan penghitungan signifikansi statistik, untuk menentukan indikator lain - besarnya pengaruh statistik. Besarnya dampaknya adalah ukuran kuantitatif kekuatan efek.