Signifikansi statistik: definisi, konsep, signifikansi, persamaan regresi dan pengujian hipotesis. Tingkat signifikansi statistik (p)

Keandalan statistik sangat penting dalam praktik penghitungan FCC. Telah disebutkan sebelumnya bahwa beberapa sampel dapat dipilih dari populasi yang sama:

Jika mereka dipilih dengan benar, maka indikator rata-rata dan indikator populasi umum sedikit berbeda satu sama lain dalam besarnya kesalahan keterwakilan, dengan mempertimbangkan keandalan yang diterima;

Jika mereka dipilih dari populasi yang berbeda, perbedaan di antara mereka menjadi signifikan. Statistik adalah tentang membandingkan sampel;

Jika perbedaannya tidak signifikan, tidak mendasar, tidak signifikan, yaitu, mereka sebenarnya berasal dari populasi umum yang sama, maka perbedaan di antara mereka disebut tidak dapat diandalkan secara statistik.

Dapat diandalkan secara statistik Perbedaan sampel adalah sampel yang berbeda secara signifikan dan mendasar, yaitu milik populasi umum yang berbeda.

Di FCC, menilai signifikansi statistik dari perbedaan sampel berarti memecahkan banyak masalah praktis. Misalnya, pengenalan metode pengajaran baru, program, rangkaian latihan, tes, latihan kontrol dikaitkan dengan pengujian eksperimentalnya, yang seharusnya menunjukkan bahwa kelompok tes pada dasarnya berbeda dari kelompok kontrol. Oleh karena itu, digunakan metode statistik khusus, yang disebut kriteria signifikansi statistik, untuk mendeteksi ada tidaknya perbedaan signifikan secara statistik antar sampel.

Semua kriteria dibagi menjadi dua kelompok: parametrik dan non-parametrik. Kriteria parametrik memerlukan adanya hukum distribusi normal, yaitu Ini berarti penentuan wajib indikator utama hukum normal - mean aritmatika dan deviasi standar s. Kriteria parametrik adalah yang paling akurat dan benar. Uji nonparametrik didasarkan pada perbedaan peringkat (ordinal) antar elemen sampel.

Berikut adalah kriteria utama signifikansi statistik yang digunakan dalam praktik FCC: Tes Student dan Tes Fisher.

Tes t siswa dinamai ilmuwan Inggris K. Gosset (Mahasiswa - nama samaran), yang menemukan metode ini. Uji Student bersifat parametrik dan digunakan untuk membandingkan nilai absolut sampel. Ukuran sampel mungkin berbeda.

Tes t siswa didefinisikan seperti ini.

1. Temukan uji Student t dengan rumus berikut:


dimana rata-rata aritmatika dari sampel yang dibandingkan; t 1, t 2 - kesalahan keterwakilan diidentifikasi berdasarkan indikator sampel yang dibandingkan.

2. Latihan di FCC menunjukkan bahwa untuk olahraga olahraga cukup menerima reliabilitas akun P = 0,95.

Untuk keandalan penghitungan: P = 0,95 (a = 0,05), dengan jumlah derajat kebebasan

k = n 1 + n 2 - 2 menggunakan tabel pada Lampiran 4 kita mencari nilai nilai batas kriteria ( t gr).

3. Berdasarkan sifat-sifat hukum distribusi normal, kriteria Student membandingkan t dan t gr.

Kami menarik kesimpulan:

jika t t gr, maka perbedaan antara sampel yang dibandingkan adalah signifikan secara statistik;

jika t t gr, maka perbedaannya tidak signifikan secara statistik.

Bagi peneliti di bidang FCS, menilai signifikansi statistik adalah langkah pertama dalam memecahkan masalah tertentu: apakah sampel yang dibandingkan berbeda secara fundamental atau non-fundamental satu sama lain. Langkah selanjutnya adalah mengevaluasi perbedaan ini dari sudut pandang pedagogi, yang ditentukan oleh kondisi tugas.

Mari kita pertimbangkan penerapan tes Siswa menggunakan contoh spesifik.

Contoh 2.14. Sekelompok 18 subjek dinilai detak jantungnya (bpm) sebelum x i dan sesudahnya kamu aku pemanasan.

Nilai efektivitas pemanasan berdasarkan detak jantung. Data awal dan perhitungan disajikan pada tabel. 2.30 dan 2.31.

Tabel 2.30

Memproses indikator detak jantung sebelum melakukan pemanasan


Kesalahan untuk kedua kelompok terjadi bersamaan, karena ukuran sampelnya sama (kelompok yang sama diteliti kondisi yang berbeda), dan simpangan bakunya adalah s x = s y = 3 denyut/menit. Mari kita lanjutkan ke pendefinisian tes Siswa:

Kami menetapkan keandalan akun: P = 0,95.

Banyaknya derajat kebebasan k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. Dari tabel pada Lampiran 4 kita temukan t gr= 2,02.

Inferensi statistik. Karena t = 11,62, dan batas t gr = 2,02, maka 11,62 > 2,02, yaitu. t > t gr, oleh karena itu perbedaan antar sampel signifikan secara statistik.

Kesimpulan pedagogis. Ditemukan bahwa dalam hal detak jantung, perbedaan antara keadaan kelompok sebelum dan sesudah pemanasan adalah signifikan secara statistik, yaitu. signifikan, mendasar. Jadi, berdasarkan indikator detak jantung, kita dapat menyimpulkan bahwa pemanasan itu efektif.

Kriteria Fisher adalah parametrik. Ini digunakan ketika membandingkan tingkat dispersi sampel. Ini biasanya berarti perbandingan dalam hal stabilitas performa olahraga atau stabilitas indikator fungsional dan teknis dalam praktik budaya fisik dan olahraga. Sampel dapat memiliki ukuran yang berbeda.

Kriteria Fisher didefinisikan dalam urutan berikut.

1. Temukan kriteria Fisher F menggunakan rumus


di mana , adalah varian dari sampel yang dibandingkan.

Ketentuan kriteria Fisher mengatur hal itu di dalam pembilang rumus F ada dispersi yang besar, yaitu angka F selalu lebih besar dari satu.

Kami menetapkan keandalan perhitungan: P = 0,95 - dan menentukan jumlah derajat kebebasan untuk kedua sampel: k 1 = n 1 - 1, k 2 = n 2 - 1.

Dengan menggunakan tabel pada Lampiran 4, kita mencari nilai batas kriteria F gr.

Perbandingan kriteria F dan F gr memungkinkan kita untuk merumuskan kesimpulan:

jika F > F gr, maka perbedaan antar sampel signifikan secara statistik;

jika F< F гр, то различие между выборками статически недо­стоверно.

Mari kita beri contoh spesifik.

Contoh 2.15. Mari kita analisa dua kelompok pemain bola tangan: x saya (n 1= 16 orang) dan yi (n 2 = 18 orang). Kelompok atlet ini dipelajari waktu take-off pada saat melempar bola ke gawang.

Apakah indikator tolakan memiliki tipe yang sama?

Data awal dan perhitungan dasar disajikan pada tabel. 2.32 dan 2.33.

Tabel 2.32

Pengolahan indikator tolakan pemain bola tangan kelompok pertama


Mari kita definisikan kriteria Fisher:





Berdasarkan data yang disajikan pada tabel di Lampiran 6, kita menemukan Fgr: Fgr = 2.4

Mari kita perhatikan fakta bahwa tabel pada Lampiran 6 mencantumkan jumlah derajat kebebasan dispersi yang lebih besar dan lebih kecil ketika mendekati angka besar menjadi lebih kasar. Jadi, jumlah derajat kebebasan dispersi yang lebih besar mengikuti urutan ini: 8, 9, 10, 11, 12, 14, 16, 20, 24, dst., dan yang lebih kecil - 28, 29, 30, 40 , 50, dst.

Hal ini dijelaskan oleh fakta bahwa seiring bertambahnya ukuran sampel, perbedaan uji F berkurang dan dimungkinkan untuk menggunakan nilai tabel yang mendekati data asli. Jadi, pada contoh 2.15 =17 tidak ada dan kita dapat mengambil nilai yang paling dekat dengannya k = 16, dari situ kita memperoleh Fgr = 2.4.

Inferensi statistik. Karena uji Fisher F= 2.5 > F= 2.4, sampel dapat dibedakan secara statistik.

Kesimpulan pedagogis. Nilai waktu take-off (s) saat melempar bola ke gawang bagi pemain bola tangan kedua kelompok berbeda secara signifikan. Kelompok-kelompok ini harus dianggap berbeda.

Penelitian lebih lanjut harus mengungkap alasan perbedaan ini.

Contoh 2.20.(pada keandalan statistik sampel ). Apakah kualifikasi pemain sepak bola meningkat jika waktu mulai dari memberi isyarat hingga menendang bola pada awal latihan adalah x i , dan pada akhirnya y i .

Data awal dan perhitungan dasar diberikan dalam tabel. 2.40 dan 2.41.

Tabel 2.40

Indikator waktu pemrosesan mulai dari pemberian sinyal hingga memukul bola di awal latihan


Mari kita tentukan perbedaan antara kelompok indikator dengan menggunakan kriteria Siswa:

Dengan reliabilitas P = 0,95 dan derajat kebebasan k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42, menggunakan tabel pada Lampiran 4 kita temukan t gr= 2,02. Karena t = 8,3 > t gr= 2,02 - perbedaannya signifikan secara statistik.

Mari kita tentukan perbedaan antara kelompok indikator dengan menggunakan kriteria Fisher:


Berdasarkan tabel pada Lampiran 2, dengan reliabilitas P = 0,95 dan derajat kebebasan k = 22-1 = 21, maka nilai F gr = 21. Karena F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Inferensi statistik. Berdasarkan rata-rata aritmatika, perbedaan antar kelompok indikator signifikan secara statistik. Dari segi sebaran (dispersi), perbedaan antar kelompok indikator secara statistik tidak dapat diandalkan.

Kesimpulan pedagogis. Kualifikasi pemain sepak bola telah meningkat secara signifikan, namun perhatian harus diberikan pada stabilitas kesaksiannya.

Mempersiapkan pekerjaan

Sebelum melakukan pekerjaan laboratorium ini pada disiplin ilmu “Metrologi Olahraga” kepada semua siswa belajar kelompok perlu dibentuk tim kerja yang masing-masing terdiri dari 3-4 siswa, untuk bersama-sama menyelesaikan tugas pekerjaan seluruh pekerjaan laboratorium.

Dalam persiapan untuk bekerja baca bagian yang relevan dari literatur yang direkomendasikan (lihat bagian 6 dari data instruksi metodologis) dan catatan kuliah. Pelajarilah bagian 1 dan 2 untuk pekerjaan laboratorium ini, serta tugas kerjanya (bagian 4).

Siapkan formulir laporan pada lembar standar kertas tulis ukuran A4 dan mengisinya dengan bahan-bahan yang diperlukan untuk pekerjaan itu.

Laporan tersebut harus memuat :

Judul Halaman menunjukkan jurusan (UC dan TR), kelompok belajar, nama belakang, nama depan, patronimik mahasiswa, nomor dan judul pekerjaan laboratorium, tanggal penyelesaian, serta nama belakang, gelar akademis, gelar akademik dan jabatan guru yang menerima pekerjaan itu;

Tujuan pekerjaan;

Rumus dengan nilai numerik yang menjelaskan hasil perhitungan antara dan akhir;

Tabel nilai yang diukur dan dihitung;

Diperlukan oleh tugas materi grafis;

Kesimpulan singkat tentang hasil setiap tahapan penugasan pekerjaan dan pekerjaan yang dilakukan secara umum.

Semua grafik dan tabel digambar dengan cermat menggunakan alat gambar. Simbol grafis dan huruf konvensional harus mematuhi standar negara. Penyusunan laporan diperbolehkan dengan menggunakan teknologi komputer.

Tugas kerja

Sebelum melakukan seluruh pengukuran, setiap anggota tim harus mempelajari aturan penggunaan pakaian olahraga. Permainan dart, diberikan dalam Lampiran 7, yang diperlukan untuk melaksanakan tahapan penelitian berikut.

Penelitian tahap I“Penelitian tentang hasil mencapai target permainan olahraga Panahan oleh masing-masing anggota tim untuk memenuhi hukum distribusi normal menurut kriteria χ 2 Pearson dan kriteria tiga sigma"

1. mengukur (menguji) kecepatan (pribadi) dan koordinasi tindakan Anda, dengan melempar anak panah sebanyak 30-40 kali pada sasaran berbentuk lingkaran dalam permainan olah raga Darts.

2. Hasil pengukuran (tes) x saya(dalam gelas) rumuskan dalam bentuk deret variasi dan masukkan ke dalam tabel 4.1 (kolom, lengkapi semua perhitungan yang diperlukan, isi tabel-tabel yang diperlukan dan tarik kesimpulan yang sesuai tentang kesesuaian distribusi empiris yang dihasilkan dengan hukum distribusi normal, dengan analogi dengan perhitungan serupa, tabel dan kesimpulan dari contoh 2.12, yang diberikan pada bagian 2 pedoman ini di halaman 7 -10.

Tabel 4.1

Kesesuaian kecepatan dan koordinasi tindakan subjek dengan hukum distribusi normal

TIDAK. bulat
Total

II – tahap penelitian

“Penilaian rata-rata indikator populasi umum mengenai sasaran permainan olah raga Dart seluruh siswa kelompok belajar berdasarkan hasil pengukuran anggota satu tim”

Menilai rata-rata indikator kecepatan dan koordinasi tindakan seluruh siswa dalam kelompok belajar (sesuai daftar kelompok belajar pada majalah kelas) berdasarkan hasil pencapaian sasaran permainan olahraga Dart seluruh anggota tim, diperoleh pada tahap pertama penelitian pekerjaan laboratorium ini.

1. Dokumentasikan hasil pengukuran kecepatan dan koordinasi tindakan saat melempar dart ke sasaran melingkar dalam permainan olah raga Dart seluruh anggota tim anda (2 - 4 orang), yang mewakili sampel hasil pengukuran dari populasi umum (hasil pengukuran seluruh siswa dalam suatu kelompok belajar - misalnya, 15 orang), isikan pada kolom kedua dan ketiga Tabel 4.2.

Tabel 4.2

Memproses indikator kecepatan dan koordinasi tindakan

anggota brigade

TIDAK.
Total

Pada tabel 4.2 dibawah harus dipahami , skor rata-rata yang cocok (lihat hasil perhitungan pada Tabel 4.1) anggota tim Anda ( , diperoleh pada penelitian tahap pertama. Perlu dicatat bahwa, biasanya, Tabel 4.2 memuat nilai rata-rata hitung hasil pengukuran yang diperoleh salah satu anggota tim pada penelitian tahap pertama , karena kemungkinan hasil pengukuran anggota tim yang berbeda akan sama sangat kecil. Kemudian, sebagai aturan, nilai-nilai di kolom Tabel 4.2 untuk setiap baris - sama dengan 1, A di baris “Jumlah "kolom" ", ditulis jumlah anggota tim Anda.

2. Lakukan semua perhitungan yang diperlukan untuk mengisi tabel 4.2, serta perhitungan dan kesimpulan lain yang serupa dengan perhitungan dan kesimpulan contoh 2.13 yang diberikan pada bagian ke-2 pengembangan metodologi ini di halaman 13-14. Hal ini harus diingat ketika menghitung kesalahan keterwakilan "M" perlu menggunakan rumus 2.4 yang diberikan pada halaman 13 pengembangan metodologi ini, karena sampelnya kecil (n, dan diketahui jumlah elemen populasi umum N, dan sama dengan jumlah siswa dalam kelompok belajar, sesuai dengan daftar jurnal kelompok belajar.

III – tahap penelitian

Evaluasi efektivitas pemanasan menurut indikator “Kecepatan dan koordinasi tindakan” oleh masing-masing anggota tim menggunakan uji-t Student

Untuk mengevaluasi efektivitas pemanasan lempar dart pada sasaran permainan olah raga “Darts”, yang dilakukan pada penelitian tahap pertama pekerjaan laboratorium ini, oleh setiap anggota tim sesuai dengan indikator “Kecepatan dan koordinasi tindakan", menggunakan kriteria Student - kriteria parametrik untuk keandalan statistik dari hukum distribusi empiris ke hukum distribusi normal .

… Total

2. varians dan RMS , hasil pengukuran indikator “Kecepatan dan koordinasi tindakan” berdasarkan hasil pemanasan, diberikan pada tabel 4.3, (lihat perhitungan serupa yang diberikan segera setelah tabel 2.30 dari contoh 2.14 di halaman 16 pengembangan metodologi ini).

3. Setiap anggota tim kerja mengukur (menguji) kecepatan (pribadi) dan koordinasi tindakan Anda setelah pemanasan,

… Total

5. Lakukan perhitungan rata-rata varians dan RMS ,hasil pengukuran indikator “Kecepatan dan koordinasi tindakan” setelah pemanasan, diberikan pada tabel 4.4, tuliskan hasil pengukuran keseluruhan berdasarkan hasil pemanasan (lihat perhitungan serupa yang diberikan segera setelah tabel 2.31 dari contoh 2.14 di halaman 17 pengembangan metodologi ini).

6. Lakukan semua perhitungan dan kesimpulan yang diperlukan serupa dengan perhitungan dan kesimpulan dari contoh 2.14 yang diberikan pada bagian ke-2 pengembangan metodologi ini di halaman 16-17. Hal ini harus diingat ketika menghitung kesalahan keterwakilan "M" perlu menggunakan rumus 2.1 yang diberikan pada halaman 12 pengembangan metodologi ini, karena sampelnya adalah n dan jumlah elemen dalam populasi N ( tidak diketahui.

IV – tahap penelitian

Penilaian keseragaman (stabilitas) indikator “Kecepatan dan koordinasi tindakan” dua anggota tim menggunakan kriteria Fisher

Menilai keseragaman (stabilitas) indikator “Kecepatan dan koordinasi tindakan” dua anggota tim dengan menggunakan kriteria Fisher, berdasarkan hasil pengukuran yang diperoleh pada penelitian tahap ketiga di laboratorium ini.

Untuk melakukan ini, Anda perlu melakukan hal berikut.

Dengan menggunakan data tabel 4.3 dan 4.4, hasil penghitungan varians dari tabel tersebut diperoleh pada penelitian tahap ketiga, serta metodologi penghitungan dan penerapan kriteria Fisher untuk menilai keseragaman (stabilitas) indikator olahraga, diberikan pada contoh 2.15 di halaman 18-19 pengembangan metodologi ini, buatlah kesimpulan statistik dan pedagogis yang sesuai.

V – tahap penelitian

Penilaian kelompok indikator “Kecepatan dan koordinasi tindakan” salah satu anggota tim sebelum dan sesudah pemanasan

Baru-baru ini, Vladimir Davydov menulis postingan di facebook tentang pengujian A/B atau MVT, yang menimbulkan banyak pertanyaan.

Biasanya, melakukan pengujian A/B atau MVT pada website adalah hal yang sangat sulit. Meskipun bagi “pendarat” hal ini tampak mendasar, karena “ini sama saja, ada program khusus, pertunjukan.”

Jika Anda memutuskan untuk menguji konten web, ingatlah:

1. Pertama, Anda perlu mengisolasi audiens dengan ukuran yang setara, dan kualitas yang setara. Lakukan tes A/A. Sebagian besar tes yang dilakukan oleh agen online atau internet marketer yang tidak berpengalaman salah. Justru karena konten tersebut diuji pada audiens yang berbeda.

2. Melakukan lusinan atau lebih baik lagi ratusan pengujian selama beberapa bulan. Tidak ada gunanya menguji 2-3 versi halaman selama seminggu.

3. Ingatlah bahwa Anda juga dapat menguji dalam format MVT (yaitu banyak pilihan), dan bukan hanya A dan B.

4. Analisis statistik array data dengan hasil tes (Excel baik-baik saja, Anda juga dapat menggunakan SPSS). Apakah hasilnya berada dalam batas kesalahan, seberapa besar penyimpangannya, dan bagaimana ketergantungannya terhadap waktu? Jika, misalnya, pada poin pertama pengujian A/A Anda menerima deviasi yang kuat antara satu opsi dengan opsi lainnya, ini merupakan kegagalan, dan Anda tidak dapat menguji lebih lanjut.

5. Tidak perlu menguji semuanya. Ini bukan hiburan (kecuali Anda benar-benar tidak punya pekerjaan lain). Masuk akal untuk menguji hanya apa, dari sudut pandang analisis pemasaran dan bisnis, yang dapat memberikan hasil yang nyata. Dan juga sesuatu yang hasilnya dapat diukur. Misalnya, Anda memutuskan untuk meningkatkan ukuran font di situs web, menguji halaman dengan font yang lebih besar selama beberapa minggu - penjualan meningkat. Apa artinya ini? Itu bukan apa-apa bagi saya (lihat paragraf sebelumnya).

6. Seluruh jalur perlu diuji. Artinya, tidak cukup hanya mengambil dan menguji halaman pembelian (atau beberapa tindakan di situs) - Anda perlu menguji halaman tersebut dan langkah-langkah yang mengarah ke halaman konversi akhir ini.

Pertanyaannya ditanyakan di komentar:

“Bagaimana cara menentukan pemenangnya? Di sini kami menguji judul pada halaman yang menjual “langsung”. Berapa perbedaan konversi yang harus ada antara A dan B untuk menyatakan pemenang?

jawaban Vladimir:

Pertama, Anda perlu melakukan eksperimen terisolasi jangka panjang (aturan dasar dari setiap evaluasi statistik). Kedua, semuanya pasti bermuara pada statistik dan matematika (itulah sebabnya saya merekomendasikan excel dan spss atau analog gratisnya) Kita perlu menghitung probabilitas keyakinan bahwa perbedaan nilai memiliki arti. Makan artikel yang bagus(satu dari banyak). Di sana mereka mengambil transaksi dari GA berdasarkan tes Optimizelyhttps://www.distilled.net/uploads/ga_transactions.png , bandingkan transaksi (pembelian) dengan distribusi lonceng biasa dan lihat apakah rata-ratanya berada dalam kisaran tersebut interval kepercayaan kesalahanhttps://www.distilled.net/uploads/t-test_tool.png

Apakah Anda ingin menerima tawaran dari kami?

Mulai kerja sama

Peran Signifikansi Statistik dalam Meningkatkan Konversi: 6 Hal yang Perlu Anda Ketahui

1. Apa sebenarnya maksudnya

“Perubahan ini memungkinkan kami mencapai peningkatan konversi sebesar 20% dengan tingkat kepercayaan 90%.” Sayangnya, pernyataan ini sama sekali tidak setara dengan pernyataan lain yang sangat mirip: “Peluang meningkatkan konversi sebesar 20% adalah 90%.” Jadi sebenarnya tentang apa ini?

20% merupakan peningkatan yang kami catat berdasarkan hasil pengujian pada salah satu sampel. Jika kita mulai berfantasi dan berspekulasi, kita mungkin membayangkan bahwa pertumbuhan ini dapat bertahan secara permanen—jika kita terus melakukan pengujian tanpa batas waktu. Namun ini tidak berarti bahwa dengan probabilitas 90% kita akan mendapatkan peningkatan konversi sebesar dua puluh persen, atau peningkatan “setidaknya” 20%, atau “kira-kira” 20%.


90% adalah kemungkinan terjadinya perubahan konversi. Dengan kata lain, jika kita menjalankan sepuluh pengujian A/B untuk mendapatkan hasil ini, dan memutuskan untuk menjalankan kesepuluh pengujian tersebut tanpa batas waktu, maka salah satunya (karena kemungkinan perubahan adalah 90%, maka 10% tetap untuk hasil yang tidak berubah) akan mungkin , pada akhirnya akan membawa hasil “pasca-tes” mendekati konversi aslinya – yaitu, tanpa perubahan. Dari sembilan tes yang tersisa, beberapa menunjukkan peningkatan kurang dari 20%. Di negara lain, hasilnya bisa melebihi standar ini.

Jika kami salah menafsirkan data ini, kami mengambil risiko besar dengan “meluncurkan” pengujian tersebut. Sangat mudah untuk merasa bersemangat ketika sebuah tes menunjukkan tingkat konversi yang tinggi dengan tingkat kepercayaan 95%, namun sebaiknya jangan berharap terlalu banyak sampai tes tersebut mencapai kesimpulan logisnya.

2. Kapan digunakan

Kandidat yang paling jelas adalah pengujian split A/B, tetapi ini bukan satu-satunya. Anda juga dapat menguji perbedaan yang signifikan secara statistik antara segmen (misalnya, kunjungan dari penelusuran organik versus penelusuran berbayar) atau jangka waktu (misalnya, April 2013 dan April 2014).

Namun perlu dicatat bahwa korelasi ini tidak berarti hubungan sebab akibat. Saat kami menjalankan pengujian terpisah, kami tahu bahwa kami dapat mengatribusikan perubahan apa pun pada hasil ke elemen yang membedakan halaman - karena Perhatian khusus kehati-hatian diberikan untuk memastikan bahwa halaman-halaman lainnya benar-benar identik. Jika Anda membandingkan grup seperti pengunjung yang berasal dari penelusuran organik dan berbayar, faktor lain dapat ikut berperan - misalnya, dari penelusuran organik mungkin terdapat banyak kunjungan pada malam hari, dan rasio konversi di antara pengunjung yang menginap semalam cukup tinggi. Uji signifikansi dapat membantu menentukan apakah ada alasan untuk suatu perubahan, namun tes tersebut tidak dapat menentukan apa alasannya.

3. Cara menguji perubahan rasio konversi, rasio pentalan, dan rasio keluar

Saat kita melihat “indikator”, kita sebenarnya melihat rata-rata variabel biner—seseorang menyelesaikan tindakan target atau tidak. Jika kita memiliki sampel 10 orang dengan tingkat konversi 40%, sebenarnya kita akan melihat tabel seperti ini:

Kita memerlukan tabel ini, beserta rata-ratanya, untuk menghitung deviasi standar, yang merupakan komponen kunci signifikansi statistik. Namun, fakta bahwa setiap nilai dalam tabel adalah nol atau satu memudahkan kita - kita dapat menghindari keharusan menyalin daftar angka yang sangat banyak dengan menggunakan kalkulator keyakinan uji A/B, dan mulai dari mengetahui rata-ratanya. dan ukuran sampel. Ini adalah alat dari KissMetrics.

(Penting! Alat ini hanya memperhitungkan satu sisi distribusi probabilitas dalam penghitungannya. Untuk menggunakan kedua sisi dan mengubah hasilnya menjadi signifikansi dua sisi, Anda perlu menggandakan jarak dari 100% - misalnya, satu sisi 95 % menjadi dua sisi 90%).

Meskipun deskripsinya menyatakan “Alat validitas pengujian A/B”, ini juga dapat digunakan untuk perbandingan metrik lainnya—cukup ganti konversi dengan rasio pentalan atau keluar. Selain itu, dapat digunakan untuk membandingkan segmen atau periode waktu - perhitungannya akan sama.

Selain itu, ini sangat cocok untuk pengujian multivarian (MVT) - cukup bandingkan setiap perubahan satu per satu dengan aslinya.

4. Cara menguji perubahan rata-rata tagihan

Untuk menguji rata-rata variabel non-biner, kita memerlukan kumpulan data lengkap, sehingga segalanya menjadi sedikit lebih rumit di sini. Misalnya, kami ingin menentukan apakah terdapat perbedaan yang signifikan dalam nilai pesanan rata-rata untuk pengujian pemisahan A/B - poin ini sering kali diabaikan dalam pengoptimalan konversi, meskipun untuk indikator bisnis, hal ini sama pentingnya dengan konversi itu sendiri.

Hal pertama yang kita perlukan adalah mendapatkan dari Google Analytics daftar lengkap transaksi untuk setiap opsi pengujian - untuk A dan B (dulu, menjadi). Cara paling sederhana Cara melakukannya adalah dengan membuat segmen khusus berdasarkan variabel khusus untuk pengujian terpisah Anda, lalu mengekspor laporan transaksi ke spreadsheet Excel. Pastikan semua transaksi disertakan di sana, bukan hanya 10 baris default.

Jika Anda memiliki dua daftar transaksi, Anda dapat menyalinnya ke alat seperti ini:

Dalam kasus di atas, kami tidak memiliki tingkat kepercayaan pada tingkat yang dipilih sebesar 95%. Faktanya, jika kita melihat skor-p di atas grafik terbawah 0,63, jelas bahwa kita bahkan tidak memiliki signifikansi 50% - ada kemungkinan 63% bahwa perbedaan antara skor halaman murni karena kebetulan.

5. Cara memprediksi durasi pengujian split A/B yang diperlukan

Evanmiller.org memiliki alat praktis lainnya untuk pengoptimalan konversi: kalkulator ukuran sampel.

Alat ini memungkinkan Anda menjawab pertanyaan “Berapa lama waktu yang dibutuhkan untuk mendapatkan hasil tes yang andal?”, dan jawaban ini tidak pantas untuk ditebak.

Ada beberapa hal yang perlu diperhatikan. Pertama, alat ini memiliki saklar absolut/relatif - jika Anda ingin mengetahui perbedaan antara tingkat konversi dasar sebesar 5% dan tingkat konversi variabel sebesar 6%, maka akan menjadi 1% absolut (6-5=1) atau 20 % secara relatif (6/5=1.2). Kedua, di bagian bawah halaman ada dua “slider”. Yang lebih rendah bertanggung jawab atas tingkat signifikansi yang diperlukan - jika tujuan Anda adalah mencapai signifikansi 95%, maka penggeser harus disetel ke 5%. Penggeser atas menunjukkan kemungkinan bahwa jumlah kunjungan yang diperlukan ke suatu laman akan mencukupi - misalnya, jika Anda ingin mengetahui jumlah kunjungan yang diperlukan untuk mencapai peluang delapan puluh persen untuk menemukan signifikansi 95%, atur penggeser atas ke 80% dan penggeser bawah menjadi 5%.

6. Apa yang tidak boleh dilakukan

Ada beberapa cara sederhana untuk mengidentifikasi ketidaksesuaian tes terpisah, namun tidak selalu terlihat jelas pada pandangan pertama:

A) Pengujian terpisah dari nilai ordinal non-biner

Misalnya, tujuan Anda adalah mencari tahu apakah perbedaan yang signifikan kemungkinan pengunjung dari kelompok “awal” dan “setelah perubahan” akan membeli produk tertentu. Anda memberi label pada ketiga produk "1", "2" dan "3" dan kemudian memasukkan nilai-nilai ini ke dalam bidang uji signifikansi. Sayangnya, pendekatan ini tidak akan berhasil—produk 2 bukanlah rata-rata produk 1 dan 3.

B) Pengaturan distribusi lalu lintas

Di awal pengujian, Anda memutuskan untuk tidak mengambil risiko dan mengatur distribusi lalu lintas ke 90/10. Setelah beberapa waktu, Anda melihat bahwa perubahan tersebut tidak menyebabkan perubahan nyata dalam konversi, dan Anda memindahkan penggeser ke 50/50. Namun pengunjung yang kembali masih termasuk dalam grup aslinya, sehingga Anda akan berada pada situasi di mana versi "pra-perubahan" memiliki proporsi pengunjung kembali yang lebih tinggi yang menunjukkan kemungkinan tinggi untuk melakukan konversi. Segalanya menjadi rumit dengan sangat cepat, dan satu-satunya cara sederhana untuk mendapatkan data yang dapat Anda andalkan adalah dengan melihat pengunjung baru dan pengunjung kembali secara terpisah. Namun, dalam hal ini akan memakan waktu lebih lama untuk memperoleh hasil yang berarti. Dan meskipun kedua subkelompok muncul hasil yang signifikan, bagaimana jika salah satunya justru menghasilkan lebih banyak pengunjung kembali? Secara umum, tidak perlu melakukan ini dan mengubah distribusi lalu lintas selama pengujian.

B) Perencanaan

Tampaknya jelas, namun jangan bandingkan data yang dikumpulkan pada waktu yang sama dengan data yang dikumpulkan pada siang hari atau waktu lain dalam sehari. Jika Anda ingin menguji pada waktu tertentu, Anda memiliki dua opsi.

1. Tangani permintaan pengunjung sepanjang hari seperti biasa, tetapi tunjukkan kepada mereka versi asli halaman tersebut pada waktu yang tidak Anda minati.

2. Bandingkan apel dengan apel – Jika Anda hanya melihat data perubahan pada paruh pertama hari itu, bandingkan dengan data asli pada paruh pertama hari itu.

Saya harap beberapa hal di atas bermanfaat bagi Anda dalam mengoptimalkan tingkat konversi Anda. Jika Anda memiliki pengetahuan sendiri, silakan bagikan di komentar.

KEANDALAN STATISTIK

- Bahasa inggris kredibilitas/validitas, statistik; Jerman Validitas, statistik. Konsistensi, objektivitas dan kurangnya ambiguitas dalam uji statistik atau q.l. serangkaian pengukuran. D.s. dapat diuji dengan mengulangi tes (atau kuesioner) yang sama pada subjek yang sama untuk melihat apakah diperoleh hasil yang sama; atau dengan membandingkan bagian-bagian berbeda dari suatu tes yang seharusnya mengukur objek yang sama.

Antinazi. Ensiklopedia Sosiologi, 2009

Lihat apa itu “Keandalan Statistik” di kamus lain:

    KEANDALAN STATISTIK- Bahasa inggris kredibilitas/validitas, statistik; Jerman Validitas, statistik. Konsistensi, objektivitas dan kurangnya ambiguitas dalam uji statistik atau q.l. serangkaian pengukuran. D.s. dapat diverifikasi dengan mengulangi tes yang sama (atau... Kamus dalam Sosiologi

    Dalam statistika, suatu nilai disebut signifikan secara statistik jika peluang kemunculannya secara kebetulan atau bahkan nilai yang lebih ekstrem rendah. Di sini, yang kami maksud secara ekstrim adalah tingkat penyimpangan statistik uji dari hipotesis nol. Perbedaannya disebut... ... Wikipedia

    Fenomena fisik stabilitas statistik adalah seiring bertambahnya ukuran sampel, frekuensi kejadian acak atau nilai rata-rata kuantitas fisik cenderung ke suatu bilangan tetap. Fenomena statistik... ... Wikipedia

    KEANDALAN PERBEDAAN (Kesamaan)- prosedur statistik analitik untuk menetapkan tingkat signifikansi perbedaan atau persamaan antar sampel menurut indikator (variabel) yang dipelajari ... Modern proses pendidikan: konsep dan istilah dasar

    PELAPORAN, STATISTIK Kamus Akuntansi Hebat

    PELAPORAN, STATISTIK- suatu bentuk pengamatan statistik negara, di mana otoritas terkait menerima informasi yang mereka butuhkan dari perusahaan (organisasi dan lembaga) dalam bentuk dokumen pelaporan yang ditetapkan secara hukum ( laporan statistik) di belakang … Kamus ekonomi besar

    Ilmu yang mempelajari teknik pengamatan sistematis terhadap fenomena massa kehidupan sosial manusia, menyusun deskripsi numeriknya dan memproses deskripsi tersebut secara ilmiah. Jadi, statistika teoretis adalah ilmu... ... kamus ensiklopedis F. Brockhaus dan I.A. Efron

    Koefisien korelasi- (Koefisien korelasi) Koefisien korelasi merupakan indikator statistik ketergantungan dua variabel acak Pengertian Koefisien Korelasi, Jenis Koefisien Korelasi, Sifat Koefisien Korelasi, Perhitungan dan Penerapannya... ... Ensiklopedia Investor

    Statistik- (Statistik) Statistika adalah ilmu teoritis umum yang mempelajari perubahan kuantitatif dalam fenomena dan proses. Statistik negara bagian, layanan statistik, Rosstat (Goskomstat), data statistik, statistik permintaan, statistik penjualan,... ... Ensiklopedia Investor

    Korelasi- (Korelasi) Korelasi adalah hubungan statistik antara dua atau lebih variabel acak Konsep korelasi, jenis korelasi, koefisien korelasi, analisis korelasi, korelasi harga, korelasi pasangan mata uang tentang Isi Forex... ... Ensiklopedia Investor

Buku

  • Penelitian dalam matematika dan matematika dalam penelitian: Koleksi metodologis kegiatan penelitian siswa, Borzenko V.I.. Koleksinya menyajikan perkembangan metodologis, berlaku dalam penyelenggaraan kegiatan penelitian mahasiswa. Bagian pertama dari koleksi ini dikhususkan untuk penerapan pendekatan penelitian di...

Signifikansi statistik atau signifikansi tingkat p adalah hasil utama pengujian

hipotesis statistik. Dalam istilah teknis, ini adalah kemungkinan menerima sesuatu

hasil penelitian sampel, asalkan memang untuk umum

Secara keseluruhan, hipotesis statistik nol benar - yaitu, tidak ada hubungan. Dengan kata lain, ini

probabilitas bahwa hubungan yang terdeteksi adalah acak dan bukan properti

keseluruhan. Ini adalah signifikansi statistik, yaitu tingkat signifikansi p

penilaian kuantitatif keandalan komunikasi: semakin rendah probabilitas ini, semakin dapat diandalkan koneksinya.

Misalkan ketika dua mean sampel dibandingkan, diperoleh nilai level

signifikansi statistik p = 0,05. Artinya menguji hipotesis statistik tentang

kesetaraan mean dalam populasi menunjukkan bahwa jika benar, maka probabilitasnya

Kemunculan acak dari perbedaan yang terdeteksi tidak lebih dari 5%. Dengan kata lain, jika

dua sampel diambil berulang kali dari populasi yang sama, lalu dalam 1 sampel

20 kasus akan mengungkapkan perbedaan yang sama atau lebih besar antara rata-rata sampel ini.

Artinya, terdapat kemungkinan 5% bahwa perbedaan yang ditemukan disebabkan oleh kebetulan.

karakter, dan bukan merupakan properti dari agregat.

Dalam suatu hubungan hipotesis ilmiah tingkat signifikansi statistik adalah kuantitatif

indikator derajat ketidakpercayaan terhadap kesimpulan tentang adanya hubungan, dihitung dari hasil

selektif, pengujian empiris terhadap hipotesis ini. Bagaimana nilainya lebih sedikit level-p, semakin tinggi

signifikansi statistik dari suatu hasil penelitian yang membenarkan hipotesis ilmiah.

Penting untuk mengetahui apa yang mempengaruhi tingkat signifikansi. Tingkat signifikansi, semua hal lain dianggap sama

kondisinya lebih tinggi (nilai tingkat p lebih rendah) jika:

Besarnya keterhubungan (perbedaan) semakin besar;

Variabilitas sifat-sifatnya lebih sedikit;

Ukuran sampelnya lebih besar.

Sepihak Uji signifikansi dua sisi

Jika tujuan penelitian adalah untuk mengidentifikasi perbedaan dua parameter umum

agregat yang sesuai dengan variasinya kondisi alam (kondisi hidup,

usia subjek, dll.), maka sering kali tidak diketahui parameter mana yang lebih besar, dan

Yang mana yang lebih kecil?

Misalnya, jika Anda tertarik pada variabilitas hasil tes dan

kelompok eksperimen, maka, sebagai suatu peraturan, tidak ada kepercayaan terhadap tanda perbedaan varians atau

deviasi standar dari hasil yang digunakan untuk menilai variabilitas. Pada kasus ini

hipotesis nolnya adalah variansnya sama, dan tujuan penelitiannya adalah sama

buktikan sebaliknya, yaitu. adanya perbedaan antar varians. Hal itu diperbolehkan

perbedaannya bisa berupa tanda apa pun. Hipotesis seperti ini disebut hipotesis dua sisi.

Namun terkadang tantangannya adalah membuktikan kenaikan atau penurunan suatu parameter;

misalnya rata-rata hasil pada kelompok eksperimen lebih tinggi dibandingkan kelompok kontrol. Di mana

Tidak diperkenankan lagi bahwa perbedaan itu boleh-boleh saja berbeda tandanya. Hipotesis seperti ini disebut

Berat sebelah.

Uji signifikansi yang digunakan untuk menguji hipotesis dua sisi disebut

Dua sisi, dan untuk satu sisi - unilateral.

Timbul pertanyaan mengenai kriteria mana yang harus dipilih dalam kasus tertentu. Menjawab

Pertanyaan ini tidak formal metode statistik dan sepenuhnya

Tergantung pada tujuan penelitian. Dalam situasi apa pun Anda tidak boleh memilih satu atau kriteria lain setelahnya

Melakukan eksperimen berdasarkan analisis data eksperimen, sebagaimana adanya

Mengarah pada kesimpulan yang salah. Jika sebelum melakukan percobaan diasumsikan terdapat perbedaan

Parameter yang dibandingkan bisa positif atau negatif, maka Anda harus melakukannya

Hipotesis diuji dengan menggunakan analisis statistik. Signifikansi statistik ditemukan dengan menggunakan nilai P, yang sesuai dengan probabilitas suatu peristiwa tertentu dengan asumsi bahwa beberapa pernyataan (hipotesis nol) benar. Jika nilai P kurang dari tingkat signifikansi statistik yang ditentukan (biasanya 0,05), pelaku eksperimen dapat dengan aman menyimpulkan bahwa hipotesis nol salah dan melanjutkan untuk mempertimbangkan hipotesis alternatif. Dengan menggunakan uji t Student, Anda dapat menghitung nilai P dan menentukan signifikansi untuk dua kumpulan data.

Langkah

Bagian 1

Menyiapkan eksperimen

    Tentukan hipotesis Anda. Langkah pertama dalam menilai signifikansi statistik adalah memilih pertanyaan yang ingin Anda jawab dan merumuskan hipotesis. Hipotesis adalah pernyataan tentang data eksperimen, sebaran dan sifat-sifatnya. Untuk eksperimen apa pun, terdapat hipotesis nol dan hipotesis alternatif. Secara umum, Anda harus membandingkan dua kumpulan data untuk menentukan apakah keduanya serupa atau berbeda.

    • Hipotesis nol (H 0) biasanya menyatakan bahwa tidak ada perbedaan antara dua kumpulan data. Misalnya: siswa yang membaca materi sebelum kelas tidak mendapat nilai lebih tinggi.
    • Hipotesis alternatif (H a) merupakan kebalikan dari hipotesis nol dan merupakan pernyataan yang perlu didukung oleh data eksperimen. Misalnya: siswa yang membaca materi sebelum kelas mendapat nilai lebih tinggi.
  1. Tetapkan tingkat signifikansi untuk menentukan seberapa besar perbedaan distribusi data dari normal agar dapat dianggap sebagai hasil yang signifikan. Tingkat signifikansi (juga disebut α (\gaya tampilan \alfa )-level) adalah ambang batas yang Anda tetapkan untuk signifikansi statistik. Jika nilai P kurang dari atau sama dengan tingkat signifikansi, maka data tersebut dianggap signifikan secara statistik.

    • Sebagai aturan, tingkat signifikansi (nilai α (\gaya tampilan \alfa )) diambil sebesar 0,05, dalam hal ini kemungkinan mendeteksi perbedaan acak antara kumpulan data yang berbeda hanya 5%.
    • Semakin tinggi tingkat signifikansinya (dan semakin rendah nilai P-nya), semakin dapat diandalkan hasilnya.
    • Jika ingin hasil yang lebih dapat diandalkan, turunkan nilai P menjadi 0,01. Biasanya, nilai P yang lebih rendah digunakan dalam produksi ketika diperlukan untuk mengidentifikasi cacat pada produk. Dalam hal ini, keandalan yang tinggi diperlukan untuk memastikan seluruh bagian berfungsi sesuai harapan.
    • Untuk sebagian besar eksperimen hipotesis, tingkat signifikansi 0,05 sudah cukup.
  2. Putuskan kriteria mana yang akan Anda gunakan: satu sisi atau dua sisi. Salah satu asumsi dalam uji t Student adalah data berdistribusi normal. Distribusi normalnya berbentuk kurva lonceng dengan jumlah maksimum hasilnya berada di tengah kurva. Uji-t Student adalah metode matematis untuk menguji data yang memungkinkan Anda menentukan apakah data berada di luar distribusi normal (lebih besar, lebih kecil, atau berada di “ekor” kurva).

    • Jika Anda tidak yakin apakah data berada di atas atau di bawah nilai kelompok kontrol, gunakan uji dua sisi. Ini akan memungkinkan Anda menentukan signifikansi di kedua arah.
    • Jika Anda mengetahui ke arah mana data mungkin berada di luar distribusi normal, gunakan uji satu sisi. Pada contoh di atas, kita mengharapkan nilai siswa meningkat, sehingga tes satu sisi dapat digunakan.
  3. Tentukan ukuran sampel menggunakan kekuatan statistik. Kekuatan statistik suatu penelitian adalah probabilitas bahwa, dengan mempertimbangkan ukuran sampel, hasil yang diharapkan akan diperoleh. Ambang batas daya umum (atau β) adalah 80%. Menganalisis kekuatan statistik tanpa data sebelumnya dapat menjadi tantangan karena memerlukan beberapa informasi tentang rata-rata yang diharapkan dalam setiap kelompok data dan standar deviasinya. Gunakan kalkulator analisis kekuatan online untuk menentukan ukuran sampel optimal untuk data Anda.

    • Biasanya, peneliti melakukan studi percontohan kecil yang menyediakan data untuk analisis kekuatan statistik dan menentukan ukuran sampel yang diperlukan untuk studi yang lebih besar dan lengkap.
    • Jika Anda tidak dapat melakukan studi percontohan, cobalah memperkirakan kemungkinan rata-rata berdasarkan literatur dan hasil orang lain. Ini dapat membantu Anda menentukan ukuran sampel yang optimal.

    Bagian 2

    Menghitung deviasi standar
    1. Tuliskan rumus simpangan baku. Standar deviasi menunjukkan seberapa besar penyebaran data. Hal ini memungkinkan Anda untuk menyimpulkan seberapa dekat data yang diperoleh dari sampel tertentu. Sekilas rumusnya terkesan cukup rumit, namun penjelasan di bawah ini akan membantu Anda memahaminya. Rumusnya sebagai berikut: s = √∑((xi – µ) 2 /(N – 1)).

      • s - standar deviasi;
      • tanda ∑ menunjukkan bahwa semua data yang diperoleh dari sampel harus dijumlahkan;
      • x i sesuai dengan nilai ke-i, yaitu hasil terpisah yang diperoleh;
      • µ adalah nilai rata-rata untuk kelompok tertentu;
      • N adalah jumlah total data dalam sampel.
    2. Temukan rata-rata di setiap kelompok. Untuk menghitung simpangan baku, Anda harus terlebih dahulu mencari mean untuk setiap kelompok belajar. Nilai rata-rata dilambangkan dengan huruf Yunani µ (mu). Untuk mencari rata-rata, cukup jumlahkan semua nilai yang dihasilkan dan bagi dengan jumlah data (ukuran sampel).

      • Misalnya, untuk mencari nilai rata-rata sekelompok siswa yang belajar sebelum kelas dimulai, pertimbangkan kumpulan data kecil. Untuk mempermudah, kami menggunakan himpunan lima titik: 90, 91, 85, 83, dan 94.
      • Mari kita jumlahkan semua nilainya: 90+91+85+83+94=443.
      • Mari kita bagi jumlah tersebut dengan banyaknya nilai, N = 5: 443/5 = 88,6.
      • Jadi, rata-rata kelompok ini adalah 88,6.
    3. Kurangi setiap nilai yang diperoleh dari rata-rata. Langkah selanjutnya adalah menghitung selisihnya (xi – µ). Untuk melakukan ini, kurangi dari yang ditemukan ukuran rata-rata setiap nilai yang diterima. Dalam contoh kita, kita perlu menemukan lima perbedaan:

      • (90 – 88.6), (91 – 88.6), (85 – 88.6), (83 – 88.6) dan (94 – 88.6).
      • Hasilnya, kita mendapatkan nilai berikut: 1.4, 2.4, -3.6, -5.6 dan 5.4.
    4. Kuadratkan setiap nilai yang diperoleh dan jumlahkan semuanya. Setiap besaran yang baru ditemukan harus dikuadratkan. Pada langkah ini semua orang akan menghilang nilai-nilai negatif. Jika setelah langkah ini Anda masih memilikinya angka negatif, yang berarti Anda lupa mengkuadratkannya.

      • Sebagai contoh, kita mendapatkan 1,96, 5,76, 12,96, 31,36, dan 29,16.
      • Kami menjumlahkan nilai yang dihasilkan: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Bagi dengan ukuran sampel dikurangi 1. Dalam rumusnya, jumlah tersebut dibagi N – 1 karena kita tidak memperhitungkan populasi umum, tetapi mengambil sampel seluruh siswa untuk evaluasi.

      • Kurangi: N – 1 = 5 – 1 = 4
      • Bagilah: 81,2/4 = 20,3
    6. Menghapus Akar pangkat dua. Setelah Anda membagi jumlah tersebut dengan ukuran sampel dikurangi satu, ambil akar kuadrat dari nilai yang ditemukan. Ini adalah langkah terakhir dalam menghitung standar deviasi. Ada program statistik yang, setelah memasukkan data awal, melakukan semua perhitungan yang diperlukan.

      • Dalam contoh kita, simpangan baku nilai siswa yang membaca materi sebelum kelas adalah s =√20.3 = 4.51.

      Bagian 3

      Tentukan signifikansinya
      1. Hitung varians antara kedua kelompok data. Sebelum langkah ini, kita melihat contoh untuk satu kelompok data saja. Jika Anda ingin membandingkan dua kelompok, Anda tentu harus mengambil data dari kedua kelompok tersebut. Hitung simpangan baku untuk kelompok data kedua, lalu temukan varians antara kedua kelompok eksperimen. Varians dihitung dengan menggunakan rumus berikut: s d = √((s 1 /N 1) + (s 2 /N 2)).

Tampilan