Ekspektasi matematis dan varians variabel acak. Varians sisa

Dalam banyak kasus, karakteristik numerik lain perlu diperkenalkan untuk mengukur derajat penyebaran, penyebaran nilai, diambil sebagai variabel acak ξ , di sekitar ekspektasi matematisnya.

Definisi. Perbedaan variabel acak ξ memanggil sebuah nomor.

= M(ξ-Mξ) 2 . (1)

Dengan kata lain, dispersi adalah ekspektasi matematis dari deviasi kuadrat nilai suatu variabel acak dari nilai rata-ratanya.

ditelepon berarti persegi deviasi

jumlah ξ .

Jika dispersi mencirikan ukuran rata-rata deviasi kuadrat ξ dari , maka bilangan tersebut dapat dianggap sebagai beberapa karakteristik rata-rata simpangan itu sendiri, lebih tepatnya besarnya | ξ-Mξ |.

Dua sifat dispersi berikut mengikuti definisi (1).

1. Varians suatu nilai konstan adalah nol. Hal ini cukup konsisten dengan makna visual penyebaran sebagai “ukuran penyebaran”.

Memang benar jika

=C, Itu Mξ = C dan itu berarti Dξ = M(C-C) 2 = M 0 = 0.

2. Saat mengalikan variabel acak ξ dengan bilangan konstan C variansnya dikalikan dengan C 2

D(Cξ) = C 2 Melakukan . (3)

Benar-benar

D(Cξ) = M(C

= M(C .

3. Rumus penghitungan varians berikut ini berlaku:

. (4)

Pembuktian rumus ini mengikuti sifat-sifat ekspektasi matematis.

Kita punya:

4. Jika nilainya ξ 1 dan ξ 2 saling bebas, maka varians dari jumlah keduanya sama dengan jumlah variansnya:

Bukti . Untuk membuktikannya, kami menggunakan sifat ekspektasi matematis. Membiarkan 1 = m 1 , 2 = m 2 lalu.

Rumus (5) telah terbukti.

Karena varians suatu variabel acak, menurut definisi, adalah ekspektasi matematis dari nilai ( -m) 2 , dimana m = Mξ, kemudian untuk menghitung variansnya dapat menggunakan rumus yang diperoleh pada §7 Bab II.

Jadi jika ξ ada DSV dengan hukum distribusi

X 1 X 2 ...
P 1 P 2 ...

maka kita akan memiliki:

. (7)

Jika ξ variabel acak kontinu dengan kepadatan distribusi hal(x), maka kita mendapatkan:

Melakukan= . (8)

Jika menggunakan rumus (4) untuk menghitung varians, maka diperoleh rumus lain, yaitu:

, (9)

jika nilainya ξ diskrit, dan

Melakukan= , (10)

Jika ξ didistribusikan dengan kepadatan P(X).

Contoh 1. Biarkan nilainya ξ terdistribusi secara merata pada segmen [ a,b]. Dengan menggunakan rumus (10) kita memperoleh:

Dapat ditunjukkan bahwa varians suatu variabel acak terdistribusi menurut hukum normal dengan kepadatan

hal(x)= , (11)

sama dengan σ 2.

Hal ini memperjelas arti parameter σ yang termasuk dalam ekspresi kepadatan (11) untuk hukum normal; σ adalah simpangan baku dari nilai ξ.

Contoh 2. Temukan varians dari variabel acak ξ , didistribusikan menurut hukum binomial.


Solusi. Menggunakan representasi ξ dalam bentuk

ξ = ξ 1 + ξ 2 + n(lihat contoh 2 §7 bab II) dan menerapkan rumus penjumlahan varians untuk besaran bebas, kita peroleh

Dξ = Dξ 1 + Dξ 2 +Dξn .

Dispersi kuantitas apa pun saya (Saya= 1,2, N) dihitung secara langsung:

Dξ saya = ​​M(ξ saya) 2 - (Mξ saya) 2 = 0 2 · Q+ 1 2 P- P 2 = P(1-P) = hal.

Akhirnya kita dapatkan

Melakukan= npq, Di mana q = 1 -P.

Mari kita hitungMSUNGGULvarians dan deviasi standar sampel. Kami juga akan menghitung varians suatu variabel acak jika distribusinya diketahui.

Mari kita pertimbangkan dulu penyebaran, Kemudian deviasi standar.

Varians sampel

Varians sampel (varians sampel,Sampelperbedaan) mencirikan penyebaran nilai dalam array relatif terhadap .

Ketiga rumus tersebut setara secara matematis.

Dari rumus pertama sudah jelas bahwa varians sampel adalah jumlah deviasi kuadrat setiap nilai dalam array dari rata-rata, dibagi dengan ukuran sampel dikurangi 1.

varians sampel fungsi DISP() digunakan, Bahasa Inggris. nama VAR, yaitu Perbedaan. Dari versi MS EXCEL 2010, disarankan untuk menggunakan analognya DISP.V(), Bahasa Inggris. nama VARS, yaitu Contoh VARIance. Selain itu, mulai versi MS EXCEL 2010, terdapat fungsi DISP.Г(), Bahasa Inggris. nama VARP, mis. VARIance Populasi, yang menghitung penyebaran Untuk populasi. Perbedaannya terletak pada penyebutnya: alih-alih n-1 seperti DISP.V(), DISP.G() hanya memiliki n pada penyebutnya. Sebelum MS EXCEL 2010, fungsi VAR() digunakan untuk menghitung varians populasi.

Varians sampel
=QUADROTCL(Sampel)/(JUMLAH(Sampel)-1)
=(SUM(Sampel)-COUNT(Sampel)*RATA-RATA(Sampel)^2)/ (COUNT(Sampel)-1)– rumus biasa
=SUM((Sampel -RATA-RATA(Sampel))^2)/ (JUMLAH(Sampel)-1) –

Varians sampel sama dengan 0, hanya jika semua nilai sama satu sama lain dan, karenanya, sama nilai rata-rata. Biasanya semakin besar nilainya varians, semakin besar penyebaran nilai dalam array.

Varians sampel adalah perkiraan poin varians distribusi variabel acak dari mana variabel itu dibuat Sampel. Tentang konstruksi interval kepercayaan saat menilai varians bisa dibaca di artikel.

Varians dari variabel acak

Menghitung penyebaran variabel acak, Anda perlu mengetahuinya.

Untuk varians variabel acak X sering dinotasikan dengan Var(X). Penyebaran sama dengan kuadrat deviasi dari mean E(X): Var(X)=E[(X-E(X)) 2 ]

penyebaran dihitung dengan rumus:

dimana x i adalah nilai yang dapat diambil oleh suatu variabel acak, dan μ adalah nilai rata-rata (), p(x) adalah peluang bahwa variabel acak tersebut akan mengambil nilai x.

Jika suatu variabel acak mempunyai , maka penyebaran dihitung dengan rumus:

Dimensi varians sesuai dengan kuadrat satuan pengukuran dari nilai aslinya. Misalnya, jika nilai dalam sampel mewakili pengukuran berat suatu bagian (dalam kg), maka dimensi variansnya adalah kg 2 . Hal ini mungkin sulit untuk ditafsirkan, sehingga untuk mengkarakterisasi penyebaran nilai, diperlukan suatu nilai yang setara akar pangkat dua dari variansdeviasi standar.

Beberapa properti varians:

Var(X+a)=Var(X), dengan X adalah variabel acak dan a adalah konstanta.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Properti dispersi ini digunakan dalam artikel tentang regresi linier.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), dengan X dan Y adalah variabel acak, Cov(X;Y) adalah kovarians dari variabel acak tersebut.

Jika variabel acak bersifat independen, maka variabel tersebut kovarians sama dengan 0, dan oleh karena itu Var(X+Y)=Var(X)+Var(Y). Sifat dispersi ini digunakan dalam derivasi.

Mari kita tunjukkan bahwa untuk besaran bebas Var(X-Y)=Var(X+Y). Memang benar, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Properti dispersi ini digunakan untuk membangun.

Contoh simpangan baku

Contoh simpangan baku adalah ukuran seberapa luas nilai-nilai yang tersebar dalam suatu sampel relatif terhadapnya.

A-priori, deviasi standar sama dengan akar kuadrat dari varians:

Deviasi standar tidak memperhitungkan besarnya nilai dalam Sampel, tetapi hanya derajat penyebaran nilai-nilai di sekitarnya rata-rata. Untuk mengilustrasikannya, mari kita berikan sebuah contoh.

Mari kita hitung simpangan baku untuk 2 sampel: (1; 5; 9) dan (1001; 1005; 1009). Dalam kedua kasus, s=4. Jelas terlihat bahwa rasio deviasi standar terhadap nilai array berbeda secara signifikan antar sampel. Untuk kasus seperti itu digunakan Koefisien variasi(Koefisien Variasi, CV) - rasio Deviasi Standar ke rata-rata hitung, dinyatakan dalam persentase.

Di MS EXCEL 2007 dan versi sebelumnya untuk perhitungan Contoh simpangan baku fungsi =STDEVAL() digunakan, bahasa Inggris. nama STDEV, mis. Deviasi Standar. Dari versi MS EXCEL 2010 disarankan menggunakan analognya =STDEV.B() , Bahasa Inggris. nama STDEV.S, mis. Contoh DEVIASI STANDAR.

Selain itu, mulai versi MS EXCEL 2010, terdapat fungsi STANDARDEV.G(), Bahasa Inggris. nama STDEV.P, mis. DEVIASI Standar Populasi, yang menghitung deviasi standar Untuk populasi. Seluruh perbedaan terletak pada penyebutnya: alih-alih n-1 seperti pada STANDARDEV.V(), STANDARDEVAL.G() hanya memiliki n pada penyebutnya.

Deviasi standar bisa juga dihitung langsung menggunakan rumus di bawah ini (lihat contoh file)
=ROOT(QUADROTCL(Sampel)/(JUMLAH(Sampel)-1))
=ROOT((SUM(Sampel)-COUNT(Sampel)*RATA-RATA(Sampel)^2)/(COUNT(Sampel)-1))

Ukuran penyebaran lainnya

Fungsi SQUADROTCL() menghitung dengan jumlah deviasi kuadrat nilai darinya rata-rata. Fungsi ini akan mengembalikan hasil yang sama seperti rumus =DISP.G( Sampel)*MEMERIKSA( Sampel) , Di mana Sampel- referensi ke rentang yang berisi larik nilai sampel(). Perhitungan pada fungsi QUADROCL() dilakukan sesuai dengan rumus:

Fungsi SROTCL() juga merupakan ukuran penyebaran kumpulan data. Fungsi SROTCL() menghitung rata-rata nilai absolut dari deviasi nilai rata-rata. Fungsi ini akan mengembalikan hasil yang sama seperti rumus =SUMPRODUK(ABS(Sampel-RATA-RATA(Sampel)))/COUNT(Sampel), Di mana Sampel- tautan ke rentang yang berisi larik nilai sampel.

Perhitungan pada fungsi SROTCL() dilakukan dengan rumus:

Varians suatu variabel acak merupakan ukuran penyebaran nilai-nilai variabel tersebut. Varians yang rendah berarti nilai-nilai tersebut mengelompok berdekatan. Sebaran yang besar menunjukkan penyebaran nilai yang kuat. Konsep varians variabel acak digunakan dalam statistik. Misalnya, jika Anda membandingkan varian dua nilai (misalnya antara pasien pria dan wanita), Anda dapat menguji signifikansi suatu variabel. Varians juga digunakan saat membuat model statistik, karena varians yang rendah dapat menjadi tanda bahwa Anda melakukan penyesuaian nilai secara berlebihan.

Langkah

Menghitung varians sampel

  1. Catat nilai sampel. Dalam kebanyakan kasus, ahli statistik hanya memiliki akses terhadap sampel populasi tertentu. Misalnya, sebagai aturan, ahli statistik tidak menganalisis biaya pemeliharaan total semua mobil di Rusia - mereka menganalisis sampel acak beberapa ribu mobil. Sampel seperti itu akan membantu menentukan harga rata-rata sebuah mobil, tetapi kemungkinan besar, nilai yang dihasilkan akan jauh dari nilai sebenarnya.

    • Misalnya, mari kita analisis jumlah roti yang terjual di sebuah kafe selama 6 hari, yang diambil secara acak. Sampelnya terlihat seperti ini: 17, 15, 23, 7, 9, 13. Ini adalah sampel, bukan populasi, karena kami tidak memiliki data roti yang terjual setiap hari kafe buka.
    • Jika Anda diberikan nilai populasi dan bukan sampel, lanjutkan ke bagian berikutnya.
  2. Tuliskan rumus untuk menghitung varians sampel. Dispersi adalah ukuran penyebaran nilai-nilai dalam besaran tertentu. Bagaimana nilai lebih dekat dispersi ke nol, semakin dekat nilai-nilai tersebut dikelompokkan satu sama lain. Saat mengerjakan sampel nilai, gunakan rumus berikut untuk menghitung varians:

    • s 2 (\gaya tampilan s^(2)) = ∑[(x saya (\gaya tampilan x_(i))- X) 2 (\gaya tampilan ^(2))] / (n - 1)
    • s 2 (\gaya tampilan s^(2))– ini adalah dispersi. Dispersi diukur dalam satuan persegi.
    • x saya (\gaya tampilan x_(i))– setiap nilai dalam sampel.
    • x saya (\gaya tampilan x_(i)) Anda perlu mengurangi x̅, mengkuadratkannya, lalu menjumlahkan hasilnya.
    • x̅ – mean sampel (rata-rata sampel).
    • n – jumlah nilai dalam sampel.
  3. Hitung mean sampel. Dilambangkan dengan x̅. Rata-rata sampel dihitung sebagai rata-rata aritmatika sederhana: jumlahkan semua nilai dalam sampel, lalu bagi hasilnya dengan jumlah nilai dalam sampel.

    • Dalam contoh kita, tambahkan nilai dalam sampel: 15+17+23+7+9+13=84
      Sekarang bagi hasilnya dengan banyaknya nilai dalam sampel (dalam contoh kita ada 6): 84 6 = 14.
      Rata-rata sampel x̅ = 14.
    • Rata-rata sampel adalah nilai sentral di mana nilai-nilai dalam sampel didistribusikan. Jika nilai-nilai dalam cluster sampel berada di sekitar mean sampel, maka variansnya kecil; jika tidak, variansnya besar.
  4. Kurangi mean sampel dari setiap nilai dalam sampel. Sekarang hitung selisihnya x saya (\gaya tampilan x_(i))- x̅, dimana x saya (\gaya tampilan x_(i))– setiap nilai dalam sampel. Setiap hasil yang diperoleh menunjukkan derajat penyimpangan suatu nilai tertentu dari mean sampel, yaitu seberapa jauh nilai tersebut dari mean sampel.

    • Dalam contoh kita:
      x 1 (\gaya tampilan x_(1))- x = 17 - 14 = 3
      x 2 (\gaya tampilan x_(2))- x̅ = 15 - 14 = 1
      x 3 (\gaya tampilan x_(3))- x = 23 - 14 = 9
      x 4 (\gaya tampilan x_(4))- x̅ = 7 - 14 = -7
      x 5 (\gaya tampilan x_(5))- x̅ = 9 - 14 = -5
      x 6 (\gaya tampilan x_(6))- x̅ = 13 - 14 = -1
    • Kebenaran hasil yang diperoleh mudah untuk diperiksa, karena jumlahnya harus sama dengan nol. Hal ini berkaitan dengan penentuan nilai rata-rata, karena nilai-nilai negatif(jarak dari nilai rata-rata ke nilai yang lebih kecil) dikompensasikan sepenuhnya nilai-nilai positif(jarak dari nilai rata-rata ke nilai besar).
  5. Seperti disebutkan di atas, jumlah perbedaannya x saya (\gaya tampilan x_(i))- x̅ harus sama dengan nol. Artinya varians rata-rata selalu nol, sehingga tidak memberikan gambaran apapun tentang penyebaran nilai suatu besaran tertentu. Untuk mengatasi masalah ini, kuadratkan setiap perbedaannya x saya (\gaya tampilan x_(i))- X. Ini akan mengakibatkan Anda hanya mendapatkan angka positif, yang bila ditambahkan tidak akan pernah menghasilkan 0.

    • Dalam contoh kita:
      (x 1 (\gaya tampilan x_(1))- X) 2 = 3 2 = 9 (\gaya tampilan ^(2)=3^(2)=9)
      (x 2 (\gaya tampilan (x_(2))- X) 2 = 1 2 = 1 (\gaya tampilan ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Anda menemukan kuadrat selisihnya - x̅) 2 (\gaya tampilan ^(2)) untuk setiap nilai dalam sampel.
  6. Hitung jumlah kuadrat selisihnya. Artinya, carilah bagian rumus yang ditulis seperti ini: ∑[( x saya (\gaya tampilan x_(i))- X) 2 (\gaya tampilan ^(2))]. Di sini tanda Σ berarti jumlah selisih kuadrat untuk setiap nilai x saya (\gaya tampilan x_(i)) dalam sampel. Anda telah menemukan perbedaan kuadratnya (xi (\gaya tampilan (x_(i))- X) 2 (\gaya tampilan ^(2)) untuk setiap nilai x saya (\gaya tampilan x_(i)) dalam sampel; sekarang tambahkan saja kotak-kotak ini.

    • Dalam contoh kita: 9+1+81+49+25+1= 166 .
  7. Bagilah hasilnya dengan n - 1, dimana n adalah banyaknya nilai dalam sampel. Beberapa waktu lalu, untuk menghitung varians sampel, ahli statistik cukup membagi hasilnya dengan n; dalam hal ini Anda akan mendapatkan rata-rata varians kuadrat, yang ideal untuk mendeskripsikan varians sampel tertentu. Namun perlu diingat bahwa sampel apa pun hanyalah sebagian kecil dari nilai populasi. Jika Anda mengambil sampel lain dan melakukan perhitungan yang sama, Anda akan mendapatkan hasil yang berbeda. Ternyata, membaginya dengan n - 1 (bukan hanya n) akan memberikan perkiraan varians populasi yang lebih akurat, dan itulah yang Anda minati. Pembagian dengan n – 1 sudah menjadi hal yang umum, sehingga dimasukkan dalam rumus menghitung varians sampel.

    • Dalam contoh kita, sampel mencakup 6 nilai, yaitu n = 6.
      Varians sampel = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Perbedaan antara varians dan deviasi standar. Perhatikan bahwa rumusnya mengandung eksponen, sehingga dispersi diukur dalam satuan kuadrat dari nilai yang dianalisis. Terkadang besarnya seperti itu cukup sulit untuk dioperasikan; dalam kasus seperti ini, gunakan deviasi standar, yang sama dengan akar kuadrat dari varians. Itulah sebabnya varians sampel dilambangkan sebagai s 2 (\gaya tampilan s^(2)), dan simpangan baku sampel adalah sebagai s (\gaya tampilan s).

    • Dalam contoh kita, simpangan baku sampel adalah: s = √33,2 = 5,76.

    Menghitung Varians Populasi

    1. Analisis serangkaian nilai. Himpunan mencakup semua nilai besaran yang dipertimbangkan. Misalnya, jika Anda mempelajari usia penduduk Wilayah Leningrad, maka populasi mencakup umur seluruh penduduk di wilayah tersebut. Saat bekerja dengan suatu populasi, disarankan untuk membuat tabel dan memasukkan nilai populasi ke dalamnya. Perhatikan contoh berikut:

      • Dalam suatu ruangan terdapat 6 akuarium. Setiap akuarium berisi jumlah ikan berikut:
        x 1 = 5 (\gaya tampilan x_(1)=5)
        x 2 = 5 (\gaya tampilan x_(2)=5)
        x 3 = 8 (\gaya tampilan x_(3)=8)
        x 4 = 12 (\gaya tampilan x_(4)=12)
        x 5 = 15 (\gaya tampilan x_(5)=15)
        x 6 = 18 (\gaya tampilan x_(6)=18)
    2. Tuliskan rumus untuk menghitung varians populasi. Karena totalitas mencakup semua nilai besaran tertentu, rumus di bawah ini memungkinkan kita memperolehnya nilai yang tepat varians populasi. Untuk membedakan varians populasi dari varians sampel (yang hanya merupakan perkiraan), ahli statistik menggunakan berbagai variabel:

      • σ 2 (\gaya tampilan ^(2)) = (∑(x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2)))/N
      • σ 2 (\gaya tampilan ^(2))– penyebaran penduduk (dibaca “sigma kuadrat”). Dispersi diukur dalam satuan persegi.
      • x saya (\gaya tampilan x_(i))– setiap nilai secara keseluruhan.
      • Σ – tanda penjumlahan. Artinya, dari setiap nilai x saya (\gaya tampilan x_(i)) Anda perlu mengurangi μ, mengkuadratkannya, lalu menjumlahkan hasilnya.
      • μ – rata-rata populasi.
      • n – jumlah nilai dalam populasi.
    3. Hitung rata-rata populasi. Saat menangani suatu populasi, meannya dilambangkan sebagai μ (mu). Rata-rata populasi dihitung sebagai rata-rata aritmatika sederhana: jumlahkan semua nilai dalam populasi, lalu bagi hasilnya dengan banyaknya nilai dalam populasi.

      • Ingatlah bahwa rata-rata tidak selalu dihitung sebagai rata-rata aritmatika.
      • Dalam contoh kita, rata-rata populasi: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Kurangi mean populasi dari setiap nilai dalam populasi. Semakin dekat selisihnya dengan nol, maka semakin dekat arti tertentu dengan rata-rata populasi. Temukan perbedaan antara setiap nilai dalam populasi dan rata-ratanya, dan Anda akan mendapatkan gambaran pertama tentang distribusi nilai.

      • Dalam contoh kita:
        x 1 (\gaya tampilan x_(1))- = 5 - 10,5 = -5,5
        x 2 (\gaya tampilan x_(2))- = 5 - 10,5 = -5,5
        x 3 (\gaya tampilan x_(3))- = 8 - 10,5 = -2,5
        x 4 (\gaya tampilan x_(4))- = 12 - 10,5 = 1,5
        x 5 (\gaya tampilan x_(5))- = 15 - 10,5 = 4,5
        x 6 (\gaya tampilan x_(6))- = 18 - 10,5 = 7,5
    5. Kuadratkan setiap hasil yang diperoleh. Nilai selisihnya akan positif dan negatif; Jika nilai-nilai tersebut diplot pada garis bilangan, maka nilai-nilai tersebut akan terletak di kanan dan kiri mean populasi. Ini tidak cocok untuk menghitung varians, karena positif dan angka negatif saling memberikan kompensasi. Jadi kuadratkan setiap selisih untuk mendapatkan bilangan positif saja.

      • Dalam contoh kita:
        (x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2)) untuk setiap nilai populasi (dari i = 1 sampai i = 6):
        (-5,5)2 (\gaya tampilan ^(2)) = 30,25
        (-5,5)2 (\gaya tampilan ^(2)), Di mana x n (\gaya tampilan x_(n))– nilai terakhir dalam populasi.
      • Untuk menghitung nilai rata-rata dari hasil yang diperoleh, Anda perlu mencari jumlahnya dan membaginya dengan n:(( x 1 (\gaya tampilan x_(1)) - μ) 2 (\gaya tampilan ^(2)) + (x 2 (\gaya tampilan x_(2)) - μ) 2 (\gaya tampilan ^(2)) + ... + (x n (\gaya tampilan x_(n)) - μ) 2 (\gaya tampilan ^(2)))/N
      • Sekarang mari kita tuliskan penjelasan di atas dengan menggunakan variabel: (∑( x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2))) / n dan dapatkan rumus untuk menghitung varians populasi.

Dispersi dalam statistik ditemukan sebagai nilai individual dari karakteristik yang dikuadratkan dari . Bergantung pada data awal, ditentukan dengan menggunakan rumus varians sederhana dan tertimbang:

1. (untuk data yang tidak dikelompokkan) dihitung menggunakan rumus:

2. Varians tertimbang (untuk rangkaian variasi):

dimana n adalah frekuensi (pengulangan faktor X)

Contoh mencari varians

Halaman ini menjelaskan contoh standar untuk menemukan varians, Anda juga dapat melihat masalah lain untuk menemukannya

Contoh 1. Data berikut tersedia untuk sekelompok 20 siswa departemen korespondensi. Perlu dibuat deret interval sebaran suatu sifat, menghitung nilai rata-rata suatu sifat dan mempelajari penyebarannya

Mari kita membangun pengelompokan interval. Mari kita tentukan rentang intervalnya menggunakan rumus:

dimana X max adalah nilai maksimum dari karakteristik pengelompokan;
X min – nilai minimum karakteristik pengelompokan;
n – jumlah interval:

Kami menerima n=5. Langkahnya adalah: h = (192 - 159)/ 5 = 6,6

Mari buat pengelompokan interval

Untuk perhitungan lebih lanjut, kami akan membuat tabel tambahan:

X'i adalah titik tengah interval. (misalnya tengah interval 159 – 165.6 = 162.3)

Kita menentukan rata-rata tinggi badan siswa menggunakan rumus rata-rata aritmatika tertimbang:

Mari kita tentukan variansnya menggunakan rumus:

Rumus dispersi dapat diubah sebagai berikut:

Dari rumus ini berikut ini varians sama dengan perbedaan antara rata-rata kuadrat pilihan dan kuadrat dan rata-rata.

Varians dalam seri variasi dengan interval yang sama menggunakan metode momen dapat dihitung dengan cara berikut menggunakan sifat dispersi kedua (membagi semua opsi dengan nilai interval). Menentukan varians, dihitung dengan metode momen, dengan rumus berikut kurang padat karya:

dimana i adalah nilai interval;
A adalah nol konvensional, yang mana akan lebih mudah untuk menggunakan titik tengah interval dengan frekuensi tertinggi;
m1 adalah kuadrat momen orde pertama;
m2 - momen orde kedua

(jika dalam suatu populasi statistik suatu karakteristik berubah sedemikian rupa sehingga hanya terdapat dua pilihan yang saling eksklusif, maka variabilitas tersebut disebut alternatif) dapat dihitung dengan menggunakan rumus:

Mengganti q = 1- p ke dalam rumus dispersi ini, kita mendapatkan:

Jenis varians

Varians total mengukur variasi suatu karakteristik pada seluruh populasi secara keseluruhan di bawah pengaruh semua faktor yang menyebabkan variasi tersebut. Ini sama dengan kuadrat rata-rata dari deviasi nilai individu suatu karakteristik x dari nilai rata-rata keseluruhan x dan dapat didefinisikan sebagai varians sederhana atau varians tertimbang.

mencirikan variasi acak, yaitu bagian dari variasi yang disebabkan oleh pengaruh faktor-faktor yang tidak terhitung dan tidak bergantung pada atribut-faktor yang menjadi dasar kelompoknya. Dispersi tersebut sama dengan kuadrat rata-rata deviasi nilai individu atribut dalam grup X dari mean aritmatika grup dan dapat dihitung sebagai dispersi sederhana atau sebagai dispersi tertimbang.

Dengan demikian, ukuran varians dalam kelompok variasi suatu sifat dalam suatu kelompok dan ditentukan dengan rumus:

dimana xi adalah rata-rata kelompok;
ni adalah jumlah unit dalam grup.

Misalnya, varians intra-kelompok yang perlu ditentukan dalam masalah mempelajari pengaruh kualifikasi pekerja terhadap tingkat produktivitas tenaga kerja di suatu bengkel menunjukkan variasi output di setiap kelompok yang disebabkan oleh semua faktor yang mungkin ( kondisi teknis peralatan, ketersediaan alat dan bahan, umur pekerja, intensitas kerja, dan lain-lain), kecuali perbedaan kategori kualifikasi (dalam suatu kelompok, semua pekerja mempunyai kualifikasi yang sama).

Rata-rata varians dalam kelompok mencerminkan acak, yaitu bagian variasi yang terjadi di bawah pengaruh semua faktor lain, kecuali faktor pengelompokan. Itu dihitung menggunakan rumus:

Mencirikan variasi sistematis dari ciri-ciri yang dihasilkan, yang disebabkan oleh pengaruh tanda-faktor yang menjadi dasar kelompok. Nilai ini sama dengan kuadrat rata-rata deviasi rata-rata kelompok dari rata-rata keseluruhan. Varians antarkelompok dihitung dengan menggunakan rumus:

Aturan untuk menambahkan varians dalam statistik

Berdasarkan aturan penambahan varians varians total sama dengan jumlah rata-rata varians dalam kelompok dan antar kelompok:

Arti dari aturan ini adalah bahwa total varians yang timbul karena pengaruh semua faktor sama dengan jumlah varians yang timbul karena pengaruh semua faktor lain dan varians yang timbul karena faktor pengelompokan.

Dengan menggunakan rumus penjumlahan varians, Anda dapat menentukan varians ketiga yang tidak diketahui dari dua varians yang diketahui, dan juga menilai kekuatan pengaruh karakteristik pengelompokan.

Sifat dispersi

1. Jika semua nilai suatu karakteristik dikurangi (ditambah) dengan jumlah konstan yang sama, maka dispersinya tidak akan berubah.
2. Jika semua nilai suatu karakteristik dikurangi (ditambah) sebanyak n^2 kali, maka variansnya juga akan berkurang (meningkat) sebanyak n^2 kali.

Di antara sekian banyak indikator yang digunakan dalam statistik, perhitungan varians perlu ditonjolkan. Perlu dicatat bahwa melakukan penghitungan ini secara manual adalah tugas yang agak membosankan. Untungnya, Excel memiliki fungsi yang memungkinkan Anda mengotomatiskan prosedur perhitungan. Mari cari tahu algoritma untuk bekerja dengan alat-alat ini.

Dispersi merupakan indikator variasi, yaitu kuadrat rata-rata penyimpangan dari ekspektasi matematis. Jadi, ini menyatakan penyebaran angka di sekitar nilai rata-rata. Perhitungan varians dapat dilakukan baik untuk populasi umum maupun sampel.

Metode 1: perhitungan berdasarkan jumlah penduduk

Untuk menghitung indikator ini di Excel untuk populasi umum, gunakan fungsi DISP.G. Sintaks ekspresi ini adalah sebagai berikut:

DISP.G(Nomor1;Nomor2;…)

Secara total, 1 hingga 255 argumen dapat digunakan. Argumen dapat berupa nilai numerik atau referensi ke sel di mana argumen tersebut berada.

Mari kita lihat cara menghitung nilai ini untuk suatu rentang dengan data numerik.


Metode 2: perhitungan berdasarkan sampel

Berbeda dengan menghitung suatu nilai berdasarkan populasi, dalam menghitung sampel, penyebutnya tidak menunjukkan banyaknya bilangan, melainkan dikurangi satu. Hal ini dilakukan untuk tujuan koreksi kesalahan. Excel memperhitungkan nuansa ini dalam fungsi khusus yang dirancang untuk jenis perhitungan ini - DISP.V. Sintaksnya diwakili oleh rumus berikut:

DISP.B(Nomor1;Nomor2;…)

Jumlah argumen, seperti pada fungsi sebelumnya, juga bisa berkisar antara 1 hingga 255.


Seperti yang Anda lihat, program Excel bisa sangat memudahkan penghitungan varians. Statistik ini dapat dihitung dengan aplikasi, baik dari populasi maupun dari sampel. Dalam hal ini, semua tindakan pengguna sebenarnya adalah menentukan rentang angka yang akan diproses, dan Excel melakukan pekerjaan utamanya sendiri. Tentu saja hal ini akan menghemat banyak waktu pengguna.

Tampilan