Variansnya ditentukan oleh rumus. Cara menghitung varians suatu variabel acak

Halaman ini menjelaskan contoh standar untuk menemukan varians, Anda juga dapat melihat masalah lain untuk menemukannya

Contoh 1. Penentuan kelompok, rata-rata kelompok, antarkelompok dan varians total

Contoh 2. Mencari varians dan koefisien variasi dalam tabel pengelompokan

Contoh 3. Mencari varians pada deret diskrit

Contoh 4. Data berikut tersedia untuk sekelompok 20 siswa departemen korespondensi. Perlu dibuat deret interval sebaran suatu sifat, menghitung nilai rata-rata suatu sifat dan mempelajari penyebarannya

Mari kita membangun pengelompokan interval. Mari kita tentukan rentang intervalnya menggunakan rumus:

dimana X max adalah nilai maksimum dari karakteristik pengelompokan;
X min – nilai minimum karakteristik pengelompokan;
n – jumlah interval:

Kami menerima n=5. Langkahnya adalah: h = (192 - 159)/ 5 = 6,6

Mari buat pengelompokan interval

Untuk perhitungan lebih lanjut, kami akan membuat tabel tambahan:

X"i – titik tengah interval. (misalnya, titik tengah interval 159 – 165.6 = 162.3)

Nilai rata-rata Kita akan menentukan tinggi badan siswa menggunakan rumus rata-rata aritmatika tertimbang:

Mari kita tentukan variansnya menggunakan rumus:

Rumusnya dapat diubah seperti ini:

Dari rumus ini berikut ini varians sama dengan perbedaan antara rata-rata kuadrat pilihan dan kuadrat dan rata-rata.

Dispersi dalam deret variasi dengan interval yang sama menggunakan metode momen dapat dihitung dengan cara berikut menggunakan sifat dispersi kedua (membagi semua opsi dengan nilai interval). Menentukan varians, dihitung menggunakan metode momen, menggunakan rumus berikut ini tidak terlalu memakan waktu:

dimana i adalah nilai interval;
A adalah nol konvensional, yang mana akan lebih mudah untuk menggunakan titik tengah interval dengan frekuensi tertinggi;
m1 adalah kuadrat momen orde pertama;
m2 - momen orde kedua

Varians sifat alternatif (jika dalam suatu populasi statistik suatu karakteristik berubah sedemikian rupa sehingga hanya terdapat dua pilihan yang saling eksklusif, maka variabilitas tersebut disebut alternatif) dapat dihitung dengan menggunakan rumus:

Mengganti q = 1- p ke dalam rumus dispersi ini, kita memperoleh:

Jenis varians

Varians total mengukur variasi suatu karakteristik pada seluruh populasi secara keseluruhan di bawah pengaruh semua faktor yang menyebabkan variasi tersebut. Ini sama dengan kuadrat rata-rata dari deviasi nilai individu suatu karakteristik x dari nilai rata-rata keseluruhan x dan dapat didefinisikan sebagai varians sederhana atau varians tertimbang.

Varians dalam kelompok mencirikan variasi acak, yaitu bagian dari variasi yang disebabkan oleh pengaruh faktor-faktor yang tidak terhitung dan tidak bergantung pada atribut-faktor yang menjadi dasar kelompoknya. Dispersi tersebut sama dengan kuadrat rata-rata deviasi nilai individu atribut dalam grup X dari mean aritmatika grup dan dapat dihitung sebagai dispersi sederhana atau sebagai dispersi tertimbang.



Dengan demikian, ukuran varians dalam kelompok variasi suatu sifat dalam suatu kelompok dan ditentukan dengan rumus:

dimana xi adalah rata-rata kelompok;
ni adalah jumlah unit dalam grup.

Misalnya, varians intra-kelompok yang perlu ditentukan dalam masalah mempelajari pengaruh kualifikasi pekerja terhadap tingkat produktivitas tenaga kerja di suatu bengkel menunjukkan variasi output di setiap kelompok yang disebabkan oleh semua faktor yang mungkin ( kondisi teknis peralatan, ketersediaan alat dan bahan, umur pekerja, intensitas kerja, dan lain-lain), kecuali perbedaan kategori kualifikasi (dalam suatu kelompok, semua pekerja mempunyai kualifikasi yang sama).

Penyebaran variabel acak adalah ukuran penyebaran nilai besaran ini. Varians yang rendah berarti nilai-nilai tersebut mengelompok berdekatan. Sebaran yang besar menunjukkan penyebaran nilai yang kuat. Konsep varians variabel acak digunakan dalam statistik. Misalnya, jika Anda membandingkan varian dua nilai (misalnya antara pasien pria dan wanita), Anda dapat menguji signifikansi suatu variabel. Varians juga digunakan saat membuat model statistik, karena varians yang rendah dapat menjadi tanda bahwa Anda melakukan penyesuaian nilai secara berlebihan.

Langkah

Menghitung varians sampel

  1. Catat nilai sampel. Dalam kebanyakan kasus, ahli statistik hanya memiliki akses terhadap sampel populasi tertentu. Misalnya, sebagai aturan, ahli statistik tidak menganalisis biaya pemeliharaan total semua mobil di Rusia - mereka menganalisis sampel acak beberapa ribu mobil. Sampel seperti itu akan membantu menentukan harga rata-rata sebuah mobil, tetapi kemungkinan besar, nilai yang dihasilkan akan jauh dari nilai sebenarnya.

    • Misalnya, mari kita analisis jumlah roti yang terjual di sebuah kafe selama 6 hari, yang diambil secara acak. Sampelnya seperti ini: 17, 15, 23, 7, 9, 13. Ini adalah sampel, bukan populasi, karena kami tidak memiliki data roti yang terjual setiap hari kafe buka.
    • Jika Anda diberikan nilai populasi dan bukan sampel, lanjutkan ke bagian berikutnya.
  2. Tuliskan rumus untuk menghitung varians sampel. Dispersi adalah ukuran penyebaran nilai-nilai dalam besaran tertentu. Bagaimana nilai lebih dekat dispersi ke nol, semakin dekat nilai-nilai tersebut dikelompokkan satu sama lain. Saat bekerja dengan pemilihan nilai, gunakan rumus berikut untuk menghitung varians:

    • s 2 (\gaya tampilan s^(2)) = ∑[(x saya (\gaya tampilan x_(i))- X) 2 (\gaya tampilan ^(2))] / (n - 1)
    • s 2 (\gaya tampilan s^(2))– ini adalah dispersi. Dispersi diukur dalam satuan persegi.
    • x saya (\gaya tampilan x_(i))– setiap nilai dalam sampel.
    • x saya (\gaya tampilan x_(i)) Anda perlu mengurangi x̅, mengkuadratkannya, lalu menjumlahkan hasilnya.
    • x̅ – mean sampel (rata-rata sampel).
    • n – jumlah nilai dalam sampel.
  3. Hitung mean sampel. Dilambangkan dengan x̅. Rata-rata sampel dihitung sebagai rata-rata aritmatika sederhana: jumlahkan semua nilai dalam sampel, lalu bagi hasilnya dengan jumlah nilai dalam sampel.

    • Dalam contoh kita, tambahkan nilai dalam sampel: 15+17+23+7+9+13=84
      Sekarang bagi hasilnya dengan banyaknya nilai dalam sampel (dalam contoh kita ada 6): 84 6 = 14.
      Rata-rata sampel x̅ = 14.
    • Rata-rata sampel adalah nilai sentral di mana nilai-nilai dalam sampel didistribusikan. Jika nilai-nilai dalam cluster sampel berada di sekitar mean sampel, maka variansnya kecil; jika tidak, variansnya besar.
  4. Kurangi mean sampel dari setiap nilai dalam sampel. Sekarang hitung selisihnya x saya (\gaya tampilan x_(i))- x̅, dimana x saya (\gaya tampilan x_(i))– setiap nilai dalam sampel. Setiap hasil yang diperoleh menunjukkan derajat penyimpangan suatu nilai tertentu dari mean sampel, yaitu seberapa jauh nilai tersebut dari mean sampel.

    • Dalam contoh kita:
      x 1 (\gaya tampilan x_(1))- x = 17 - 14 = 3
      x 2 (\gaya tampilan x_(2))- x̅ = 15 - 14 = 1
      x 3 (\gaya tampilan x_(3))- x = 23 - 14 = 9
      x 4 (\gaya tampilan x_(4))- x̅ = 7 - 14 = -7
      x 5 (\gaya tampilan x_(5))- x̅ = 9 - 14 = -5
      x 6 (\gaya tampilan x_(6))- x̅ = 13 - 14 = -1
    • Kebenaran hasil yang diperoleh mudah untuk diperiksa, karena jumlahnya harus sama dengan nol. Hal ini berkaitan dengan penentuan nilai rata-rata, karena nilai-nilai negatif(jarak dari nilai rata-rata ke nilai yang lebih kecil) dikompensasikan sepenuhnya nilai-nilai positif(jarak dari nilai rata-rata ke nilai besar).
  5. Seperti disebutkan di atas, jumlah perbedaannya x saya (\gaya tampilan x_(i))- x̅ harus sama dengan nol. Artinya varians rata-rata selalu nol, sehingga tidak memberikan gambaran apapun tentang penyebaran nilai suatu besaran tertentu. Untuk mengatasi masalah ini, kuadratkan setiap perbedaannya x saya (\gaya tampilan x_(i))- X. Ini akan mengakibatkan Anda hanya mendapatkan angka positif, yang bila ditambahkan tidak akan pernah menghasilkan 0.

    • Dalam contoh kita:
      (x 1 (\gaya tampilan x_(1))- X) 2 = 3 2 = 9 (\gaya tampilan ^(2)=3^(2)=9)
      (x 2 (\gaya tampilan (x_(2))- X) 2 = 1 2 = 1 (\gaya tampilan ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Anda menemukan kuadrat selisihnya - x̅) 2 (\gaya tampilan ^(2)) untuk setiap nilai dalam sampel.
  6. Hitung jumlah kuadrat selisihnya. Artinya, carilah bagian rumus yang ditulis seperti ini: ∑[( x saya (\gaya tampilan x_(i))- X) 2 (\gaya tampilan ^(2))]. Di sini tanda Σ berarti jumlah selisih kuadrat untuk setiap nilai x saya (\gaya tampilan x_(i)) dalam sampel. Anda telah menemukan perbedaan kuadratnya (xi (\gaya tampilan (x_(i))- X) 2 (\gaya tampilan ^(2)) untuk setiap nilai x saya (\gaya tampilan x_(i)) dalam sampel; sekarang tambahkan saja kotak-kotak ini.

    • Dalam contoh kita: 9+1+81+49+25+1= 166 .
  7. Bagilah hasilnya dengan n - 1, dimana n adalah banyaknya nilai dalam sampel. Beberapa waktu lalu, untuk menghitung varians sampel, ahli statistik cukup membagi hasilnya dengan n; dalam hal ini Anda akan mendapatkan rata-rata varians kuadrat, yang ideal untuk mendeskripsikan varians sampel tertentu. Namun perlu diingat bahwa sampel apa pun hanyalah sebagian kecil dari nilai populasi. Jika Anda mengambil sampel lain dan melakukan perhitungan yang sama, Anda akan mendapatkan hasil yang berbeda. Ternyata, membaginya dengan n - 1 (bukan hanya n) akan memberikan perkiraan varians populasi yang lebih akurat, dan itulah yang Anda minati. Pembagian dengan n – 1 sudah menjadi hal yang umum, sehingga dimasukkan dalam rumus menghitung varians sampel.

    • Dalam contoh kita, sampel mencakup 6 nilai, yaitu n = 6.
      Varians sampel = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Perbedaan antara varians dan deviasi standar. Perhatikan bahwa rumusnya mengandung eksponen, sehingga dispersi diukur dalam satuan kuadrat dari nilai yang dianalisis. Terkadang besarnya seperti itu cukup sulit untuk dioperasikan; dalam kasus seperti ini, gunakan deviasi standar, yang sama dengan akar kuadrat dari varians. Itulah sebabnya varians sampel dilambangkan sebagai s 2 (\gaya tampilan s^(2)), A deviasi standar sampel - bagaimana s (\gaya tampilan s).

    • Dalam contoh kita, simpangan baku sampel adalah: s = √33.2 = 5.76.

    Menghitung Varians Populasi

    1. Analisis serangkaian nilai. Himpunan mencakup semua nilai besaran yang dipertimbangkan. Misalnya, jika Anda mempelajari usia penduduk Wilayah Leningrad, maka populasi mencakup umur seluruh penduduk di wilayah tersebut. Saat bekerja dengan suatu populasi, disarankan untuk membuat tabel dan memasukkan nilai populasi ke dalamnya. Perhatikan contoh berikut:

      • Dalam suatu ruangan terdapat 6 akuarium. Setiap akuarium berisi jumlah ikan berikut:
        x 1 = 5 (\gaya tampilan x_(1)=5)
        x 2 = 5 (\gaya tampilan x_(2)=5)
        x 3 = 8 (\gaya tampilan x_(3)=8)
        x 4 = 12 (\gaya tampilan x_(4)=12)
        x 5 = 15 (\gaya tampilan x_(5)=15)
        x 6 = 18 (\gaya tampilan x_(6)=18)
    2. Tuliskan rumus untuk menghitung varians populasi. Karena totalitas mencakup semua nilai besaran tertentu, rumus di bawah ini memungkinkan kita memperolehnya nilai yang tepat varians populasi. Untuk membedakan varians populasi dari varians sampel (yang hanya merupakan perkiraan), ahli statistik menggunakan berbagai variabel:

      • σ 2 (\gaya tampilan ^(2)) = (∑(x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2)))/N
      • σ 2 (\gaya tampilan ^(2))– penyebaran penduduk (dibaca “sigma kuadrat”). Dispersi diukur dalam satuan persegi.
      • x saya (\gaya tampilan x_(i))– setiap nilai secara keseluruhan.
      • Σ – tanda penjumlahan. Artinya, dari setiap nilai x saya (\gaya tampilan x_(i)) Anda perlu mengurangi μ, mengkuadratkannya, lalu menjumlahkan hasilnya.
      • μ – rata-rata populasi.
      • n – jumlah nilai dalam populasi.
    3. Hitung rata-rata populasi. Saat menangani suatu populasi, meannya dilambangkan sebagai μ (mu). Rata-rata populasi dihitung sebagai rata-rata aritmatika sederhana: jumlahkan semua nilai dalam populasi, lalu bagi hasilnya dengan banyaknya nilai dalam populasi.

      • Ingatlah bahwa rata-rata tidak selalu dihitung sebagai rata-rata aritmatika.
      • Dalam contoh kita, rata-rata populasi: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Kurangi mean populasi dari setiap nilai dalam populasi. Semakin dekat selisihnya dengan nol, maka semakin dekat arti tertentu dengan rata-rata populasi. Temukan perbedaan antara setiap nilai dalam populasi dan rata-ratanya, dan Anda akan mendapatkan gambaran pertama tentang distribusi nilai.

      • Dalam contoh kita:
        x 1 (\gaya tampilan x_(1))- = 5 - 10,5 = -5,5
        x 2 (\gaya tampilan x_(2))- = 5 - 10,5 = -5,5
        x 3 (\gaya tampilan x_(3))- = 8 - 10,5 = -2,5
        x 4 (\gaya tampilan x_(4))- = 12 - 10,5 = 1,5
        x 5 (\gaya tampilan x_(5))- = 15 - 10,5 = 4,5
        x 6 (\gaya tampilan x_(6))- = 18 - 10,5 = 7,5
    5. Kuadratkan setiap hasil yang diperoleh. Nilai selisihnya akan positif dan negatif; Jika nilai-nilai tersebut diplot pada garis bilangan, maka nilai-nilai tersebut akan terletak di kanan dan kiri mean populasi. Ini tidak cocok untuk menghitung varians, karena positif dan angka negatif saling memberikan kompensasi. Jadi kuadratkan setiap selisih untuk mendapatkan bilangan positif saja.

      • Dalam contoh kita:
        (x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2)) untuk setiap nilai populasi (dari i = 1 sampai i = 6):
        (-5,5)2 (\gaya tampilan ^(2)) = 30,25
        (-5,5)2 (\gaya tampilan ^(2)), Di mana x n (\gaya tampilan x_(n))– nilai terakhir dalam populasi.
      • Untuk menghitung nilai rata-rata dari hasil yang diperoleh, Anda perlu mencari jumlahnya dan membaginya dengan n:(( x 1 (\gaya tampilan x_(1)) - μ) 2 (\gaya tampilan ^(2)) + (x 2 (\gaya tampilan x_(2)) - μ) 2 (\gaya tampilan ^(2)) + ... + (x n (\gaya tampilan x_(n)) - μ) 2 (\gaya tampilan ^(2)))/N
      • Sekarang mari kita tuliskan penjelasan di atas dengan menggunakan variabel: (∑( x saya (\gaya tampilan x_(i)) - μ) 2 (\gaya tampilan ^(2))) / n dan dapatkan rumus untuk menghitung varians populasi.

Mari kita hitungMSUNGGULvarians sampel dan deviasi standar. Kami juga akan menghitung varians suatu variabel acak jika distribusinya diketahui.

Mari kita pertimbangkan dulu penyebaran, Kemudian deviasi standar.

Varians sampel

Varians sampel (varians sampel,Sampelperbedaan) mencirikan penyebaran nilai dalam array relatif terhadap .

Ketiga rumus tersebut setara secara matematis.

Dari rumus pertama sudah jelas bahwa varians sampel adalah jumlah deviasi kuadrat setiap nilai dalam array dari rata-rata, dibagi dengan ukuran sampel dikurangi 1.

varians sampel fungsi DISP() digunakan, Bahasa Inggris. nama VAR, yaitu Perbedaan. Dari versi MS EXCEL 2010, disarankan untuk menggunakan analognya DISP.V(), Bahasa Inggris. nama VARS, yaitu Contoh VARIance. Selain itu, mulai versi MS EXCEL 2010, terdapat fungsi DISP.Г(), Bahasa Inggris. nama VARP, mis. VARIance Populasi, yang menghitung penyebaran Untuk populasi. Perbedaannya terletak pada penyebutnya: alih-alih n-1 seperti DISP.V(), DISP.G() hanya memiliki n pada penyebutnya. Sebelum MS EXCEL 2010, fungsi VAR() digunakan untuk menghitung varians populasi.

Varians sampel
=QUADROTCL(Sampel)/(JUMLAH(Sampel)-1)
=(SUM(Sampel)-COUNT(Sampel)*RATA-RATA(Sampel)^2)/ (COUNT(Sampel)-1)– rumus biasa
=SUM((Sampel -RATA-RATA(Sampel))^2)/ (JUMLAH(Sampel)-1) –

Varians sampel sama dengan 0, hanya jika semua nilai sama satu sama lain dan, karenanya, sama nilai rata-rata. Biasanya semakin besar nilainya varians, semakin besar penyebaran nilai dalam array.

Varians sampel adalah perkiraan poin varians distribusi variabel acak dari mana variabel itu dibuat Sampel. Tentang konstruksi interval kepercayaan saat menilai varians bisa dibaca di artikel.

Varians dari variabel acak

Menghitung penyebaran variabel acak, Anda perlu mengetahuinya.

Untuk varians variabel acak X sering dinotasikan dengan Var(X). Penyebaran sama dengan kuadrat deviasi dari mean E(X): Var(X)=E[(X-E(X)) 2 ]

penyebaran dihitung dengan rumus:

dimana x i adalah nilai yang dapat diambil oleh suatu variabel acak, dan μ adalah nilai rata-rata (), p(x) adalah peluang bahwa variabel acak tersebut akan mengambil nilai x.

Jika suatu variabel acak mempunyai , maka penyebaran dihitung dengan rumus:

Dimensi varians sesuai dengan kuadrat satuan pengukuran dari nilai aslinya. Misalnya, jika nilai dalam sampel mewakili pengukuran berat suatu bagian (dalam kg), maka dimensi variansnya adalah kg 2 . Hal ini mungkin sulit untuk ditafsirkan, sehingga untuk mengkarakterisasi penyebaran nilai, nilai sama dengan akar kuadrat variansdeviasi standar.

Beberapa properti varians:

Var(X+a)=Var(X), dengan X adalah variabel acak dan a adalah konstanta.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Properti dispersi ini digunakan dalam artikel tentang regresi linier.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), dengan X dan Y adalah variabel acak, Cov(X;Y) adalah kovarians dari variabel acak tersebut.

Jika variabel acak bersifat independen, maka variabel tersebut kovarians sama dengan 0, dan oleh karena itu Var(X+Y)=Var(X)+Var(Y). Sifat dispersi ini digunakan dalam derivasi.

Mari kita tunjukkan bahwa untuk besaran bebas Var(X-Y)=Var(X+Y). Memang benar, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Properti dispersi ini digunakan untuk membangun.

Contoh simpangan baku

Contoh simpangan baku adalah ukuran seberapa luas nilai-nilai yang tersebar dalam suatu sampel relatif terhadapnya.

A-priori, deviasi standar sama dengan akar kuadrat dari varians:

Deviasi standar tidak memperhitungkan besarnya nilai dalam Sampel, tetapi hanya derajat penyebaran nilai-nilai di sekitarnya rata-rata. Untuk mengilustrasikannya, mari kita berikan sebuah contoh.

Mari kita hitung simpangan baku untuk 2 sampel: (1; 5; 9) dan (1001; 1005; 1009). Dalam kedua kasus, s=4. Jelas terlihat bahwa rasio deviasi standar terhadap nilai array berbeda secara signifikan antar sampel. Untuk kasus seperti itu digunakan Koefisien variasi(Koefisien Variasi, CV) - rasio Deviasi Standar ke rata-rata hitung, dinyatakan dalam persentase.

Di MS EXCEL 2007 dan versi sebelumnya untuk perhitungan Contoh simpangan baku fungsi =STDEVAL() digunakan, bahasa Inggris. nama STDEV, mis. Deviasi Standar. Dari versi MS EXCEL 2010 disarankan menggunakan analognya =STDEV.B() , Bahasa Inggris. nama STDEV.S, mis. Contoh DEVIASI STANDAR.

Selain itu, mulai versi MS EXCEL 2010, terdapat fungsi STANDARDEV.G(), Bahasa Inggris. nama STDEV.P, mis. DEVIASI Standar Populasi, yang menghitung deviasi standar Untuk populasi. Seluruh perbedaan terletak pada penyebutnya: alih-alih n-1 seperti pada STANDARDEV.V(), STANDARDEVAL.G() hanya memiliki n pada penyebutnya.

Deviasi standar bisa juga dihitung langsung menggunakan rumus di bawah ini (lihat contoh file)
=ROOT(QUADROTCL(Sampel)/(JUMLAH(Sampel)-1))
=ROOT((SUM(Sampel)-COUNT(Sampel)*RATA-RATA(Sampel)^2)/(COUNT(Sampel)-1))

Ukuran penyebaran lainnya

Fungsi SQUADROTCL() menghitung dengan jumlah deviasi kuadrat nilai darinya rata-rata. Fungsi ini akan mengembalikan hasil yang sama seperti rumus =DISP.G( Sampel)*MEMERIKSA( Sampel) , Di mana Sampel- referensi ke rentang yang berisi larik nilai sampel(). Perhitungan pada fungsi QUADROCL() dilakukan sesuai dengan rumus:

Fungsi SROTCL() juga merupakan ukuran penyebaran kumpulan data. Fungsi SROTCL() menghitung rata-rata nilai absolut dari deviasi nilai rata-rata. Fungsi ini akan mengembalikan hasil yang sama seperti rumus =SUMPRODUK(ABS(Sampel-RATA-RATA(Sampel)))/COUNT(Sampel), Di mana Sampel- tautan ke rentang yang berisi larik nilai sampel.

Perhitungan pada fungsi SROTCL() dilakukan dengan rumus:

.

Sebaliknya, if adalah ae non-negatif. berfungsi sedemikian rupa , maka ada ukuran probabilitas yang benar-benar kontinu sehingga menjadi kepadatannya.

    Mengganti ukuran dalam integral Lebesgue:

,

dimana adalah fungsi Borel yang dapat diintegralkan terhadap ukuran probabilitas.

Dispersi, Jenis dan Sifat Dispersi Konsep dispersi

Dispersi dalam statistik ditemukan sebagai deviasi standar dari nilai individu dari karakteristik yang dikuadratkan dari mean aritmatika. Bergantung pada data awal, ditentukan dengan menggunakan rumus varians sederhana dan tertimbang:

1. Varians sederhana(untuk data yang tidak dikelompokkan) dihitung menggunakan rumus:

2. Varians tertimbang (untuk rangkaian variasi):

dimana n adalah frekuensi (pengulangan faktor X)

Contoh mencari varians

Halaman ini menjelaskan contoh standar untuk menemukan varians, Anda juga dapat melihat masalah lain untuk menemukannya

Contoh 1. Penentuan kelompok, rata-rata kelompok, antarkelompok dan varians total

Contoh 2. Mencari varians dan koefisien variasi dalam tabel pengelompokan

Contoh 3. Mencari varians pada deret diskrit

Contoh 4. Data berikut tersedia untuk sekelompok 20 siswa korespondensi. Perlu dibuat deret interval sebaran suatu sifat, menghitung nilai rata-rata suatu sifat dan mempelajari penyebarannya

Mari kita membangun pengelompokan interval. Mari kita tentukan rentang intervalnya menggunakan rumus:

dimana X max adalah nilai maksimum dari karakteristik pengelompokan; X min – nilai minimum karakteristik pengelompokan; n – jumlah interval:

Kami menerima n=5. Langkahnya adalah: h = (192 - 159)/ 5 = 6,6

Mari buat pengelompokan interval

Untuk perhitungan lebih lanjut, kami akan membuat tabel tambahan:

X"i – titik tengah interval. (misalnya, titik tengah interval 159 – 165.6 = 162.3)

Kita menentukan rata-rata tinggi badan siswa menggunakan rumus rata-rata aritmatika tertimbang:

Mari kita tentukan variansnya menggunakan rumus:

Rumusnya dapat diubah seperti ini:

Dari rumus ini berikut ini varians sama dengan perbedaan antara rata-rata kuadrat pilihan dan kuadrat dan rata-rata.

Dispersi dalam deret variasi dengan interval yang sama menggunakan metode momen dapat dihitung dengan cara berikut menggunakan sifat dispersi kedua (membagi semua opsi dengan nilai interval). Menentukan varians, dihitung menggunakan metode momen, menggunakan rumus berikut ini tidak terlalu memakan waktu:

dimana i adalah nilai interval; A adalah nol konvensional, yang mana akan lebih mudah untuk menggunakan titik tengah interval dengan frekuensi tertinggi; m1 adalah kuadrat momen orde pertama; m2 - momen orde kedua

Varians sifat alternatif (jika dalam suatu populasi statistik suatu karakteristik berubah sedemikian rupa sehingga hanya terdapat dua pilihan yang saling eksklusif, maka variabilitas tersebut disebut alternatif) dapat dihitung dengan menggunakan rumus:

Mengganti q = 1- p ke dalam rumus dispersi ini, kita memperoleh:

Jenis varians

Varians total mengukur variasi suatu karakteristik pada seluruh populasi secara keseluruhan di bawah pengaruh semua faktor yang menyebabkan variasi tersebut. Ini sama dengan kuadrat rata-rata dari deviasi nilai individu suatu karakteristik x dari nilai rata-rata keseluruhan x dan dapat didefinisikan sebagai varians sederhana atau varians tertimbang.

Varians dalam kelompok mencirikan variasi acak, yaitu bagian dari variasi yang disebabkan oleh pengaruh faktor-faktor yang tidak terhitung dan tidak bergantung pada atribut-faktor yang menjadi dasar kelompoknya. Dispersi tersebut sama dengan kuadrat rata-rata deviasi nilai individu atribut dalam grup X dari mean aritmatika grup dan dapat dihitung sebagai dispersi sederhana atau sebagai dispersi tertimbang.

Dengan demikian, ukuran varians dalam kelompok variasi suatu sifat dalam suatu kelompok dan ditentukan dengan rumus:

dimana xi adalah rata-rata kelompok; ni adalah jumlah unit dalam grup.

Misalnya varians intragrup yang perlu ditentukan dalam tugas mempelajari pengaruh kualifikasi pekerja terhadap tingkat produktivitas tenaga kerja di suatu bengkel menunjukkan variasi output pada setiap kelompok yang disebabkan oleh semua faktor yang mungkin (kondisi teknis peralatan, ketersediaan peralatan). alat dan bahan, umur pekerja, intensitas tenaga kerja, dan lain-lain.), kecuali perbedaan kategori kualifikasi (dalam suatu kelompok semua pekerja mempunyai kualifikasi yang sama).

Rata-rata varians dalam kelompok mencerminkan variasi acak, yaitu bagian variasi yang terjadi karena pengaruh semua faktor lain, kecuali faktor pengelompokan. Itu dihitung menggunakan rumus:

Varians antarkelompok mencirikan variasi sistematis dari sifat yang dihasilkan, yang disebabkan oleh pengaruh faktor-atribut yang menjadi dasar kelompok. Nilai ini sama dengan kuadrat rata-rata deviasi rata-rata kelompok dari rata-rata keseluruhan. Varians antarkelompok dihitung dengan menggunakan rumus:

Namun karakteristik ini saja tidak cukup untuk mempelajari variabel acak. Mari kita bayangkan dua penembak menembak sasaran. Yang satu menembak dengan akurat dan mengenai tepat di tengah, sementara yang lain... hanya bersenang-senang dan bahkan tidak membidik. Tapi yang lucu adalah dia rata-rata hasilnya akan sama persis dengan penembak pertama! Situasi ini secara konvensional diilustrasikan oleh variabel acak berikut:

Namun, ekspektasi matematis “penembak jitu” sama dengan , untuk “orang yang menarik”: – juga nol!

Oleh karena itu, ada kebutuhan untuk mengukur seberapa jauh berserakan poin (nilai variabel acak) relatif terhadap pusat target (ekspektasi matematis). baik dan penyebaran diterjemahkan dari bahasa Latin tidak lain adalah penyebaran .

Mari kita lihat bagaimana karakteristik numerik ini ditentukan dengan menggunakan salah satu contoh dari bagian pertama pelajaran:

Di sana kami menemukan ekspektasi matematis yang mengecewakan dari permainan ini, dan sekarang kami harus menghitung variansnya, yang mana dilambangkan dengan melalui .

Mari kita cari tahu seberapa jauh kemenangan/kekalahan “tersebar” relatif terhadap nilai rata-rata. Tentunya untuk ini kita perlu menghitung perbedaan di antara nilai variabel acak dan dia ekspektasi matematis:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Sekarang tampaknya Anda perlu menyimpulkan hasilnya, tetapi cara ini tidak cocok - karena fluktuasi ke kiri akan menghilangkan satu sama lain dengan fluktuasi ke kanan. Jadi, misalnya, seorang penembak “amatir”. (contoh di atas) perbedaannya akan terjadi , dan bila dijumlahkan akan menghasilkan nol, jadi kita tidak akan mendapatkan perkiraan penyebaran tembakannya.

Untuk menyiasati masalah ini Anda bisa mempertimbangkannya modul perbedaannya, namun karena alasan teknis pendekatan ini telah mengakar ketika dikuadratkan. Lebih mudah untuk merumuskan solusi dalam sebuah tabel:

Dan di sini ia meminta untuk menghitung rata-rata tertimbang nilai deviasi kuadrat. Apa itu? Itu milik mereka nilai yang diharapkan, yang merupakan ukuran hamburan:

definisi varians. Dari definisi tersebut langsung jelas bahwa varians tidak boleh negatif– perhatikan untuk latihan!

Mari kita ingat bagaimana menemukan nilai yang diharapkan. Lipat gandakan perbedaan kuadrat dengan probabilitas yang sesuai (Tabel lanjutan):
– secara kiasan, ini adalah “gaya traksi”,
dan rangkum hasilnya:

Tidakkah menurut Anda dibandingkan dengan kemenangan, hasilnya ternyata terlalu besar? Itu benar - kita mengkuadratkannya, dan untuk kembali ke dimensi permainan kita, kita perlu mengekstraknya Akar pangkat dua. Besaran ini disebut deviasi standar dan dilambangkan dengan huruf Yunani “sigma”:

Nilai ini kadang-kadang disebut deviasi standar .

Apa artinya? Jika kita menyimpang dari ekspektasi matematis ke kiri dan ke kanan sebesar simpangan baku:

– maka nilai yang paling mungkin dari variabel acak akan “terkonsentrasi” pada interval ini. Apa yang sebenarnya kami amati:

Namun, ketika menganalisis hamburan, seseorang hampir selalu menggunakan konsep dispersi. Mari kita cari tahu apa artinya dalam kaitannya dengan game. Jika dalam kasus panah kita berbicara tentang “akurasi” pukulan relatif terhadap pusat target, maka di sini dispersi mencirikan dua hal:

Pertama, jelas bahwa seiring dengan meningkatnya taruhan, penyebarannya juga meningkat. Jadi, misalnya kita meningkat 10 kali lipat, maka ekspektasi matematisnya akan meningkat 10 kali lipat, dan variansnya akan meningkat 100 kali lipat. (karena ini adalah besaran kuadrat). Namun perlu diingat bahwa aturan mainnya sendiri tidak berubah! Hanya tarifnya yang berubah, secara kasar, sebelumnya kita bertaruh 10 rubel, sekarang menjadi 100.

Kedua, lebih lanjut poin yang menarik apakah varians itu mencirikan gaya permainan. Perbaiki mental taruhan permainan pada tingkat tertentu, dan mari kita lihat apa itu:

Permainan dengan varian rendah adalah permainan yang hati-hati. Pemain cenderung memilih skema yang paling dapat diandalkan, di mana ia tidak kalah/menang terlalu banyak dalam satu waktu. Misalnya saja sistem merah/hitam pada roulette (lihat contoh 4 artikel Variabel acak) .

Permainan varian tinggi. Dia sering dipanggil menyebar permainan. Ini adalah gaya permainan yang penuh petualangan atau agresif, di mana pemain memilih skema “adrenalin”. Setidaknya mari kita ingat "Martingale", di mana jumlah yang dipertaruhkan jauh lebih besar daripada permainan “tenang” pada poin sebelumnya.

Situasi dalam poker bersifat indikatif: ada yang disebut ketat pemain yang cenderung berhati-hati dan “goyah” atas mereka berarti permainan (bankroll). Tidak mengherankan, bankroll mereka tidak berfluktuasi secara signifikan (varians rendah). Sebaliknya, jika seorang pemain memiliki variansi yang tinggi, maka ia termasuk agresor. Dia sering mengambil risiko, membuat taruhan besar dan bisa menghancurkan bank besar atau kalah berkeping-keping.

Hal yang sama terjadi di Forex, dan seterusnya – ada banyak contoh.

Selain itu, dalam semua kasus, tidak masalah apakah permainan tersebut dimainkan dengan harga sepeser pun atau ribuan dolar. Setiap level memiliki pemain dengan penyebaran rendah dan tinggi. Nah, seingat kita, rata-rata kemenangan itu “bertanggung jawab” nilai yang diharapkan.

Anda mungkin memperhatikan bahwa menemukan varians adalah proses yang panjang dan melelahkan. Tapi matematika itu murah hati:

Rumus untuk mencari varians

Rumus ini diturunkan langsung dari definisi varians, dan kami segera menerapkannya. Saya akan menyalin tanda dengan permainan kami di atas:

dan ekspektasi matematis yang ditemukan.

Mari kita hitung variansnya dengan cara kedua. Pertama, mari kita cari ekspektasi matematisnya - kuadrat dari variabel acak. Oleh penentuan ekspektasi matematis:

DI DALAM pada kasus ini:

Jadi menurut rumus:

Seperti yang mereka katakan, rasakan perbedaannya. Dan dalam prakteknya tentunya lebih baik menggunakan rumus (kecuali kondisinya mengharuskan lain).

Kami menguasai teknik pemecahan dan perancangan:

Contoh 6

Temukan ekspektasi matematis, varians, dan deviasi standarnya.

Tugas ini ditemukan di mana-mana, dan, sebagai suatu peraturan, tidak ada artinya.
Bisa dibayangkan beberapa bola lampu dengan angka yang menyala di rumah sakit jiwa dengan probabilitas tertentu :)

Larutan: Lebih mudah untuk meringkas perhitungan dasar dalam sebuah tabel. Pertama, kita tulis data awal di dua baris teratas. Lalu kita hitung hasil perkaliannya, lalu dan terakhir jumlah di kolom kanan:

Sebenarnya hampir semuanya sudah siap. Baris ketiga menunjukkan ekspektasi matematis yang sudah jadi: .

Kami menghitung varians menggunakan rumus:

Dan terakhir, simpangan baku:
– Secara pribadi, saya biasanya membulatkan ke 2 tempat desimal.

Semua penghitungan dapat dilakukan dengan kalkulator, atau bahkan lebih baik lagi – di Excel:

Sulit untuk salah di sini :)

Menjawab:

Mereka yang ingin dapat lebih menyederhanakan hidup mereka dan memanfaatkan saya Kalkulator (demo), yang tidak hanya akan menyelesaikan masalah ini secara instan, tetapi juga membangun grafis tematik (kami akan segera sampai di sana). Programnya bisa unduh dari perpustakaan– jika Anda telah mengunduh setidaknya satu materi pendidikan, atau dapatkan cara lain. Terima kasih telah mendukung proyek ini!

Beberapa tugas yang harus Anda selesaikan sendiri:

Contoh 7

Hitung varians variabel acak pada contoh sebelumnya berdasarkan definisi.

DAN contoh serupa:

Contoh 8

Variabel acak diskrit ditentukan oleh hukum distribusinya:

Ya, nilai variabel acak bisa sangat besar (contoh dari pekerjaan nyata) , dan di sini, jika memungkinkan, gunakan Excel. Omong-omong, seperti pada Contoh 7 - ini lebih cepat, lebih andal, dan lebih menyenangkan.

Solusi dan jawaban di bagian bawah halaman.

Di akhir pelajaran bagian ke-2, kita akan melihat satu lagi tugas khas, bahkan bisa dikatakan, sebuah rebus kecil:

Contoh 9

Variabel acak diskrit hanya dapat mengambil dua nilai: dan , dan . Probabilitas, ekspektasi matematis, dan varians diketahui.

Larutan: Mari kita mulai dengan probabilitas yang tidak diketahui. Karena variabel acak hanya dapat mengambil dua nilai, jumlah probabilitas kejadian yang bersesuaian adalah:

dan sejak saat itu .

Yang tersisa hanyalah menemukan..., mudah untuk mengatakannya :) Tapi oh baiklah, ini dia. Menurut definisi ekspektasi matematis:
– substitusikan besaran yang diketahui:

– dan tidak ada lagi yang dapat dikeluarkan dari persamaan ini, kecuali Anda dapat menulis ulang persamaan tersebut ke arah yang biasa:

atau:

TENTANG tindakan lebih lanjut, saya rasa Anda bisa menebaknya. Mari menyusun dan menyelesaikan sistem:

Desimal- ini, tentu saja, sangat memalukan; kalikan kedua persamaan dengan 10:

dan bagi dengan 2:

Itu lebih baik. Dari persamaan pertama kita nyatakan:
(ini cara yang lebih mudah)– substitusikan ke persamaan ke-2:


Kami sedang membangun kuadrat dan buat penyederhanaan:

Kalikan dengan:

Hasilnya adalah persamaan kuadrat, kami menemukan diskriminannya:
- Besar!

dan kami mendapatkan dua solusi:

1) jika , Itu ;

2) jika , Itu .

Kondisi ini dipenuhi oleh pasangan nilai pertama. Dengan kemungkinan besar semuanya benar, namun, mari kita tuliskan hukum distribusinya:

dan lakukan pengecekan yaitu mencari ekspektasinya:

Tampilan