Bir rastgele değişkenin matematiksel beklentisi ve dağılımı. Artık varyans

Çoğu durumda, dereceyi ölçmek için başka bir sayısal özelliğin tanıtılması gerekli hale gelir. değerlerin saçılması, yayılması rastgele değişken olarak alınan ξ , matematiksel beklentisi etrafında.

Tanım. Varyans rastgele değişken ξ bir numarayı aradı.

D ξ= M(ξ-Mξ) 2 . (1)

Başka bir deyişle dağılım, bir rastgele değişkenin değerlerinin ortalama değerinden sapmasının karesinin matematiksel beklentisidir.

isminde ortalama kare sapma

miktarları ξ .

Dağılım, kare sapmanın ortalama boyutunu karakterize ediyorsa ξ itibaren , o zaman sayı bir miktar olarak kabul edilebilir ortalama karakteristik sapmanın kendisi, daha doğrusu büyüklük | ξ-Mξ |.

Dispersiyonun aşağıdaki iki özelliği tanım (1)'den kaynaklanmaktadır.

1. Sabit bir değerin varyansı sıfırdır. Bu, bir "dağılım ölçüsü" olarak dağılımın görsel anlamı ile oldukça tutarlıdır.

Gerçekten eğer

ξ = C, O Mξ = C ve bu demek ki Dξ = M(C-C) 2 = M 0 = 0.

2. Rastgele bir değişkeni çarparken ξ sabit bir C sayısı ile varyansı C 2 ile çarpılır

D(Cξ) = C 2 . (3)

Gerçekten

D(Cξ) = M(C

= M(C .

3. Varyansın hesaplanmasında aşağıdaki formül kullanılır:

. (4)

Bu formülün kanıtı matematiksel beklentinin özelliklerinden kaynaklanmaktadır.

Sahibiz:

4. Eğer değerler ξ 1 ve ξ 2 bağımsızsa, toplamlarının varyansı varyanslarının toplamına eşittir:

Kanıt . Bunu kanıtlamak için matematiksel beklentinin özelliklerini kullanıyoruz. İzin vermek 1 = m 1 , 2 = m 2 o zaman.

Formül (5) kanıtlanmıştır.

Bir rastgele değişkenin varyansı, tanım gereği, değerin matematiksel beklentisi olduğundan ( ξ -m) 2 , nerede m = Mξ, daha sonra varyansı hesaplamak için Bölüm II, §7'de elde edilen formülleri kullanabilirsiniz.

Yani eğer ξ dağıtım yasasına sahip bir DSV var

X 1 X 2 ...
P 1 P 2 ...

o zaman elimizde:

. (7)

Eğer ξ dağıtım yoğunluğuna sahip sürekli rastgele değişken p(x), o zaman şunu elde ederiz:

= . (8)

Varyansı hesaplamak için formül (4)'ü kullanırsanız başka formüller de elde edebilirsiniz:

, (9)

değer ise ξ ayrık ve

= , (10)

Eğer ξ yoğunlukla dağıtılmış P(X).

Örnek 1. Değere izin ver ξ segment üzerinde eşit olarak dağıtılmış [ a,b] Formül (10)'u kullanarak şunu elde ederiz:

Yoğunluk ile normal yasaya göre dağıtılan bir rastgele değişkenin varyansının olduğu gösterilebilir.

p(x)= , (11)

σ 2'ye eşittir.

Bu, normal yasa için yoğunluk ifadesinde (11) yer alan σ parametresinin anlamını açıklamaktadır; σ ξ değerinin standart sapması.

Örnek 2. Rastgele bir değişkenin varyansını bulun ξ , binom yasasına göre dağıtılır.


Çözüm . ξ'nin temsilinin formda kullanılması

ξ = ξ 1 + ξ 2 + n(bkz. örnek 2 §7 bölüm II) ve bağımsız nicelikler için varyansların eklenmesine ilişkin formülü uygulayarak şunu elde ederiz:

Dξ = Dξ 1 + Dξ 2 +Dξn .

Herhangi bir miktarın dağılımı ξ ben (Ben= 1,2, N) doğrudan hesaplanır:

Dξ ben = ​​M(ξ ben) 2 - (Mξi) 2 = 0 2 · Q+ 1 2 P- P 2 = P(1-P) = pq.

Sonunda elde ettik

= npq, Nerede q = 1 -P.

Hadi hesaplayalımHANIMMÜKEMMELvaryans ve standart sapmaörnekler. Ayrıca, dağılımı biliniyorsa rastgele değişkenin varyansını da hesaplayacağız.

İlk önce düşünelim dağılım, Daha sonra standart sapma.

Örnek varyans

Örnek varyans (örnek varyans,örnekvaryans) dizideki değerlerin .'ye göre yayılmasını karakterize eder.

Her 3 formül de matematiksel olarak eşdeğerdir.

İlk formülden açıkça görülüyor ki örnek varyans dizideki her değerin sapmalarının karelerinin toplamıdır ortalamadan, örneklem büyüklüğü eksi 1'e bölünür.

farklılıklar örnekler DISP() işlevi kullanılır, İngilizce. VAR adı, yani Varyans. MS EXCEL 2010 sürümünden itibaren İngilizce DISP.V() analogunun kullanılması tavsiye edilir. VARS adı, yani Örnek VARyans. Ek olarak, MS EXCEL 2010 sürümünden itibaren İngilizce DISP.Г() işlevi bulunmaktadır. VARP adı, yani Nüfus VARiance'ını hesaplayan dağılımİçin nüfus. Tüm fark paydada ortaya çıkıyor: DISP.V() gibi n-1 yerine, DISP.G()'nin paydasında sadece n var. MS EXCEL 2010'dan önce, popülasyonun varyansını hesaplamak için VAR() işlevi kullanılıyordu.

Örnek varyans
=QUADROTCL(Örnek)/(COUNT(Örnek)-1)
=(SUM(Örnek)-COUNT(Örnek)*AVERAGE(Örnek)^2)/ (COUNT(Örnek)-1)– olağan formül
=TOPLA((Örnek -ORTALAMA(Örnek))^2)/ (COUNT(Örnek)-1) –

Örnek varyans 0'a eşittir, ancak tüm değerler birbirine eşitse ve buna göre eşitse ortalama değer. Genellikle değer ne kadar büyük olursa farklılıklar dizideki değerlerin yayılması o kadar büyük olur.

Örnek varyans bir nokta tahminidir farklılıklar yapıldığı rastgele değişkenin dağılımı örnek. İnşaat hakkında güvenilirlik aralığı değerlendirirken farklılıklar makalede okuyabilirsiniz.

Rastgele bir değişkenin varyansı

Hesaplamak dağılım Rastgele değişken, bunu bilmeniz gerekir.

İçin farklılıklar Rastgele değişken X genellikle Var(X) olarak gösterilir. Dağılım ortalamadan sapmanın karesine eşittir E(X): Var(X)=E[(X-E(X)) 2 ]

dağılım formülle hesaplanır:

burada x i bir rastgele değişkenin alabileceği değer ve μ ortalama değerdir (), p(x) rastgele değişkenin x değerini alma olasılığıdır.

Eğer bir rastgele değişken varsa, o zaman dağılım formülle hesaplanır:

Boyut farklılıklar orijinal değerlerin ölçü biriminin karesine karşılık gelir. Örneğin, numunedeki değerler parça ağırlığı ölçümlerini (kg cinsinden) temsil ediyorsa, fark boyutu kg 2 olacaktır. Bunu yorumlamak zor olabilir, bu nedenle değerlerin yayılmasını karakterize etmek için şuna eşit bir değer kullanın: kare kök itibaren farklılıklarstandart sapma.

Bazı özellikler farklılıklar:

Var(X+a)=Var(X), burada X rastgele bir değişkendir ve a bir sabittir.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Bu dağılım özelliği şu durumlarda kullanılır: doğrusal regresyon hakkında makale.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), burada X ve Y rastgele değişkenlerdir, Cov(X;Y) bu rastgele değişkenlerin kovaryansıdır.

Rastgele değişkenler bağımsız ise kovaryans 0'a eşittir ve dolayısıyla Var(X+Y)=Var(X)+Var(Y). Dağılımın bu özelliği türetmede kullanılır.

Bağımsız nicelikler için Var(X-Y)=Var(X+Y) olduğunu gösterelim. Aslında, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Bu dağılım özelliği oluşturmak için kullanılır.

Numune standart sapması

Numune standart sapması bir numunedeki değerlerin kendilerine göre ne kadar geniş bir alana dağıldığının bir ölçüsüdür.

A-tarikatı, standart sapma kareköküne eşit farklılıklar:

Standart sapma değerlerin büyüklüğünü dikkate almaz örnek, ancak yalnızca etraflarındaki değerlerin dağılım derecesi ortalama. Bunu açıklamak için bir örnek verelim.

2 örnek için standart sapmayı hesaplayalım: (1; 5; 9) ve (1001; 1005; 1009). Her iki durumda da s=4. Standart sapmanın dizi değerlerine oranının örnekler arasında önemli ölçüde farklılık gösterdiği açıktır. Bu gibi durumlarda kullanılır Değişim katsayısı(Değişme Katsayısı, CV) - oran Standart sapma ortalamaya aritmetik yüzde olarak ifade edilir.

Hesaplama için MS EXCEL 2007 ve önceki sürümlerde Numune standart sapması=STDEVAL() işlevi İngilizce olarak kullanılır. STDEV adı, yani Standart sapma. MS EXCEL 2010 sürümünden itibaren İngilizce =STDEV.B() analogunun kullanılması tavsiye edilir. STDEV.S adı, yani Numune standart sapması.

Ek olarak, MS EXCEL 2010 sürümünden itibaren İngilizce STANDARDEV.G() işlevi bulunmaktadır. STDEV.P adı, yani Nüfus STandart Sapması, hesaplayan standart sapmaİçin nüfus. Tüm fark paydaya iner: STANDARDEV.V()'daki gibi n-1 yerine STANDARDEVAL.G()'nin paydasında sadece n bulunur.

Standart sapma aşağıdaki formüller kullanılarak da doğrudan hesaplanabilir (örnek dosyaya bakın)
=KÖK(DÖRTLÜKCL(Örnek)/(COUNT(Örnek)-1))
=KÖK((TOPLA(Örnek)-COUNT(Örnek)*ORTALAMA(Örnek)^2)/(COUNT(Örnek)-1))

Diğer dağılım ölçüleri

SQUADROTCL() fonksiyonu şununla hesaplama yapar: değerlerin karesel sapmalarının toplamı ortalama. Bu işlev =DISP.G( formülüyle aynı sonucu verecektir. Örnek)*KONTROL ETMEK( Örnek) , Nerede Örnek- bir dizi örnek değer () içeren bir aralığa referans. QUADROCL() fonksiyonundaki hesaplamalar aşağıdaki formüle göre yapılır:

SROTCL() işlevi aynı zamanda bir veri kümesinin yayılmasının bir ölçüsüdür. SROTCL() işlevi, değerlerin sapmalarının mutlak değerlerinin ortalamasını hesaplar. ortalama. Bu işlev formülle aynı sonucu döndürecektir =TOPLAÇARP(ABS(Örnek-ORTALAMA(Örnek)))/COUNT(Örnek), Nerede Örnek- örnek değerlerin bir dizisini içeren bir aralığa bağlantı.

SROTCL () fonksiyonundaki hesaplamalar aşağıdaki formüle göre yapılır:

Rastgele bir değişkenin varyansı, bu değişkenin değerlerinin yayılımının bir ölçüsüdür. Düşük varyans, değerlerin birbirine yakın kümelendiği anlamına gelir. Büyük dağılım, değerlerin güçlü bir yayılımını gösterir. Rastgele değişkenin varyansı kavramı istatistikte kullanılır. Örneğin iki değerin varyansını karşılaştırırsanız (erkek ve kadın hastalar arasında olduğu gibi), bir değişkenin anlamlılığını test edebilirsiniz. Düşük varyans, değerlere gereğinden fazla uyduğunuzun bir işareti olabileceğinden, istatistiksel modeller oluştururken de varyans kullanılır.

Adımlar

Örnek varyansının hesaplanması

  1. Örnek değerleri kaydedin.Çoğu durumda istatistikçiler yalnızca belirli popülasyonların örneklerine erişebilir. Örneğin, kural olarak, istatistikçiler Rusya'daki tüm arabaların toplamını korumanın maliyetini analiz etmiyorlar - birkaç bin arabadan oluşan rastgele bir örneği analiz ediyorlar. Böyle bir örnek, bir arabanın ortalama maliyetini belirlemeye yardımcı olacaktır, ancak büyük olasılıkla ortaya çıkan değer gerçek değerden uzak olacaktır.

    • Örneğin, bir kafede 6 gün boyunca satılan çörek sayısını rastgele sırayla analiz edelim. Örnek şuna benzer: 17, 15, 23, 7, 9, 13. Bu bir popülasyon değil örnektir çünkü kafenin açık olduğu her gün için satılan çöreklere ilişkin verimiz yoktur.
    • Size bir değer örneği yerine bir popülasyon verildiyse bir sonraki bölüme geçin.
  2. Örnek varyansını hesaplamak için bir formül yazın. Dağılım, belirli bir miktardaki değerlerin yayılımının bir ölçüsüdür. Nasıl daha yakın değer dağılım sıfıra ne kadar yakınsa değerler birbirine o kadar yakın gruplanır. Bir değer örneğiyle çalışırken varyansı hesaplamak için aşağıdaki formülü kullanın:

    • s 2 (\displaystyle s^(2)) = ∑[(x ben (\displaystyle x_(i))- X) 2 (\displaystyle ^(2))] / (n-1)
    • s 2 (\displaystyle s^(2))– bu dağılımdır. Dağılım birim kare cinsinden ölçülür.
    • x ben (\displaystyle x_(i))– numunedeki her değer.
    • x ben (\displaystyle x_(i)) x̅'i çıkarmanız, karesini almanız ve ardından sonuçları eklemeniz gerekir.
    • x̅ – örnek ortalaması (örnek ortalaması).
    • n – örnekteki değerlerin sayısı.
  3. Örnek ortalamasını hesaplayın. X̅ olarak gösterilir. Örnek ortalaması basit bir aritmetik ortalama olarak hesaplanır: örnekteki tüm değerleri toplayın ve ardından sonucu örnekteki değer sayısına bölün.

    • Örneğimizde örnekteki değerleri toplayın: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Şimdi sonucu örnekteki değer sayısına bölün (örneğimizde 6 tane var): 84 ÷ 6 = 14.
      Örnek ortalama x̅ = 14.
    • Örnek ortalaması, örnekteki değerlerin etrafında dağıldığı merkezi değerdir. Örnek kümedeki değerler örnek ortalamanın etrafında ise varyans küçüktür; aksi takdirde varyans büyüktür.
  4. Örnek ortalamasını örnekteki her değerden çıkarın.Şimdi farkı hesaplayın x ben (\displaystyle x_(i))- x̅, nerede x ben (\displaystyle x_(i))– numunedeki her değer. Elde edilen her sonuç, belirli bir değerin örneklem ortalamasından sapma derecesini, yani bu değerin örneklem ortalamasından ne kadar uzakta olduğunu gösterir.

    • Örneğimizde:
      x 1 (\displaystyle x_(1))- x = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Toplamlarının sıfıra eşit olması gerektiğinden elde edilen sonuçların doğruluğunu kontrol etmek kolaydır. Bu ortalama değerin belirlenmesiyle ilgilidir, çünkü negatif değerler(ortalama değerden daha küçük değerlere olan mesafeler) tamamen telafi edilir pozitif değerler(ortalamadan büyük değerlere olan mesafeler).
  5. Yukarıda belirtildiği gibi farkların toplamı x ben (\displaystyle x_(i))- x̅ sıfıra eşit olmalıdır. Bu, ortalama varyansın her zaman sıfır olduğu anlamına gelir ve bu da belirli bir miktardaki değerlerin yayılımı hakkında herhangi bir fikir vermez. Bu sorunu çözmek için her farkın karesini alın x ben (\displaystyle x_(i))- X. Bu, yalnızca pozitif sayılar, eklendiğinde asla 0 vermeyecektir.

    • Örneğimizde:
      (x 1 (\displaystyle x_(1))- X) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))- X) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Farkın karesini buldunuz - x̅) 2 (\displaystyle ^(2))Örnekteki her değer için.
  6. Farkların karelerinin toplamını hesaplayın. Yani formülün şu şekilde yazılan kısmını bulun: ∑[( x ben (\displaystyle x_(i))- X) 2 (\displaystyle ^(2))] Burada Σ işareti her değer için kare farkların toplamı anlamına gelir x ben (\displaystyle x_(i))örnekte. Kare farklarını zaten buldunuz (x ben (\displaystyle (x_(i))- X) 2 (\displaystyle ^(2)) her değer için x ben (\displaystyle x_(i))örnekte; şimdi sadece bu kareleri ekleyin.

    • Örneğimizde: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Sonucu n - 1'e bölün; burada n, örnekteki değerlerin sayısıdır. Bir süre önce, örneklem varyansını hesaplamak için istatistikçiler sonucu basitçe n'ye bölüyordu; bu durumda, belirli bir örneğin varyansını tanımlamak için ideal olan kare varyansın ortalamasını elde edersiniz. Ancak herhangi bir örneğin değer popülasyonunun yalnızca küçük bir kısmı olduğunu unutmayın. Başka bir örnek alıp aynı hesaplamaları yaparsanız farklı bir sonuç elde edersiniz. Görünen o ki, (sadece n yerine) n - 1'e bölmek, ilgilendiğiniz şey olan popülasyon varyansının daha doğru bir tahminini veriyor. N – 1'e bölme yaygın hale geldi, bu nedenle örnek varyansını hesaplama formülüne dahil edildi.

    • Örneğimizde örnek 6 değer içermektedir, yani n = 6.
      Örneklem varyansı = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Varyans ve standart sapma arasındaki fark. Formülün bir üs içerdiğini, dolayısıyla dağılımın analiz edilen değerin birim kare cinsinden ölçüldüğünü unutmayın. Bazen böyle bir büyüklüğün işletilmesi oldukça zordur; bu gibi durumlarda varyansın kareköküne eşit olan standart sapmayı kullanın. Bu nedenle örneklem varyansı şu şekilde gösterilir: s 2 (\displaystyle s^(2)) ve numunenin standart sapması şu şekildedir: s (\displaystyle s).

    • Örneğimizde numunenin standart sapması: s = √33,2 = 5,76.

    Nüfus Varyansının Hesaplanması

    1. Bazı değer kümelerini analiz edin. Set, söz konusu miktarın tüm değerlerini içerir. Örneğin, sakinlerin yaşını inceliyorsanız Leningrad bölgesi, bu durumda nüfus, bu bölgede yaşayan tüm sakinlerin yaşlarını içerir. Bir popülasyonla çalışırken bir tablo oluşturularak nüfus değerlerinin bu tabloya girilmesi önerilir. Aşağıdaki örneği düşünün:

      • Belirli bir odada 6 adet akvaryum bulunmaktadır. Her akvaryumda aşağıdaki sayıda balık bulunur:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Popülasyon varyansını hesaplamak için bir formül yazın. Toplam, belirli bir miktarın tüm değerlerini içerdiğinden aşağıdaki formül elde etmemizi sağlar: Kesin değer nüfus farklılıkları. Nüfus varyansını örneklem varyansından (ki bu yalnızca bir tahmindir) ayırt etmek için istatistikçiler çeşitli değişkenler kullanır:

      • σ 2 (\displaystyle ^(2)) = (∑(x ben (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)))/N
      • σ 2 (\displaystyle ^(2))– nüfus dağılımı (“sigma kare” olarak okunur). Dağılım birim kare cinsinden ölçülür.
      • x ben (\displaystyle x_(i))– her değer kendi bütünlüğü içinde.
      • Σ – toplam işareti. Yani her değerden x ben (\displaystyle x_(i))μ'yu çıkarmanız, karesini almanız ve ardından sonuçları eklemeniz gerekir.
      • μ – nüfus ortalaması.
      • n – popülasyondaki değerlerin sayısı.
    3. Nüfus ortalamasını hesaplayın. Bir popülasyonla çalışırken ortalaması μ (mu) olarak gösterilir. Popülasyon ortalaması basit bir aritmetik ortalama olarak hesaplanır: popülasyondaki tüm değerleri toplayın ve ardından sonucu popülasyondaki değer sayısına bölün.

      • Ortalamaların her zaman aritmetik ortalama olarak hesaplanmadığını unutmayın.
      • Örneğimizde popülasyonun anlamı: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Popülasyondaki her değerden popülasyon ortalamasını çıkarın. Fark sıfıra ne kadar yakınsa o kadar yakın olur. özel anlam nüfus anlamına gelir. Popülasyondaki her değer ile ortalaması arasındaki farkı bulun ve değerlerin dağılımı hakkında ilk fikri elde edeceksiniz.

      • Örneğimizde:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Elde edilen her sonucun karesini alın. Fark değerleri hem pozitif hem de negatif olacaktır; Bu değerler bir sayı doğrusu üzerinde çizilirse popülasyon ortalamasının sağında ve solunda yer alacaktır. Pozitif ve pozitif olduğundan bu, varyansın hesaplanması için uygun değildir. negatif sayılar birbirini telafi edin. Yani tamamen pozitif sayılar elde etmek için her farkın karesini alın.

      • Örneğimizde:
        (x ben (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) her popülasyon değeri için (i = 1'den i = 6'ya):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Nerede x n (\displaystyle x_(n))– popülasyondaki son değer.
      • Elde edilen sonuçların ortalama değerini hesaplamak için toplamlarını bulup n'ye bölmeniz gerekir:(( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)))/N
      • Şimdi yukarıdaki açıklamayı değişkenleri kullanarak yazalım: (∑( x ben (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n ve popülasyon varyansını hesaplamak için bir formül elde edin.

İstatistiklerde dağılım karakteristiğin bireysel değerlerinin karesi olarak bulunur. Başlangıç ​​verilerine bağlı olarak basit ve ağırlıklı varyans formülleri kullanılarak belirlenir:

1. (gruplandırılmamış veriler için) aşağıdaki formül kullanılarak hesaplanır:

2. Ağırlıklı varyans (varyasyon serileri için):

burada n frekanstır (X faktörünün tekrarlanabilirliği)

Varyansı bulma örneği

Bu sayfada varyans bulmanın standart bir örneği açıklanmaktadır; bunu bulmak için diğer problemlere de bakabilirsiniz.

Örnek 1. 20 kişilik bir öğrenci grubu için aşağıdaki veriler mevcuttur. Yazışma bölümü. Karakteristiğin dağılımına ilişkin bir aralık serisi oluşturmak, özelliğin ortalama değerini hesaplamak ve dağılımını incelemek gerekir.

Bir aralık gruplaması oluşturalım. Aşağıdaki formülü kullanarak aralığın aralığını belirleyelim:

burada Xmax, gruplandırma karakteristiğinin maksimum değeridir;
X min – gruplandırma karakteristiğinin minimum değeri;
n – aralık sayısı:

n=5 kabul ediyoruz. Adım: h = (192 - 159)/ 5 = 6,6

Bir aralık gruplaması oluşturalım

Daha fazla hesaplama için yardımcı bir tablo oluşturacağız:

X'i aralığın ortasıdır. (örneğin 159 – 165,6 aralığının ortası = 162,3)

Ağırlıklı aritmetik ortalama formülünü kullanarak öğrencilerin ortalama boyunu belirleriz:

Aşağıdaki formülü kullanarak varyansı belirleyelim:

Dispersiyon formülü aşağıdaki gibi dönüştürülebilir:

Bu formülden şu sonuç çıkıyor varyans eşittir seçeneklerin karelerinin ortalaması ile kare ve ortalama arasındaki fark.

Varyans varyasyon serisi Momentler yöntemini kullanarak eşit aralıklarla, ikinci dağılım özelliği kullanılarak (tüm seçeneklerin aralığın değerine bölünmesiyle) aşağıdaki şekilde hesaplanabilir. Varyansın belirlenmesi Momentler yöntemiyle hesaplanan aşağıdaki formül daha az emek yoğun:

burada i aralığın değeridir;
A, aralığın ortasını en yüksek frekansla kullanmanın uygun olduğu geleneksel bir sıfırdır;
m1 birinci dereceden momentin karesidir;
m2 - ikinci derecenin anı

(istatistiksel bir popülasyonda bir özellik yalnızca iki birbirini dışlayan seçenek olacak şekilde değişirse, bu tür değişkenliğe alternatif denir) aşağıdaki formül kullanılarak hesaplanabilir:

Bu dağılım formülünde q = 1-p'yi yerine koyarsak şunu elde ederiz:

Varyans türleri

Toplam varyans Bir özelliğin, bu varyasyona neden olan tüm faktörlerin etkisi altında popülasyonun tamamındaki değişimini bir bütün olarak ölçer. Bir x karakteristiğinin bireysel değerlerinin, x'in genel ortalama değerinden sapmalarının ortalama karesine eşittir ve basit varyans veya ağırlıklı varyans olarak tanımlanabilir.

rastgele değişimi karakterize eder, yani Değişimin hesaba katılmayan faktörlerin etkisinden kaynaklanan ve grubun temelini oluşturan faktör özelliğine bağlı olmayan kısmı. Bu tür bir dağılım, X grubu içindeki özelliğin bireysel değerlerinin grubun aritmetik ortalamasından sapmalarının ortalama karesine eşittir ve basit dağılım veya ağırlıklı dağılım olarak hesaplanabilir.

Böylece, grup içi varyans ölçümleri Bir grup içindeki bir özelliğin varyasyonu aşağıdaki formülle belirlenir:

burada xi grup ortalamasıdır;
ni gruptaki birimlerin sayısıdır.

Örneğin, bir atölyede işçilerin niteliklerinin işgücü üretkenliği düzeyi üzerindeki etkisini inceleme probleminde belirlenmesi gereken grup içi farklılıklar, her gruptaki çıktıda tüm olası faktörlerden kaynaklanan farklılıklar gösterir ( teknik durum ekipman, alet ve malzemelerin mevcudiyeti, işçilerin yaşı, iş yoğunluğu vb., yeterlilik kategorisindeki farklılıklar hariç (bir grup içinde tüm işçiler aynı niteliklere sahiptir).

Grup içi varyansların ortalaması, rastgeleliği, yani varyasyonun gruplandırma faktörü haricindeki tüm diğer faktörlerin etkisi altında meydana gelen kısmını yansıtır. Aşağıdaki formül kullanılarak hesaplanır:

Grubun temelini oluşturan faktör işaretinin etkisinden kaynaklanan, ortaya çıkan özelliğin sistematik varyasyonunu karakterize eder. Grup ortalamalarının genel ortalamadan sapmalarının ortalama karesine eşittir. Gruplar arası varyans aşağıdaki formül kullanılarak hesaplanır:

İstatistiklere varyans ekleme kuralı

Buna göre varyans ekleme kuralı toplam varyans, grup içi ve gruplar arası varyansların ortalamasının toplamına eşittir:

Bu kuralın anlamı tüm faktörlerin etkisi altında ortaya çıkan toplam varyansın, diğer tüm faktörlerin etkisi altında ortaya çıkan varyanslar ile gruplama faktöründen dolayı ortaya çıkan varyansın toplamına eşit olmasıdır.

Varyans ekleme formülünü kullanarak, bilinen iki varyanstan üçüncü bilinmeyen varyansı belirleyebilir ve ayrıca gruplandırma özelliğinin etkisinin gücünü değerlendirebilirsiniz.

Dispersiyon özellikleri

1. Bir özelliğin tüm değerleri aynı sabit miktarda azaltılırsa (artırılırsa) dağılım değişmeyecektir.
2. Bir özelliğin tüm değerleri aynı sayıda n kadar azaltılırsa (artırılırsa), varyans buna karşılık olarak n^2 kat azalacaktır (artacaktır).

İstatistikte kullanılan birçok gösterge arasında varyans hesaplamasını vurgulamak gerekir. Bu hesaplamayı manuel olarak yapmanın oldukça sıkıcı bir iş olduğunu belirtmek gerekir. Neyse ki Excel, hesaplama prosedürünü otomatikleştirmenize olanak tanıyan işlevlere sahiptir. Bu araçlarla çalışmanın algoritmasını bulalım.

Dağılım, matematiksel beklentiden sapmaların ortalama karesi olan varyasyonun bir göstergesidir. Böylece sayıların ortalama değer etrafındaki yayılımını ifade eder. Varyansın hesaplanması hem genel popülasyon hem de örneklem için yapılabilir.

Yöntem 1: nüfusa dayalı hesaplama

Bu göstergeyi genel nüfus için Excel'de hesaplamak için işlevi kullanın. DISP.G. Bu ifadenin sözdizimi aşağıdaki gibidir:

DISP.G(Sayı1;Sayı2;…)

Toplamda 1'den 255'e kadar argüman kullanılabilir. Bağımsız değişkenler sayısal değerler olabileceği gibi içerdikleri hücrelere referanslar da olabilir.

Sayısal verilerle bir aralık için bu değerin nasıl hesaplanacağını görelim.


Yöntem 2: numuneye göre hesaplama

Popülasyona dayalı bir değer hesaplamanın aksine, bir örneklem hesaplanırken payda, sayıların toplam sayısını değil, bir eksiğini gösterir. Bu, hata düzeltme amacıyla yapılır. Excel, bu tür hesaplamalar için tasarlanmış özel bir işlev olan DISP.V'de bu nüansı dikkate alır. Sözdizimi aşağıdaki formülle temsil edilir:

DISP.B(Sayı1;Sayı2;…)

Önceki fonksiyonda olduğu gibi argüman sayısı da 1 ile 255 arasında değişebilir.


Gördüğünüz gibi Excel programı varyansın hesaplanmasını büyük ölçüde kolaylaştırabilir. Bu istatistik uygulama tarafından popülasyondan veya örneklemden hesaplanabilir. Bu durumda, tüm kullanıcı eylemleri aslında işlenecek sayı aralığının belirlenmesine indirgenir ve asıl işi Excel kendisi yapar. Tabii ki, bu önemli miktarda kullanıcı zamanından tasarruf sağlayacaktır.

Görüntüleme