Varianta este determinată de formulă. Cum se calculează varianța unei variabile aleatoare

Această pagină descrie un exemplu standard de găsire a varianței, puteți, de asemenea, să vă uitați la alte probleme pentru a o găsi

Exemplul 1. Determinarea grupului, mediei grupului, intergrupurilor și varianței totale

Exemplul 2. Găsirea varianței și coeficientului de variație într-un tabel de grupare

Exemplul 3. Găsirea varianței într-o serie discretă

Exemplul 4. Următoarele date sunt disponibile pentru un grup de 20 de elevi departamentul de corespondență. Este necesar să se construiască o serie de intervale a distribuției caracteristicii, să se calculeze valoarea medie a caracteristicii și să se studieze dispersia acesteia

Să construim o grupare de intervale. Să determinăm intervalul intervalului folosind formula:

unde X max este valoarea maximă a caracteristicii de grupare;
X min – valoarea minimă a caracteristicii de grupare;
n – numărul de intervale:

Acceptăm n=5. Pasul este: h = (192 - 159)/ 5 = 6,6

Să creăm o grupare de intervale

Pentru calcule suplimentare, vom construi un tabel auxiliar:

X"i – mijlocul intervalului. (de exemplu, mijlocul intervalului 159 – 165,6 = 162,3)

Valoarea medie Vom determina înălțimea elevilor folosind formula mediei aritmetice ponderate:

Să determinăm varianța folosind formula:

Formula poate fi transformată astfel:

Din această formulă rezultă că varianța este egală cu diferența dintre media pătratelor opțiunilor și pătratul și media.

Dispersie în serie de variații cu intervale egale folosind metoda momentelor se poate calcula în felul următor folosind a doua proprietate a dispersiei (împărțirea tuturor opțiunilor la valoarea intervalului). Determinarea varianței, calculat folosind metoda momentelor, folosind următoarea formulă este mai puțin intensivă în muncă:

unde i este valoarea intervalului;
A este un zero convențional, pentru care este convenabil să se folosească mijlocul intervalului cu cea mai mare frecvență;
m1 este pătratul momentului de ordinul întâi;
m2 - moment de ordinul doi

Varianta alternativă a trăsăturilor (dacă într-o populație statistică o caracteristică se modifică în așa fel încât există doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată folosind formula:

Înlocuind q = 1- p în această formulă de dispersie, obținem:

Tipuri de variație

Varianta totala măsoară variația unei caracteristici la nivelul întregii populații în ansamblu sub influența tuturor factorilor care provoacă această variație. Este egal cu pătratul mediu al abaterilor valorilor individuale ale unei caracteristici x de la valoarea medie globală a lui x și poate fi definită ca varianță simplă sau varianță ponderată.

Varianta în cadrul grupului caracterizează variația aleatoare, adică parte a variației care se datorează influenței factorilor necontabiliați și nu depinde de atributul-factorial care formează baza grupului. O astfel de dispersie este egală cu pătratul mediu al abaterilor valorilor individuale ale atributului din grupul X de la media aritmetică a grupului și poate fi calculată ca dispersie simplă sau ca dispersie ponderată.



Astfel, măsuri de variație în cadrul grupului variația unei trăsături în cadrul unui grup și este determinată de formula:

unde xi este media grupului;
ni este numărul de unități din grup.

De exemplu, variațiile intra-grup care trebuie determinate în problema studierii influenței calificărilor lucrătorilor asupra nivelului productivității muncii într-un atelier arată variații ale producției în fiecare grup cauzate de toți factorii posibili ( stare tehnica echipamente, disponibilitatea sculelor și materialelor, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor de categorie de calificare (în cadrul unui grup, toți lucrătorii au aceleași calificări).

Dispersia variabilă aleatoare este o măsură a răspândirii valorilor acestei cantități. Varianta scăzută înseamnă că valorile sunt grupate strâns. Dispersia mare indică o răspândire puternică a valorilor. Conceptul de varianță a unei variabile aleatoare este utilizat în statistică. De exemplu, dacă comparați varianța a două valori (cum ar fi între pacienții de sex masculin și de sex feminin), puteți testa semnificația unei variabile. Varianta este, de asemenea, utilizată la construirea modelelor statistice, deoarece variația scăzută poate fi un semn că supraajustați valorile.

Pași

Calcularea varianței eșantionului

  1. Înregistrați valorile eșantionului.În cele mai multe cazuri, statisticienii au acces doar la mostre de populații specifice. De exemplu, de regulă, statisticienii nu analizează costul întreținerii totalității tuturor mașinilor din Rusia - ei analizează un eșantion aleatoriu de câteva mii de mașini. Un astfel de eșantion va ajuta la determinarea costului mediu al unei mașini, dar, cel mai probabil, valoarea rezultată va fi departe de cea reală.

    • De exemplu, să analizăm numărul de chifle vândute într-o cafenea pe parcursul a 6 zile, luate în ordine aleatorie. Eșantionul arată astfel: 17, 15, 23, 7, 9, 13. Acesta este un eșantion, nu o populație, deoarece nu avem date despre chiflele vândute pentru fiecare zi în care cafeneaua este deschisă.
    • Dacă vi se oferă o populație mai degrabă decât un eșantion de valori, continuați la secțiunea următoare.
  2. Scrieți o formulă pentru a calcula varianța eșantionului. Dispersia este o măsură a răspândirii valorilor unei anumite cantități. Cum valoare mai apropiată dispersie la zero, cu atât valorile sunt grupate mai aproape unele de altele. Când lucrați cu selecția valorii, utilizați următoarea formulă pentru a calcula varianța:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))- x̅) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2))– aceasta este dispersia. Dispersia se măsoară în unități pătrate.
    • x i (\displaystyle x_(i))– fiecare valoare din eșantion.
    • x i (\displaystyle x_(i)) trebuie să scădeți x̅, să-l pătrați și apoi să adăugați rezultatele.
    • x̅ – medie eșantion (medie eșantion).
    • n – numărul de valori din eșantion.
  3. Calculați media eșantionului. Este notat cu x̅. Media eșantionului este calculată ca medie aritmetică simplă: se adună toate valorile din eșantion, apoi se împarte rezultatul la numărul de valori din eșantion.

    • În exemplul nostru, adăugați valorile din eșantion: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Acum împărțiți rezultatul la numărul de valori din eșantion (în exemplul nostru sunt 6): 84 ÷ 6 = 14.
      Media eșantionului x̅ = 14.
    • Media eșantionului este valoarea centrală în jurul căreia sunt distribuite valorile din eșantion. Dacă valorile din grupul de eșantion din jurul eșantionului sunt medii, atunci varianța este mică; în caz contrar, varianța este mare.
  4. Scădeți media eșantionului din fiecare valoare din eșantion. Acum calculează diferența x i (\displaystyle x_(i))- x̅, unde x i (\displaystyle x_(i))– fiecare valoare din eșantion. Fiecare rezultat obținut indică măsura în care o anumită valoare se abate de la media eșantionului, adică cât de departe este această valoare de media eșantionului.

    • În exemplul nostru:
      x 1 (\displaystyle x_(1))- x = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Corectitudinea rezultatelor obținute este ușor de verificat, deoarece suma lor ar trebui să fie egală cu zero. Aceasta este legată de determinarea valorii medii, deoarece valori negative(distanțele de la valoarea medie la valori mai mici) sunt complet compensate valori pozitive(distanțele de la valori medii la mari).
  5. După cum sa menționat mai sus, suma diferențelor x i (\displaystyle x_(i))- x̅ trebuie să fie egal cu zero. Aceasta înseamnă că varianța medie este întotdeauna zero, ceea ce nu dă nicio idee despre răspândirea valorilor unei anumite cantități. Pentru a rezolva această problemă, pătrați fiecare diferență x i (\displaystyle x_(i))- x̅. Acest lucru va avea ca rezultat doar obținerea numere pozitive, care atunci când este adăugată nu va da niciodată 0.

    • În exemplul nostru:
      (x 1 (\displaystyle x_(1))- x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2)))- x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Ai găsit pătratul diferenței - x̅) 2 (\displaystyle ^(2)) pentru fiecare valoare din eșantion.
  6. Calculați suma pătratelor diferențelor. Adică, găsiți acea parte a formulei care este scrisă astfel: ∑[( x i (\displaystyle x_(i))- x̅) 2 (\displaystyle ^(2))]. Aici semnul Σ înseamnă suma diferențelor pătrate pentru fiecare valoare x i (\displaystyle x_(i))în probă. Ați găsit deja diferențele la pătrat (x i (\displaystyle (x_(i)))- x̅) 2 (\displaystyle ^(2)) pentru fiecare valoare x i (\displaystyle x_(i))în probă; acum doar adăugați aceste pătrate.

    • În exemplul nostru: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Împărțiți rezultatul la n - 1, unde n este numărul de valori din eșantion. Cu ceva timp în urmă, pentru a calcula varianța eșantionului, statisticienii au împărțit pur și simplu rezultatul la n; în acest caz, veți obține media varianței pătrate, care este ideală pentru a descrie varianța unui eșantion dat. Dar amintiți-vă că orice eșantion este doar o mică parte din populația de valori. Dacă luați o altă probă și efectuați aceleași calcule, veți obține un rezultat diferit. După cum se dovedește, împărțirea la n - 1 (mai degrabă decât doar n) oferă o estimare mai precisă a varianței populației, care este ceea ce vă interesează. Împărțirea cu n – 1 a devenit obișnuită, deci este inclusă în formula pentru calcularea varianței eșantionului.

    • În exemplul nostru, eșantionul include 6 valori, adică n = 6.
      Varianta eșantionului = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Diferența dintre varianță și abaterea standard. Rețineți că formula conține un exponent, astfel încât dispersia este măsurată în unități pătrate ale valorii analizate. Uneori, o astfel de mărime este destul de dificil de operat; în astfel de cazuri, utilizați abaterea standard, care este egală cu rădăcina pătrată a varianței. De aceea varianța eșantionului se notează ca s 2 (\displaystyle s^(2)), A abaterea standard mostre - cum s (\displaystyle s).

    • În exemplul nostru, abaterea standard a eșantionului este: s = √33,2 = 5,76.

    Calcularea variației populației

    1. Analizați un set de valori. Setul include toate valorile cantității luate în considerare. De exemplu, dacă studiezi vârsta rezidenților Regiunea Leningrad, atunci populația include vârstele tuturor locuitorilor acestei zone. Când lucrați cu o populație, se recomandă să creați un tabel și să introduceți valorile populației în el. Luați în considerare următorul exemplu:

      • Într-o anumită cameră sunt 6 acvarii. Fiecare acvariu conține următorul număr de pești:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Scrieți o formulă pentru a calcula varianța populației.Întrucât totalitatea include toate valorile unei anumite cantități, formula de mai jos ne permite să obținem valoarea exacta variaţiile populaţiei. Pentru a distinge varianța populației de varianța eșantionului (care este doar o estimare), statisticienii folosesc diverse variabile:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)))/n
      • σ 2 (\displaystyle ^(2))– dispersia populației (a se citi „sigma pătrat”). Dispersia se măsoară în unități pătrate.
      • x i (\displaystyle x_(i))– fiecare valoare în întregime.
      • Σ – semnul sumei. Adică din fiecare valoare x i (\displaystyle x_(i)) trebuie să scădeți μ, să-l pătrați și apoi să adăugați rezultatele.
      • μ – media populației.
      • n – numărul de valori din populație.
    3. Calculați media populației. Când se lucrează cu o populație, media ei este notată ca μ (mu). Media populației este calculată ca medie aritmetică simplă: se adună toate valorile din populație și apoi se împarte rezultatul la numărul de valori din populație.

      • Rețineți că mediile nu sunt întotdeauna calculate ca medie aritmetică.
      • În exemplul nostru, media populației: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Scădeți media populației din fiecare valoare din populație. Cu cât diferența este mai aproape de zero, cu atât mai aproape sens specific la media populaţiei. Găsiți diferența dintre fiecare valoare din populație și media acesteia și vă veți face o primă idee despre distribuția valorilor.

      • În exemplul nostru:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Patratează fiecare rezultat obținut. Valorile diferențelor vor fi atât pozitive, cât și negative; Dacă aceste valori sunt reprezentate pe o linie numerică, ele se vor afla la dreapta și la stânga mediei populației. Acest lucru nu este potrivit pentru calcularea varianței, deoarece pozitiv și numere negative compensa reciproc. Deci pătrați fiecare diferență pentru a obține numere exclusiv pozitive.

      • În exemplul nostru:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) pentru fiecare valoare a populației (de la i = 1 la i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Unde x n (\displaystyle x_(n))– ultima valoare din populatie.
      • Pentru a calcula valoarea medie a rezultatelor obținute, trebuie să găsiți suma lor și să o împărțiți la n:(( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)))/n
      • Acum să scriem explicația de mai sus folosind variabile: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n și obțineți o formulă pentru calcularea varianței populației.

Să calculăm înDOMNIȘOARĂEXCELAvarianța eșantionului și abaterea standard. Vom calcula, de asemenea, varianța unei variabile aleatoare dacă distribuția ei este cunoscută.

Să luăm în considerare mai întâi dispersie, atunci abaterea standard.

Varianta eșantionului

Varianta eșantionului (varianța eșantionului,eşantionvarianţă) caracterizează răspândirea valorilor în matrice relativ la .

Toate cele 3 formule sunt echivalente din punct de vedere matematic.

Din prima formulă este clar că varianța eșantionului este suma abaterilor pătrate ale fiecărei valori din matrice de la medie, împărțit la dimensiunea eșantionului minus 1.

variaţiile mostre se folosește funcția DISP(), engleză. numele VAR, adică Varianta. Din versiunea MS EXCEL 2010, se recomandă utilizarea sa analogică DISP.V(), engleză. numele VARS, adică Varianta eșantionului. În plus, începând cu versiunea de MS EXCEL 2010, există o funcție DISP.Г(), engleză. numele VARP, adică Varianta populației, care calculează dispersie Pentru populatie. Întreaga diferență se reduce la numitor: în loc de n-1 ca DISP.V(), DISP.G() are doar n în numitor. Înainte de MS EXCEL 2010, funcția VAR() a fost utilizată pentru a calcula varianța populației.

Varianta eșantionului
=QUADROTCL(Eșantion)/(COUNT(Eșantion)-1)
=(SUMA(Eșantion)-NUMĂR (Eșantion)*MEDIE(Eșantion)^2)/ (NUMĂR(Eșantion)-1)– formula uzuală
=SUMA((Eșantion -MEDIE(Eșantion))^2)/ (NUMĂR (Eșantion)-1) –

Varianta eșantionului este egal cu 0, numai dacă toate valorile sunt egale între ele și, în consecință, egale valoare medie. De obicei, cu cât valoarea este mai mare variaţiile, cu atât este mai mare răspândirea valorilor în matrice.

Varianta eșantionului este o estimare punctuala variaţiile distribuţia variabilei aleatoare din care a fost făcută eşantion. Despre construcție intervale de încredere la evaluare variaţiile poate fi citit in articol.

Varianta unei variabile aleatoare

Pentru a calcula dispersie variabilă aleatoare, trebuie să o știți.

Pentru variaţiile variabila aleatoare X este adesea desemnată Var(X). Dispersia egal cu pătratul abaterii de la medie E(X): Var(X)=E[(X-E(X)) 2 ]

dispersie calculat prin formula:

unde x i este valoarea pe care o poate lua o variabilă aleatoare și μ este valoarea medie (), p(x) este probabilitatea ca variabila aleatoare să ia valoarea x.

Dacă o variabilă aleatoare are , atunci dispersie calculat prin formula:

Dimensiune variaţiile corespunde pătratului unității de măsură a valorilor inițiale. De exemplu, dacă valorile din eșantion reprezintă măsurători ale greutății părții (în kg), atunci dimensiunea varianței ar fi kg 2 . Acest lucru poate fi dificil de interpretat, deci pentru a caracteriza răspândirea valorilor, o valoare egală cu rădăcina pătrată a variaţiileabaterea standard.

Unele proprietăți variaţiile:

Var(X+a)=Var(X), unde X este o variabilă aleatoare și a este o constantă.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Această proprietate de dispersie este utilizată în articol despre regresia liniară.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), unde X și Y sunt variabile aleatoare, Cov(X;Y) este covarianța acestor variabile aleatoare.

Dacă variabilele aleatoare sunt independente, atunci ele covarianta este egal cu 0 și, prin urmare, Var(X+Y)=Var(X)+Var(Y). Această proprietate de dispersie este utilizată în derivare.

Să arătăm că pentru mărimi independente Var(X-Y)=Var(X+Y). Într-adevăr, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Această proprietate de dispersie este utilizată pentru a construi .

Deviația standard a eșantionului

Deviația standard a eșantionului este o măsură a cât de larg sunt împrăștiate valorile dintr-un eșantion în raport cu .

Prin definiție, abaterea standard egal cu rădăcina pătrată a variaţiile:

Abaterea standard nu ține cont de mărimea valorilor în eşantion, ci doar gradul de dispersie a valorilor din jurul lor medie. Pentru a ilustra acest lucru, să dăm un exemplu.

Să calculăm abaterea standard pentru 2 eșantioane: (1; 5; 9) și (1001; 1005; 1009). În ambele cazuri, s=4. Este evident că raportul dintre abaterea standard și valorile matricei diferă semnificativ între eșantioane. Pentru astfel de cazuri este folosit Coeficientul de variație(Coeficient de variație, CV) - raport Abaterea standard la medie aritmetică, exprimat ca procent.

În MS EXCEL 2007 și versiuni anterioare pentru calcul Deviația standard a eșantionului se folosește funcția =STDEVAL(), engleză. numele STDEV, adică DEVIARE STANDARD. Din versiunea MS EXCEL 2010, se recomandă utilizarea analogului său =STANDDEV.B() , engleză. numele STDEV.S, adică Exemplu de deviare standard.

În plus, începând cu versiunea de MS EXCEL 2010, există o funcție STANDARDEV.G(), engleză. numele STDEV.P, adică Deviația standard a populației, care calculează abaterea standard Pentru populatie. Toată diferența se reduce la numitor: în loc de n-1 ca în STANDARDEV.V(), STANDARDEVAL.G() are doar n în numitor.

Abaterea standard poate fi calculat și direct folosind formulele de mai jos (vezi fișierul exemplu)
=ROOT(QUADROTCL(Eșantion)/(COUNT(Eșantion)-1))
=ROOT((SUMA(Eșantion)-NUMĂR (Eșantion)*MEDIA(Eșantion)^2)/(NUMĂR (Eșantion)-1))

Alte măsuri de împrăștiere

Funcția SQUADROTCL() calculează cu o sumă a abaterilor pătrate ale valorilor de la acestea medie. Această funcție va returna același rezultat ca și formula =DISP.G( Eşantion)*VERIFICA( Eşantion), Unde Eşantion- o referință la un interval care conține o matrice de valori ale eșantionului (). Calculele în funcția QUADROCL() se fac după formula:

Funcția SROTCL() este, de asemenea, o măsură a răspândirii unui set de date. Funcția SROTCL() calculează media valorilor absolute a abaterilor valorilor de la medie. Această funcție va returna același rezultat ca și formula =SUMPRODUS(ABS(Eșantion-MEDIE(Eșantion)))/COUNT(Eșantion), Unde Eşantion- o legătură către un interval care conține o serie de valori eșantion.

Calculele în funcția SROTCL () se fac după formula:

.

În schimb, dacă este un a.e. nenegativ. functioneaza astfel incat , atunci există o măsură de probabilitate absolut continuă, astfel încât să fie densitatea sa.

    Înlocuirea măsurii în integrala Lebesgue:

,

unde este orice funcție Borel care este integrabilă în raport cu măsura probabilității.

Dispersia, tipurile și proprietățile dispersiei Conceptul de dispersie

Dispersia în statistică se găsește ca abatere standard a valorilor individuale ale caracteristicii la pătrat de la media aritmetică. În funcție de datele inițiale, se determină folosind formulele de varianță simple și ponderate:

1. Varianta simpla(pentru date negrupate) se calculează folosind formula:

2. Varianta ponderată (pentru seriile de variații):

unde n este frecvența (repetabilitatea factorului X)

Un exemplu de găsire a varianței

Această pagină descrie un exemplu standard de găsire a varianței, puteți, de asemenea, să vă uitați la alte probleme pentru a o găsi

Exemplul 1. Determinarea grupului, mediei grupului, intergrupurilor și varianței totale

Exemplul 2. Găsirea varianței și coeficientului de variație într-un tabel de grupare

Exemplul 3. Găsirea varianței într-o serie discretă

Exemplul 4. Următoarele date sunt disponibile pentru un grup de 20 de studenți prin corespondență. Este necesar să se construiască o serie de intervale a distribuției caracteristicii, să se calculeze valoarea medie a caracteristicii și să se studieze dispersia acesteia

Să construim o grupare de intervale. Să determinăm intervalul intervalului folosind formula:

unde X max este valoarea maximă a caracteristicii de grupare; X min – valoarea minimă a caracteristicii de grupare; n – numărul de intervale:

Acceptăm n=5. Pasul este: h = (192 - 159)/ 5 = 6,6

Să creăm o grupare de intervale

Pentru calcule suplimentare, vom construi un tabel auxiliar:

X"i – mijlocul intervalului. (de exemplu, mijlocul intervalului 159 – 165,6 = 162,3)

Determinăm înălțimea medie a elevilor folosind formula medie aritmetică ponderată:

Să determinăm varianța folosind formula:

Formula poate fi transformată astfel:

Din această formulă rezultă că varianța este egală cu diferența dintre media pătratelor opțiunilor și pătratul și media.

Dispersie în serie de variații cu intervale egale folosind metoda momentelor se poate calcula în felul următor folosind a doua proprietate a dispersiei (împărțirea tuturor opțiunilor la valoarea intervalului). Determinarea varianței, calculat folosind metoda momentelor, folosind următoarea formulă este mai puțin laborioasă:

unde i este valoarea intervalului; A este un zero convențional, pentru care este convenabil să se folosească mijlocul intervalului cu cea mai mare frecvență; m1 este pătratul momentului de ordinul întâi; m2 - moment de ordinul doi

Varianta alternativă a trăsăturilor (dacă într-o populație statistică o caracteristică se modifică în așa fel încât există doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată folosind formula:

Înlocuind q = 1- p în această formulă de dispersie, obținem:

Tipuri de variație

Varianta totala măsoară variația unei caracteristici la nivelul întregii populații în ansamblu sub influența tuturor factorilor care provoacă această variație. Este egal cu pătratul mediu al abaterilor valorilor individuale ale unei caracteristici x de la valoarea medie globală a lui x și poate fi definită ca varianță simplă sau varianță ponderată.

Varianta în cadrul grupului caracterizează variația aleatoare, adică parte a variației care se datorează influenței factorilor necontabiliați și nu depinde de atributul-factorial care formează baza grupului. O astfel de dispersie este egală cu pătratul mediu al abaterilor valorilor individuale ale atributului din grupul X de la media aritmetică a grupului și poate fi calculată ca dispersie simplă sau ca dispersie ponderată.

Astfel, măsuri de variație în cadrul grupului variația unei trăsături în cadrul unui grup și este determinată de formula:

unde xi este media grupului; ni este numărul de unități din grup.

De exemplu, variațiile intragrup care trebuie determinate în sarcina de a studia influența calificărilor lucrătorilor asupra nivelului productivității muncii într-un atelier arată variații ale producției în fiecare grup cauzate de toți factorii posibili (starea tehnică a echipamentului, disponibilitatea instrumente și materiale, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor de categorie de calificare (în cadrul unui grup toți lucrătorii au aceleași calificări).

Media variațiilor în interiorul grupului reflectă variația aleatorie, adică acea parte a variației care a avut loc sub influența tuturor celorlalți factori, cu excepția factorului de grupare. Se calculează folosind formula:

Varianta intergrup caracterizează variaţia sistematică a caracteristicii rezultate, care se datorează influenţei factorului-atribut care formează baza grupului. Este egal cu pătratul mediu al abaterilor mediilor grupului de la media generală. Varianta intergrup este calculată folosind formula:

Cu toate acestea, această caracteristică singură nu este suficientă pentru a studia o variabilă aleatorie. Să ne imaginăm doi trăgători trăgând la o țintă. Unul trage cu precizie și lovește aproape de centru, în timp ce celălalt... se distrează și nici măcar nu țintește. Dar ce e amuzant este că el medie rezultatul va fi exact același cu primul shooter! Această situație este ilustrată în mod convențional de următoarele variabile aleatoare:

Așteptarea matematică „lunetist” este egală cu , însă, pentru „persoana interesantă”: – este și zero!

Astfel, este necesar să se cuantifice cât de departe risipite gloanțe (valori ale variabilelor aleatoare) raportate la centrul țintei (așteptări matematice). Bine împrăștiere tradus din latină nu este altfel decât dispersie .

Să vedem cum se determină această caracteristică numerică folosind unul dintre exemplele din prima parte a lecției:

Acolo am găsit o așteptare matematică dezamăgitoare a acestui joc, iar acum trebuie să calculăm varianța acestuia, care notat cu prin .

Să aflăm cât de mult sunt „împrăștiate” câștigurile/pierderile față de valoarea medie. Evident, pentru asta trebuie să calculăm diferențeîntre valori ale variabilelor aleatoare si ea așteptări matematice:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Acum se pare că trebuie să rezumați rezultatele, dar această cale nu este potrivită - din motivul că fluctuațiile din stânga se vor anula reciproc cu fluctuații spre dreapta. Deci, de exemplu, un trăgător „amator”. (exemplu de mai sus) diferențele vor fi , iar atunci când sunt adăugate vor da zero, așa că nu vom obține nicio estimare a dispersiei împușcării sale.

Pentru a ocoli această problemă, puteți lua în considerare module diferențe, dar din motive tehnice abordarea a prins rădăcini atunci când sunt pătrate. Este mai convenabil să formulați soluția într-un tabel:

Și aici se cere să calculeze medie ponderată valoarea abaterilor pătrate. Și CE este asta? Este al lor așteptări matematice, care este o măsură a împrăștierii:

definiţie variaţiile. Din definiție reiese imediat că varianța nu poate fi negativă– ia notă pentru practică!

Să ne amintim cum să găsim valoarea așteptată. Înmulțiți diferențele la pătrat cu probabilitățile corespunzătoare (continuare tabel):
– la sens figurat, aceasta este „forța de tracțiune”,
și rezumați rezultatele:

Nu crezi că, în comparație cu câștigurile, rezultatul s-a dovedit a fi prea mare? Așa este - l-am pătrat și pentru a reveni la dimensiunea jocului nostru, trebuie să extragem rădăcină pătrată. Această cantitate se numește abaterea standard și este notat cu litera greacă „sigma”:

Această valoare este uneori numită abaterea standard .

Care este sensul lui? Dacă ne abatem de la așteptarea matematică la stânga și la dreapta prin abaterea standard:

– atunci cele mai probabile valori ale variabilei aleatoare vor fi „concentrate” pe acest interval. Ce observăm de fapt:

Cu toate acestea, se întâmplă că atunci când se analizează împrăștierea se operează aproape întotdeauna cu conceptul de dispersie. Să ne dăm seama ce înseamnă în legătură cu jocuri. Dacă în cazul săgeților vorbim despre „precizia” lovirilor în raport cu centrul țintei, atunci dispersia caracterizează două lucruri:

În primul rând, este evident că pe măsură ce pariurile cresc, și dispersia crește. Deci, de exemplu, dacă creștem de 10 ori, atunci așteptarea matematică va crește de 10 ori, iar varianța va crește de 100 de ori (deoarece aceasta este o cantitate pătratică). Dar rețineți că regulile jocului în sine nu s-au schimbat! Doar ratele s-au schimbat, aproximativ vorbind, înainte de a paria 10 ruble, acum 100.

În al doilea rând, mai mult punct interesant este că varianța caracterizează stilul de joc. Fixați mental pariurile jocului la un anumit nivel, și să vedem ce este:

Un joc cu variație scăzută este un joc precaut. Jucătorul tinde să aleagă cele mai fiabile scheme, unde nu pierde/câștigă prea mult la un moment dat. De exemplu, sistemul roșu/negru la ruletă (vezi exemplul 4 al articolului Variabile aleatorii) .

Joc cu variație mare. Ea este numită des dispersiv joc. Acesta este un stil de joc aventuros sau agresiv, în care jucătorul alege scheme de „adrenalină”. Să ne amintim măcar "Martingala", în care sumele puse în joc sunt ordine de mărime mai mari decât jocul „liniștit” de la punctul precedent.

Situația în poker este orientativă: există așa-zise strâns jucători care au tendința de a fi precauți și „tremurați” în privința lor mijloace de joc (bankroll). Nu este surprinzător, bankroll-ul lor nu fluctuează semnificativ (varianță scăzută). Dimpotrivă, dacă un jucător are o variație mare, atunci el este un agresor. Adesea își asumă riscuri, face pariuri mari și poate fie să spargă o bancă uriașă, fie să piardă în frânturi.

Același lucru se întâmplă în Forex și așa mai departe - există o mulțime de exemple.

Mai mult, în toate cazurile, nu contează dacă jocul este jucat pentru bani sau mii de dolari. Fiecare nivel are jucătorii săi cu dispersie scăzută și mare. Ei bine, după cum ne amintim, câștigul mediu este „responsabil” așteptări matematice.

Probabil ați observat că găsirea variației este un proces lung și minuțios. Dar matematica este generoasă:

Formula pentru găsirea varianței

Această formulă este derivată direct din definiția varianței și o punem imediat în uz. Voi copia semnul cu jocul nostru de mai sus:

și așteptarea matematică găsită.

Să calculăm varianța în al doilea mod. Mai întâi, să găsim așteptarea matematică - pătratul variabilei aleatoare. De determinarea așteptărilor matematice:

ÎN în acest caz,:

Astfel, conform formulei:

După cum se spune, simți diferența. Și în practică, desigur, este mai bine să utilizați formula (cu excepția cazului în care condiția cere altfel).

Stăpânim tehnica de rezolvare și proiectare:

Exemplul 6

Găsiți așteptările sale matematice, varianța și abaterea standard.

Această sarcină se găsește peste tot și, de regulă, nu are sens semnificativ.
Vă puteți imagina mai multe becuri cu cifre care se aprind într-un cămin de nebuni cu anumite probabilități :)

Soluţie: Este convenabil să rezumați calculele de bază într-un tabel. Mai întâi, scriem datele inițiale în primele două rânduri. Apoi calculăm produsele, apoi și în final sumele din coloana din dreapta:

De fapt, aproape totul este gata. A treia linie arată o așteptare matematică gata făcută: .

Calculăm varianța folosind formula:

Și în sfârșit, abaterea standard:
– Personal, de obicei rotunjesc la 2 zecimale.

Toate calculele pot fi efectuate pe un calculator, sau chiar mai bine – în Excel:

E greu să greșești aici :)

Răspuns:

Cei care doresc își pot simplifica și mai mult viața și pot profita de mine calculator (demo), care nu numai că va rezolva instantaneu această problemă, ci și va construi grafică tematică (o sa ajungem acolo in curand). Programul poate fi descărcați din bibliotecă– dacă ați descărcat cel puțin unul material educativ, sau obține alt mod. Vă mulțumim pentru susținerea proiectului!

Câteva sarcini de rezolvat singur:

Exemplul 7

Calculați varianța variabilei aleatoare din exemplul anterior prin definiție.

ŞI exemplu similar:

Exemplul 8

O variabilă aleatorie discretă este specificată de legea sa de distribuție:

Da, valorile variabilelor aleatoare pot fi destul de mari (exemplu din munca adevarata) , și aici, dacă este posibil, folosiți Excel. Așa cum, apropo, în Exemplul 7 - este mai rapid, mai fiabil și mai plăcut.

Soluții și răspunsuri în partea de jos a paginii.

La sfârșitul celei de-a doua părți a lecției, ne vom uita la încă una sarcină tipică, s-ar putea spune chiar, un mic rebus:

Exemplul 9

O variabilă aleatoare discretă poate lua doar două valori: și , și . Probabilitatea, așteptările matematice și varianța sunt cunoscute.

Soluţie: Să începem cu o probabilitate necunoscută. Deoarece o variabilă aleatoare poate lua doar două valori, suma probabilităților evenimentelor corespunzătoare este:

iar de atunci .

Rămâne doar să găsești..., e ușor de spus :) Dar ei bine, iată. Prin definiția așteptărilor matematice:
– înlocuirea cantităților cunoscute:

– și nimic mai mult nu poate fi stors din această ecuație, cu excepția faptului că o puteți rescrie în direcția obișnuită:

sau:

DESPRE acțiuni ulterioare, cred că poți ghici. Să compunem și să rezolvăm sistemul:

zecimale- aceasta, desigur, este o rușine totală; înmulțiți ambele ecuații cu 10:

si imparti la 2:

E mai bine. Din prima ecuație exprimăm:
(acesta este calea mai ușoară)– înlocuiți în a 2-a ecuație:


Construim pătratși faceți simplificări:

Înmulțiți cu:

Rezultatul a fost ecuație pătratică, găsim că este discriminant:
- Grozav!

și obținem două soluții:

1) dacă , Asta ;

2) dacă , Asta .

Condiția este îndeplinită de prima pereche de valori. Cu o probabilitate mare, totul este corect, dar, cu toate acestea, să notăm legea distribuției:

și efectuați o verificare, și anume, găsiți așteptarea:

Vizualizări