Test de corelație Spearman online. Analiza corelației folosind metoda Spearman (rangurile Spearman)

Coeficientul de corelație a rangului lui Spearman este o metodă neparametrică care este utilizată pentru a studia statistic relația dintre fenomene. În acest caz, se determină gradul real de paralelism între cele două serii cantitative ale caracteristicilor studiate și se dă o evaluare a strângerii legăturii stabilite folosind un coeficient exprimat cantitativ.

1. Istoricul dezvoltării coeficientului de corelație de rang

Acest criteriu a fost dezvoltat și propus pentru analiza corelației în 1904 Charles Edward Spearman, psiholog englez, profesor la Universitățile din Londra și Chesterfield.

2. Pentru ce este folosit coeficientul Spearman?

Coeficientul de corelație a rangului lui Spearman este utilizat pentru a identifica și evalua strânsoarea relației dintre două serii de comparații. indicatori cantitativi. În cazul în care rândurile indicatorilor, ordonate după gradul de creștere sau scădere, în cele mai multe cazuri coincid (o valoare mai mare a unui indicator corespunde unei valori mai mari a altui indicator - de exemplu, când se compară înălțimea și greutatea corporală a pacientului), se concluzionează că există direct conexiunea de corelare. Dacă rândurile indicatorilor au direcția opusă (o valoare mai mare a unui indicator corespunde unei valori mai mici a altuia - de exemplu, când se compară vârsta și ritmul cardiac), apoi vorbesc despre verso conexiuni între indicatori.

    Coeficientul de corelație Spearman are următoarele proprietăți:
  1. Coeficientul de corelație poate lua valori de la minus unu la unu, iar cu rs=1 există o relație strict directă, iar cu rs= -1 există o relație strict feedback.
  2. Dacă coeficientul de corelație este negativ, atunci există o relație de feedback dacă este pozitivă, atunci există o relație directă.
  3. Dacă coeficientul de corelație este zero, atunci practic nu există nicio legătură între cantități.
  4. Cu cât modulul coeficientului de corelație este mai aproape de unitate, cu atât relația dintre mărimile măsurate este mai puternică.

3. În ce cazuri poate fi utilizat coeficientul Spearman?

Datorită faptului că coeficientul este o metodă analiza neparametrică, testarea distribuției normale nu este necesară.

Indicatorii comparabili pot fi măsurați atât în scară continuă(de exemplu, numărul de globule roșii din 1 μl de sânge) și în ordinal(de exemplu, punctele de evaluare a experților de la 1 la 5).

Eficacitatea și calitatea evaluării Spearman scade dacă diferența dintre sensuri diferite oricare dintre cantitățile măsurate este suficient de mare. Nu se recomandă utilizarea coeficientului Spearman dacă există o distribuție neuniformă a valorilor mărimii măsurate.

4. Cum se calculează coeficientul Spearman?

Calculul coeficientului de corelare a rangului Spearman include următorii pași:

5. Cum se interpretează valoarea coeficientului Spearman?

Atunci când se utilizează coeficientul de corelare a rangului, strângerea conexiunii dintre caracteristici este evaluată condiționat, luând în considerare valorile coeficientului egale cu 0,3 sau mai puțin ca indicatori ai conexiunii slabe; valorile mai mari de 0,4, dar mai mici de 0,7 sunt indicatori de apropiere moderată a conexiunii, iar valorile de 0,7 sau mai mult sunt indicatori de apropiere ridicată a conexiunii.

Semnificația statistică a coeficientului obținut este evaluată cu ajutorul testului t Student. Dacă valoarea t-test calculată este mai mică decât valoarea tabelului pentru un anumit număr de grade de libertate, semnificație statistică Nu există nicio relație observată. Dacă este mai mare, atunci corelația este considerată semnificativă statistic.

Atribuirea coeficientului de corelare a rangului

Metoda de corelare a rangului Spearman vă permite să determinați apropierea (puterea) și direcția corelației dintre două semne sau două profiluri (ierarhii) semne.

Descrierea metodei

Pentru a calcula corelația de rang, este necesar să aveți două rânduri de valori care pot fi clasate. O astfel de serie de valori ar putea fi:

1) două semne măsurată în același grup de subiecți;

2) două ierarhii individuale de caracteristici, identificați la doi subiecți după același set de caracteristici (de exemplu, profiluri de personalitate conform chestionarului cu 16 factori al lui R. B. Cattell, ierarhia valorilor după metoda lui R. Rokeach, succesiunea preferințelor în alegerea dintre mai multe alternative etc.) ;

3) două ierarhii de grup de trăsături;

4) individuale si de grup ierarhia caracteristicilor.

În primul rând, indicatorii sunt clasificați separat pentru fiecare dintre caracteristici. De regulă, un rang inferior este atribuit unei valori de atribut inferioare.

Să luăm în considerare cazul 1 (două semne). Aici sunt clasate valorile individuale pentru prima caracteristică obținute de diferiți subiecți, iar apoi valorile individuale pentru a doua caracteristică.

Dacă două caracteristici sunt legate pozitiv, atunci subiecții care au ranguri scăzute pe una dintre ele vor avea ranguri scăzute pe cealaltă, iar subiecții care au ranguri înalte pe una dintre caracteristici vor avea, de asemenea, ranguri ridicate pe cealaltă caracteristică. Să numere r s este necesar să se determine diferenţele (d) dintre rangurile obţinute de un subiect dat pentru ambele caracteristici. Apoi acești indicatori d sunt transformați într-un anumit mod și scăzuți din 1. Cu cât diferența dintre rânduri este mai mică, cu atât r s va fi mai mare, cu atât va fi mai aproape de +1.

Dacă nu există o corelație, atunci toate rangurile vor fi amestecate și nu va exista nicio corespondență între ele. Formula este concepută astfel încât în ​​acest caz r s, va fi aproape de 0.

În cazul unei corelații negative, rangurile scăzute ale subiecților pe un atribut vor corespunde unor ranguri ridicate pe alt atribut și invers.

Cu cât discrepanța dintre rangurile subiecților pe două variabile este mai mare, cu atât r s este mai aproape de -1.

Să luăm în considerare cazul 2 (două profiluri individuale). Aici valorile individuale obținute de fiecare dintre cei 2 subiecți sunt clasate în funcție de un anumit set (identic pentru ambii) de caracteristici. Primul rang va fi acordat caracteristicii cu cea mai mică valoare; al doilea rang este o caracteristică cu o valoare mai mare etc. Evident, toate atributele trebuie măsurate în aceleași unități, altfel clasarea este imposibilă. De exemplu, este imposibil să clasați indicatorii în Inventarul de personalitate Cattell (16 PF), dacă sunt exprimate în puncte „brute”, deoarece intervalele de valori sunt diferite pentru diferiți factori: de la 0 la 13, de la 0 la 20 și de la 0 la 26. Nu putem spune care factor va ocupa primul loc în termeni de severitate până când nu vom reduce toate valorile la scară unificată(cel mai adesea acesta este un cântar de perete).

Dacă ierarhiile individuale ale două subiecți sunt legate pozitiv, atunci trăsăturile care au ranguri scăzute într-unul dintre ele vor avea ranguri scăzute în celălalt și invers. De exemplu, dacă factorul E (dominanță) al unui subiect are cel mai scăzut rang, atunci factorul altui subiect ar trebui să aibă un rang scăzut dacă factorul C (stabilitatea emoțională) al unui subiect are cel mai înalt rang, atunci celălalt subiect ar trebui să aibă un rang ridicat; acest factor, etc.

Să luăm în considerare cazul 3 (două profiluri de grup). Aici valorile medii de grup obținute în 2 grupe de subiecți sunt clasate în funcție de un anumit set de caracteristici, identice pentru cele două grupe. În cele ce urmează, linia de raționament este aceeași ca în cele două cazuri precedente.

Să luăm în considerare cazul 4 (profiluri individuale și de grup). Aici, valorile individuale ale subiectului și valorile medii de grup sunt clasate separat în funcție de același set de caracteristici, care se obțin, de regulă, prin excluderea acestui subiect individual - el nu participă la media grupului profil cu care va fi comparat profilul său individual. Corelarea rangului va testa cât de consistente sunt profilurile individuale și de grup.

În toate cele patru cazuri, semnificația coeficientului de corelație rezultat este determinată de numărul de valori clasate N.În primul caz, acest număr va coincide cu dimensiunea eșantionului n. În al doilea caz, numărul de observații va fi numărul de caracteristici care alcătuiesc ierarhia. În al treilea și al patrulea caz N- acesta este, de asemenea, numărul de caracteristici comparate, și nu numărul de subiecți din grupuri. Explicații detaliate sunt date în exemple.

Dacă valoarea absolută a lui r s atinge sau depășește o valoare critică, corelația este fiabilă.

Ipoteze

Există două ipoteze posibile. Primul se aplică pentru cazul 1, al doilea pentru celelalte trei cazuri.

Prima versiune a ipotezelor

H 0: Corelația dintre variabilele A și B nu diferă de zero.

H 1: Corelația dintre variabilele A și B este semnificativ diferită de zero.

A doua versiune a ipotezelor

H 0: Corelația dintre ierarhiile A și B nu diferă de zero.

H1: Corelația dintre ierarhiile A și B este semnificativ diferită de zero.

Reprezentarea grafică a metodei de corelare a rangului

Cel mai adesea, relația de corelație este prezentată grafic sub forma unui nor de puncte sau sub formă de linii care reflectă tendința generală de plasare a punctelor în spațiul a două axe: axa caracteristicii A și caracteristicii B (vezi Fig. 6.2). ).

Să încercăm să descriem corelația de rang sub forma a două rânduri de valori clasate, care sunt conectate în perechi prin linii (Fig. 6.3). Dacă rangurile pentru trăsătura A și trăsătura B coincid, atunci există o linie orizontală între ele, dacă rândurile nu coincid, atunci linia devine înclinată. Cu cât discrepanța dintre rânduri este mai mare, cu atât linia devine mai înclinată. În stânga în Fig. Figura 6.3 arată cea mai mare corelație pozitivă posibilă (r =+1,0) - practic aceasta este o „scara”. În centru există o corelație zero - o împletitură cu țesături neregulate. Toate gradele sunt amestecate aici. Cea mai mare corelație negativă (r s = -1,0) este afișată în dreapta - o rețea cu o împletire regulată de linii.

Orez. 6.3. Reprezentarea grafică a corelației de rang:

a) corelație pozitivă ridicată;

b) corelație zero;

c) corelație negativă ridicată

Restricțiicoeficient de rangcorelații

1. Pentru fiecare variabilă trebuie prezentate cel puțin 5 observații. Limita superioară a probei este determinată de tabelele disponibile de valori critice (Tabelul XVI Anexa 1), și anume N40.

2. Coeficientul de corelație a rangului lui Spearman r s cu un număr mare de ranguri identice pentru una sau ambele variabile comparate oferă valori brute. În mod ideal, ambele serii corelate ar trebui să reprezinte două secvențe de valori divergente. Dacă această condiție nu este îndeplinită, este necesar să se facă o ajustare pentru ranguri egale. Formula corespunzătoare este dată în exemplul 4.

Exemplul 1 - corelațieintre doisemne

Un studiu care simulează activitatea unui controlor de trafic aerian (Oderyshev B.S., Shamova E.P., Sidorenko E.V., Larchenko N.N., 1978), un grup de subiecți, studenți Facultatea de Fizică LSU a fost instruit înainte de a începe lucrul la simulator. Subiecții au trebuit să rezolve probleme de alegere a tipului optim de pistă pentru un anumit tip de aeronavă. Numărul de erori făcute de subiecți într-o sesiune de instruire este legat de indicatorii inteligenței verbale și nonverbale măsurate folosind metoda lui D. Wechsler?

Tabelul 6.1

Indicatori ai numărului de erori în sesiunea de pregătire și indicatori ai nivelului de inteligență verbală și non-verbală în rândul studenților la fizică (N=10)

Subiect

Numărul de erori

Indicele de inteligență verbală

Indicele de inteligență nonverbală

În primul rând, să încercăm să răspundem la întrebarea dacă indicatorii numărului de erori și inteligența verbală sunt legați.

Să formulăm ipoteze.

H 0: Corelația dintre numărul de erori dintr-o sesiune de antrenament și nivelul de inteligență verbală nu diferă de zero.

H 1 : Corelația dintre numărul de erori dintr-o sesiune de antrenament și nivelul de inteligență verbală este statistic semnificativ diferită de zero.

În continuare, trebuie să clasificăm ambii indicatori, atribuind un rang mai mic valorii mai mici, apoi să calculăm diferențele dintre rangurile pe care le-a primit fiecare subiect pentru cele două variabile (atribute) și să pătram aceste diferențe. Să facem toate calculele necesare în tabel.

În tabel. 6.2 prima coloană din stânga arată valorile pentru numărul de erori; coloana următoare arată rangurile lor. A treia coloană din stânga arată scorurile pentru inteligența verbală; coloana următoare arată rangurile lor. A cincea din stânga prezintă diferențele d între rangul pe variabila A (numărul de erori) și variabila B (inteligența verbală). Ultima coloană prezintă diferențele la pătrat - d 2 .

Tabelul 6.2

Calcul d 2 pentru coeficientul de corelare a rangului lui Spearman r s atunci când se compară indicatorii numărului de erori și inteligența verbală în rândul studenților la fizică (N=10)

Subiect

Variabila A

numărul de erori

Variabila B

inteligența verbală.

d (locul A -

J 2

Individual

valorile

Individual

valorile

Coeficientul de corelare a rangului lui Spearman este calculat folosind formula:

Unde d - diferența dintre rangurile pe două variabile pentru fiecare subiect;

N- numărul de valori clasate, c. în acest caz, numărul de subiecţi.

Să calculăm valoarea empirică a lui r s:

Valoarea empirică obținută a lui r s este apropiată de 0. Totuși, determinăm valorile critice ale r s la N = 10 conform tabelului. XVI Anexa 1:

Răspuns: H 0 este acceptat. Corelația dintre numărul de erori dintr-o sesiune de antrenament și nivelul de inteligență verbală nu diferă de zero.

Acum să încercăm să răspundem la întrebarea dacă indicatorii numărului de erori și inteligența nonverbală sunt legați.

Să formulăm ipoteze.

H 0: Corelația dintre numărul de erori dintr-o sesiune de antrenament și nivelul de inteligență nonverbală nu diferă de 0.

H 1: Corelația dintre numărul de erori într-o sesiune de antrenament și nivelul de inteligență nonverbală este statistic semnificativ diferită de 0.

Rezultatele clasamentului și comparării rangurilor sunt prezentate în tabel. 6.3.

Tabelul 6.3

Calcul d 2 pentru coeficientul de corelare a rangului lui Spearman r s atunci când se compară indicatorii numărului de erori și inteligența non-verbală în rândul studenților la fizică (N=10)

Subiect

Variabila A

numărul de erori

Variabila E

inteligența nonverbală

d (locul A -

d 2

Individual

Individual

valorile

valorile

Ne amintim că pentru a determina semnificația lui r s, nu contează dacă este pozitiv sau negativ, doar valoarea sa absolută este importantă. În acest caz:

r s em

Răspuns: H 0 este acceptat. Corelația dintre numărul de erori dintr-o sesiune de antrenament și nivelul de inteligență nonverbală este aleatorie, r s nu diferă de 0.

Cu toate acestea, putem acorda atenție unei anumite tendințe negativ relația dintre aceste două variabile. S-ar putea să putem confirma acest lucru la un nivel semnificativ statistic dacă am mări dimensiunea eșantionului.

Exemplul 2 - corelarea dintre profilele individuale

Într-un studiu dedicat problemelor reorientării valorilor, ierarhiile valorilor terminale au fost identificate conform metodei lui M. Rokeach în rândul părinților și copiilor lor adulți (Sidorenko E.V., 1996). În tabel sunt prezentate rangurile valorilor terminale obținute în timpul examinării unei perechi mamă-fiică (mamă - 66 de ani, fiică - 42 de ani). 6.4. Să încercăm să determinăm modul în care aceste ierarhii de valori se corelează între ele.

Tabelul 6.4

Rangurile valorilor terminale conform listei lui M. Rokeach în ierarhiile individuale ale mamei și fiicei

Valori terminale

Rangul valorilor în

Rangul valorilor în

d 2

ierarhia mamei

ierarhia fiicei

1 Viața activă activă

2 Înțelepciunea vieții

3 Sănătate

4 Lucrare interesantă

5 Frumusețea naturii și a artei

7 Viață sigură financiar

8 Să ai prieteni buni și loiali

9 Recunoașterea publică

10 Cunoașterea

11 Viață productivă

12 Dezvoltare

13 Divertisment

14 Libertate

15 Viață de familie fericită

16 Fericirea altora

17 Creativitate

18 Încrederea în sine

Să formulăm ipoteze.

H 0: Corelația dintre ierarhiile de valori terminale mamă și fiică nu este diferită de zero.

H 1: Corelația dintre ierarhiile valorii terminale ale mamei și ale fiicei este statistic semnificativ diferită de zero.

Deoarece clasamentul valorilor este asumat de procedura de cercetare în sine, putem calcula doar diferențele dintre rangurile de 18 valori în două ierarhii. În coloanele a 3-a și a 4-a din tabel. 6.4 prezintă diferențele d și pătratele acestor diferențe d 2 .

Determinăm valoarea empirică a lui r s folosind formula:

Unde d - diferenţe între ranguri pentru fiecare dintre variabile, în acest caz pentru fiecare dintre valorile terminale;

N- numărul de variabile care formează ierarhia, în acest caz numărul de valori.

Pentru acest exemplu:

Conform Tabelului. XVI Anexa 1 determină valorile critice:

Răspuns: H 0 este respins. H 1 este acceptat. Corelația dintre ierarhiile valorilor terminale ale mamei și fiicei este semnificativă statistic (p<0,01) и является положительной.

Conform Tabelului. 6.4 putem determina că principalele diferențe apar în valorile „Viața fericită de familie”, „Recunoaștere publică” și „Sănătate”, rândurile altor valori sunt destul de apropiate.

Exemplul 3 - Corelația între două ierarhii de grup

Joseph Wolpe, într-o carte scrisă împreună cu fiul său (Wolpe J., Wolpe D., 1981), furnizează o listă ordonată a celor mai frecvente temeri „inutile”, așa cum le numește el, la omul modern, care nu poartă un semnalează semnificația și interferează doar cu trăirea unei vieți și acțiuni pline. Într-un studiu intern realizat de M.E. Rakhova (1994) 32 de subiecți au trebuit să evalueze pe o scară de 10 puncte cât de relevantă era pentru ei acest sau acel tip de frică din lista lui Wolpe 3 . Eșantionul chestionat a fost format din studenți de la Institutele Hidrometeorologice și Pedagogice din Sankt Petersburg: 15 băieți și 17 fete cu vârsta cuprinsă între 17 și 28 de ani, vârsta medie 23 de ani.

Datele obținute pe o scară de 10 puncte au fost mediate pe 32 de subiecți, iar mediile au fost clasate. În tabel. Tabelul 6.5 prezintă indicatorii de clasare obținuți de J. Volpe și M. E. Rakhova. Secvențele de clasare ale celor 20 de tipuri de frică coincid?

Să formulăm ipoteze.

H 0: Corelația dintre listele ordonate de tipuri de frică din eșantioanele americane și interne nu diferă de zero.

H 1: Corelația dintre listele ordonate de tipuri de frică din eșantioanele americane și autohtone este statistic semnificativ diferită de zero.

Toate calculele legate de calcularea și pătrarea diferențelor dintre rangurile diferitelor tipuri de frică din două eșantioane sunt prezentate în tabel. 6.5.

Tabelul 6.5

Calcul d pentru coeficientul de corelare a rangului Spearman atunci când se compară liste ordonate de tipuri de frică în eșantioane americane și interne

Tipuri de frică

Clasament în eșantionul american

Clasament în rusă

Frica de a vorbi în public

Frica de a zbura

Frica de a greși

Frica de eșec

Frica de dezaprobare

Frica de respingere

Frica de oamenii răi

Frica de singurătate

Frica de sânge

Frica de răni deschise

Frica de stomatolog

Frica de injecții

Frica de a face teste

Frica de poliție ^miliție)

Frica de înălțimi

Frica de câini

Frica de păianjeni

Frica de infirmi

Frica de spitale

Frica de întuneric

Determinăm valoarea empirică a lui r s:

Conform Tabelului. XVI Anexa 1 determinăm valorile critice ale g s la N=20:

Răspuns: H 0 este acceptat. Corelația dintre listele ordonate de tipuri de frică din eșantioanele americane și interne nu atinge nivelul de semnificație statistică, adică nu diferă semnificativ de zero.

Exemplul 4 - corelația dintre profilurile medii individuale și de grup

Un eșantion de locuitori din Sankt Petersburg cu vârste cuprinse între 20 și 78 de ani (31 de bărbați, 46 de femei), echilibrați după vârstă, astfel încât persoanele cu vârsta peste 55 de ani reprezentau 50% din 4, au fost rugați să răspundă la întrebarea: „Care este nivelul de dezvoltare al fiecăreia dintre următoarele calități necesare unui deputat al Adunării Orașului din Sankt Petersburg?” (Sidorenko E.V., Dermanova I.B., Anisimova O.M., Vitenberg E.V., Shulga A.P., 1994). Evaluarea a fost făcută pe o scară de 10 puncte. În paralel cu aceasta, a fost examinat un eșantion de deputați și candidați pentru deputați la Adunarea Orășenească din Sankt Petersburg (n=14). Diagnosticele individuale ale personalităților politice și ale candidaților au fost efectuate folosind sistemul de diagnosticare video Oxford Express folosind același set de calități personale care au fost prezentate unui eșantion de alegători.

În tabel. 6.6 arată valorile medii obținute pentru fiecare dintre calități V eșantion de alegători („seria de referință”) și valori individuale ale unuia dintre deputații Adunării Orașului.

Să încercăm să determinăm cât de mult se corelează profilul individual al unui deputat K-va cu profilul de referință.

Tabelul 6.6

Evaluările de referință medii ale alegătorilor (n=77) și indicatorii individuali ai deputatului K-va pe 18 calități personale ale diagnosticului video expres

Nume de calitate

Scorurile medii ale alegătorilor de referință

Indicatori individuali ai deputatului K-va

1. Nivel general de cultură

2. Capacitatea de învățare

4. Capacitatea de a crea lucruri noi

5.. Autocritica

6. Responsabilitate

7. Independenta

8. Energie, activitate

9. Determinare

10. Autocontrol, autocontrol

I. Persistența

12. Maturitatea personală

13. Decenta

14. Umanismul

15. Abilitatea de a comunica cu oamenii

16. Toleranță față de opiniile altora

17. Flexibilitatea comportamentului

18. Capacitatea de a face o impresie favorabilă

Tabelul 6.7

Calcul d 2 pentru coeficientul de corelare a rangului Spearman între profilul de referință și profilul individual al calităților personale ale deputatului

Nume de calitate

rangul de calitate în profilul de referință

Rândul 2: rangul calității în profilul individual

d 2

1 Responsabilitate

2 Decenta

3 Abilitatea de a comunica cu oamenii

4 Autocontrol, autocontrol

5 Nivel general de cultură

6 Energie, activitate

8 Autocritica

9 Independenta

10 Maturitatea personală

Și Determinarea

12 Capacitate de învățare

13 Umanismul

14 Toleranță față de opiniile altora

15 Tărie

16 Flexibilitatea comportamentului

17 Capacitatea de a face o impresie favorabilă

18 Abilitatea de a crea lucruri noi

După cum se vede din tabel. 6.6, evaluările alegătorilor și indicatorii individuali ai deputaților variază în intervale diferite. Într-adevăr, evaluările alegătorilor au fost obținute pe o scară de 10 puncte, iar indicatorii individuali privind diagnosticarea video expres sunt măsurați pe o scară de 20 de puncte. Clasificarea ne permite să convertim ambele scale de măsurare într-o singură scală, unde unitatea de măsură este 1 rang, iar valoarea maximă este de 18 ranguri.

Clasificarea, după cum ne amintim, trebuie făcută separat pentru fiecare rând de valori. În acest caz, este indicat să atribuiți un rang mai mic unei valori mai mari, astfel încât să puteți vedea imediat unde se clasează cutare sau cutare calitate în ceea ce privește importanța (pentru alegători) sau ca severitate (pentru un deputat).

Rezultatele clasamentului sunt prezentate în tabel. 6.7. Calitățile sunt enumerate într-o secvență care reflectă profilul de referință.

Să formulăm ipoteze.

H 0: Corelația dintre profilul individual al unui deputat K-va și profilul de referință construit în funcție de evaluările alegătorilor nu diferă de zero.

H 1: Corelația dintre profilul individual al unui deputat K-va și profilul de referință construit în funcție de evaluările alegătorilor este semnificativ diferită statistic de zero. Întrucât în ​​ambele serii de clasare comparate există

grupuri de ranguri identice, înainte de calcularea coeficientului de rang

corelațiile trebuie corectate pentru aceleași ranguri ale lui T a și T b :

Unde A - volumul fiecărui grup de ranguri identice din rândul de rang A,

b - volumul fiecărui grup de ranguri identice din seria de clasare B.

În acest caz, în rândul A (profil de referință) există un grup de ranguri identice - calitățile „capacitate de învățare” și „umanism” au același rang 12,5; prin urmare, O=2.

Ta =(2 3 -2)/12=0,50.

În rândul B (profil individual) există două grupuri de ranguri identice, în timp ce b 1 =2 Şi b 2 =2.

T a =[(2 3 -2)+(2 3 -2)]/12=1,00

Pentru a calcula valoarea empirică r s folosim formula

În acest caz:

Rețineți că dacă nu am fi făcut corecția pentru ranguri egale, atunci valoarea lui r s ar fi fost doar (0,0002) mai mare:

Cu un număr mare de ranguri identice, modificările în r 5 pot fi mult mai semnificative. Prezența rangurilor identice înseamnă un grad mai scăzut de diferențiere a variabilelor ordonate și, prin urmare, mai puține oportunități de a evalua gradul de legătură dintre ele (Sukhodolsky G.V., 1972, p. 76).

Conform Tabelului. XVI Anexa 1 determinăm valorile critice ale lui r, la N = 18:

Răspuns: Hq este respins. Corelația dintre profilul individual al unui deputat K-va și profilul de referință care îndeplinește cerințele alegătorilor este semnificativă statistic (p.<0,05) и является положи­тельной.

Din Tabel. 6.7 este clar că deputatul K-v are un rang mai scăzut pe grilele Capacitatea de a comunica cu oamenii și ranguri mai înalte pe grilele Determinare și Perseverență decât este prescris de standardul electoral. Aceste discrepanțe explică în principal o scădere ușoară a rs-ului obținut.

Să formulăm un algoritm general pentru calcularea r s.

Coeficientul de corelație Pearson

Coeficient r- Pearson este folosit pentru a studia relația dintre două variabile metrice măsurate pe același eșantion. Există multe situații în care utilizarea sa este adecvată. Afectează inteligența performanța academică în anii de studii superioare? Mărimea salariului unui angajat este legată de amabilitatea acestuia față de colegi? Starea de spirit a elevului afectează succesul rezolvării unei probleme complexe de aritmetică? Pentru a răspunde la astfel de întrebări, cercetătorul trebuie să măsoare doi indicatori de interes pentru fiecare membru al eșantionului.

Valoarea coeficientului de corelație nu este afectată de unitățile de măsură în care sunt prezentate caracteristicile. În consecință, orice transformări liniare ale caracteristicilor (înmulțirea cu o constantă, adăugarea unei constante) nu modifică valoarea coeficientului de corelație. O excepție este înmulțirea unuia dintre semne cu o constantă negativă: coeficientul de corelație își schimbă semnul în sens invers.

Aplicarea corelației Spearman și Pearson.

Corelația Pearson este o măsură a relației liniare dintre două variabile. Vă permite să determinați cât de proporțională este variabilitatea a două variabile. Dacă variabilele sunt proporționale între ele, atunci relația dintre ele poate fi reprezentată grafic ca o dreaptă cu o pantă pozitivă (proporție directă) sau negativă (proporție inversă).

În practică, relația dintre două variabile, dacă există una, este probabilistică și arată grafic ca un nor de dispersie elipsoidal. Acest elipsoid, totuși, poate fi reprezentat (aproximat) ca o linie dreaptă sau o linie de regresie. O linie de regresie este o linie dreaptă construită folosind metoda celor mai mici pătrate: suma distanțelor pătrate (calculate de-a lungul axei Y) de la fiecare punct de pe diagrama de dispersie la linie dreaptă este minimă.

De o importanță deosebită pentru evaluarea acurateței predicției este varianța estimărilor variabilei dependente. În esență, varianța estimărilor variabilei dependente Y este acea parte a varianței totale a acesteia care se datorează influenței variabilei independente X. Cu alte cuvinte, raportul dintre varianța estimărilor variabilei dependente și adevărata sa varianța este egală cu pătratul coeficientului de corelație.

Pătratul coeficientului de corelație dintre variabilele dependente și independente reprezintă proporția de varianță a variabilei dependente care se datorează influenței variabilei independente și se numește coeficient de determinare. Coeficientul de determinare arată astfel măsura în care variabilitatea unei variabile este cauzată (determinată) de influența altei variabile.

Coeficientul de determinare are un avantaj important față de coeficientul de corelație. Corelația nu este o funcție liniară a relației dintre două variabile. Prin urmare, media aritmetică a coeficienților de corelație pentru mai multe eșantioane nu coincide cu corelația calculată imediat pentru toți subiecții din aceste eșantioane (adică, coeficientul de corelație nu este aditiv). Dimpotrivă, coeficientul de determinare reflectă relația liniar și, prin urmare, este aditiv: poate fi mediat pe mai multe probe.

Informații suplimentare despre rezistența conexiunii sunt furnizate de valoarea coeficientului de corelație pătrat - coeficientul de determinare: aceasta este partea varianței unei variabile care poate fi explicată prin influența altei variabile. Spre deosebire de coeficientul de corelare, coeficientul de determinare crește liniar odată cu creșterea rezistenței conexiunii.

Coeficienții de corelație Spearman și τ - Kendall ( corelații de rang )

Dacă ambele variabile între care se studiază relația sunt prezentate pe o scară ordinală, sau una dintre ele este pe o scară ordinală și cealaltă pe o scară metrică, atunci se folosesc coeficienți de corelație de rang: Spearman sau τ - Kendella. Ambii coeficienți necesită o ierarhizare preliminară a ambelor variabile pentru aplicarea lor.

Coeficientul de corelație a rangului lui Spearman este o metodă neparametrică care este utilizată în scopul studierii statistice a relației dintre fenomene. În acest caz, se determină gradul real de paralelism între cele două serii cantitative ale caracteristicilor studiate și se dă o evaluare a strângerii legăturii stabilite folosind un coeficient exprimat cantitativ.

Dacă membrii unui grup de mărime au fost clasați mai întâi pe variabila x, apoi pe variabila y, atunci corelația dintre variabilele x și y se poate obține pur și simplu prin calcularea coeficientului Pearson pentru cele două serii de ranguri. Cu condiția să nu existe relații de rang (adică, fără ranguri repetate) pentru nicio variabilă, formula Pearson poate fi simplificată foarte mult din punct de vedere computațional și transformată în ceea ce este cunoscut sub numele de formula Spearman.

Puterea coeficientului de corelare a rangului Spearman este oarecum inferioară puterii coeficientului de corelație parametrică.

Este recomandabil să se folosească coeficientul de corelație de rang atunci când există un număr mic de observații. Această metodă poate fi utilizată nu numai pentru date cantitative, ci și în cazurile în care valorile înregistrate sunt determinate de caracteristici descriptive de intensitate diferită.

Coeficientul de corelare a rangului lui Spearman la cantitati mari ranguri egale pentru una sau ambele variabile comparate dau valori grosiere. În mod ideal, ambele serii corelate ar trebui să reprezinte două secvențe de valori divergente

O alternativă la corelația Spearman pentru ranguri este corelația τ - Kendall. Corelația propusă de M. Kendall se bazează pe ideea că direcția conexiunii poate fi judecată prin compararea subiecților în perechi: dacă o pereche de subiecți are o schimbare în x care coincide în direcție cu o schimbare în y, atunci aceasta indică o conexiune pozitivă, dacă nu se potrivește - atunci despre o conexiune negativă.

Coeficienții de corelație au fost special proiectați pentru a cuantifica puterea și direcția relației dintre două proprietăți măsurate pe scale numerice (metrică sau de rang). După cum sa menționat deja, puterea maximă a conexiunii corespunde valorilor de corelație de +1 (conexiune strictă directă sau direct proporțională) și -1 (conexiune strictă inversă sau invers proporțională), absența conexiunii corespunde unei corelații egale cu zero . Informații suplimentare despre puterea relației sunt furnizate de coeficientul de determinare: aceasta este porțiunea de varianță într-o variabilă care poate fi explicată prin influența altei variabile.

9. Metode parametrice pentru compararea datelor


Metodele de comparare parametrică sunt utilizate dacă variabilele dvs. au fost măsurate pe o scară metrică.

Comparația de variații 2- x probe conform testului lui Fisher .


Această metodă vă permite să testați ipoteza că varianțele celor 2 populații generale din care sunt extrase eșantioanele comparate diferă unele de altele. Limitări ale metodei - distribuția caracteristicii în ambele probe nu trebuie să difere de cea normală.

O alternativă la compararea varianțelor este testul Levene, pentru care nu este necesar să se testeze distribuția normală. Această metodă poate fi utilizată pentru a verifica ipoteza egalității (omogenității) varianțelor înainte de a verifica semnificația diferențelor de medii folosind testul Student pentru eșantioane independente de diferite dimensiuni.

Corelația rangului Spearman(corelația de rang). Corelația de rang a lui Spearman este cea mai simplă modalitate de a determina gradul de relație dintre factori. Denumirea metodei indică faptul că relația este determinată între ranguri, adică serii de valori cantitative obținute, clasate în ordine descrescătoare sau crescătoare. Trebuie avut în vedere că, în primul rând, corelarea rangului nu este recomandată dacă legătura dintre perechi este mai mică de patru și mai mare de douăzeci; în al doilea rând, corelarea rangului face posibilă determinarea relației într-un alt caz, dacă valorile sunt de natură semi-cantitativă, adică nu au o expresie numerică și reflectă o ordine clară de apariție a acestor valori; în al treilea rând, este recomandabil să se folosească corelația de rang în cazurile în care este suficientă obținerea de date aproximative. Un exemplu de calcul al coeficientului de corelație de rang pentru a determina întrebarea: chestionarul măsoară X și Y calități personale similare ale subiecților. Folosind două chestionare (X și Y), care necesită răspunsuri alternative „da” sau „nu”, s-au obținut rezultatele primare - răspunsurile a 15 subiecți (N = 10). Rezultatele au fost prezentate ca suma răspunsurilor afirmative separat pentru chestionarul X și pentru chestionarul B. Aceste rezultate sunt rezumate în tabel. 5.19.

Tabelul 5.19. Tabelarea rezultatelor primare pentru a calcula coeficientul de corelare a rangului Spearman (p) *

Analiza matricei de corelație sumară. Metoda de corelare a galaxiilor.

Exemplu. În tabel Figura 6.18 prezintă interpretări a unsprezece variabile care sunt testate folosind metoda Wechsler. Datele au fost obținute dintr-un eșantion omogen cu vârsta cuprinsă între 18 și 25 de ani (n = 800).

Înainte de stratificare, este recomandabil să se ierarhească matricea de corelație. Pentru a face acest lucru, valorile medii ale coeficienților de corelație ai fiecărei variabile cu toate celelalte sunt calculate în matricea originală.

Apoi conform tabelului. 5.20 determinați nivelurile acceptabile de stratificare ale matricei de corelație cu o probabilitate de încredere dată de 0,95 și n - cantități

Tabelul 6.20. Matricea de corelație ascendentă

Variabile 1 2 3 4 ar 0 7 8 0 10 11 M(rij) Rang
1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
7 1 0,310 0,388 0,264 0,266 0,310 9
8 1 0,897 0,363 0,388 0,363 5
9 1 0,388 0,430 0,846 6
10 1 0,336 0,310 8
11 1 0,300 10

Denumiri: 1 - conștientizare generală; 2 - conceptualitate; 3 - atentie; 4 - vdataness K de generalizare; b - memorare directă (în cifre) 6 - nivelul de stăpânire a limbii materne; 7 - viteza de stăpânire a abilităților senzoriomotorii (codarea simbolurilor) 8 - observația; 9 - abilități combinatorii (pentru analiză și sinteză) 10 - capacitatea de a organiza părți într-un întreg semnificativ; 11 - capacitatea de sinteză euristică; M (rij) - valoarea medie a coeficienților de corelație ai variabilei cu alte variabile de observație (în cazul nostru n = 800): r (0) - valoarea planului zero „Disectant” - valoarea minimă semnificativă absolută a coeficient de corelație (n - 120, r (0) = 0,236; n = 40, r (0) = 0,407) | Δr | - pas admisibil de stratificare (n = 40, | Δr | = 0,558) în - numărul admisibil de niveluri de stratificare (n = 40, s = 1; n = 120, s = 2); r (1), r (2), ..., r (9) - valoarea absolută a planului de tăiere (n = 40, r (1) = 0,965).

Pentru n = 800, găsim valoarea gtype și limitele lui gi, după care stratificăm matricea de corelație, evidențiind galaxiile de corelație din cadrul straturilor, sau părți separate ale matricei de corelație, desenând asocieri de galaxii de corelație pentru straturile de deasupra (Fig. 5.5).

O analiză semnificativă a galaxiilor rezultate depășește statisticile matematice. Trebuie remarcat faptul că există doi indicatori formali care ajută la interpretarea semnificativă a Pleiadelor. Un indicator semnificativ este gradul unui vârf, adică numărul de muchii adiacente unui vârf. Variabila cu cel mai mare număr de margini este „nucleul” galaxiei și poate fi considerată ca un indicator al variabilelor rămase ale acestei galaxii. Un alt indicator semnificativ este densitatea comunicării. O variabilă poate avea mai puține conexiuni într-o galaxie, dar mai apropiate, și mai multe conexiuni într-o altă galaxie, dar mai puțin apropiate.

Previziuni și estimări. Ecuația y = b1x + b0 se numește ecuația generală a dreptei. Indică faptul că perechile de puncte (x, y), care

Orez. 5.5. Galaxii de corelație obținute prin stratificarea matricei

se află pe o anumită linie, conectată în așa fel încât pentru orice valoare x, valoarea b în pereche cu aceasta poate fi găsită prin înmulțirea lui x cu un anumit număr b1 și adunând, în al doilea rând, numărul b0 la acest produs.

Coeficientul de regresie vă permite să determinați gradul de modificare a factorului de investigare atunci când factorul cauzal se modifică cu o unitate. Valorile absolute caracterizează relația dintre factorii variabili prin valorile lor absolute. Coeficientul de regresie se calculează folosind formula:

Proiectarea și analiza experimentelor. Proiectarea și analiza experimentelor este a treia ramură importantă a metodelor statistice dezvoltate pentru a găsi și testa relațiile cauzale dintre variabile.

Pentru a studia dependențele multifactoriale, metodele de proiectare experimentală matematică au fost recent utilizate din ce în ce mai mult.

Capacitatea de a varia simultan toți factorii vă permite să: a) reduceți numărul de experimente;

b) reducerea erorii experimentale la minim;

c) simplifica prelucrarea datelor primite;

d) asigura claritatea si usurinta compararii rezultatelor.

Fiecare factor poate dobândi un anumit număr corespunzător de valori diferite, care se numesc niveluri și se notează -1, 0 și 1. Un set fix de niveluri de factori determină condițiile unuia dintre experimentele posibile.

Totalitatea tuturor combinațiilor posibile se calculează folosind formula:

Un experiment factorial complet este un experiment în care sunt implementate toate combinațiile posibile de niveluri de factori. Experimentele factoriale complete pot avea proprietatea de ortogonalitate. Cu planificarea ortogonală, factorii din experiment sunt necorelați, coeficienții de regresie care sunt calculati în cele din urmă sunt determinați independent unul de celălalt.

Un avantaj important al metodei de planificare experimentală matematică este versatilitatea și adecvarea acesteia în multe domenii de cercetare.

Să luăm în considerare un exemplu de comparare a influenței unor factori asupra formării nivelului de stres mental la controlerele TV color.

Experimentul se bazează pe un Design 2 trei ortogonal (trei factori se modifică la două niveluri).

Experimentul a fost realizat cu o parte completă 2 + 3 cu trei repetări.

Planificarea ortogonală se bazează pe construcția unei ecuații de regresie. Din trei factori arată astfel:

Procesarea rezultatelor din acest exemplu include:

a) realizarea unui tabel plan ortogonal 2 +3 pentru calcul;

b) calculul coeficienților de regresie;

c) verificarea semnificaţiei acestora;

d) interpretarea datelor obţinute.

Pentru coeficienții de regresie ai ecuației menționate a fost necesar să se pună N = 2 3 = 8 opțiuni pentru a se putea aprecia semnificația coeficienților, unde numărul de repetări K a fost 3.

Matricea de planificare a experimentului a fost compilată și a arătat astfel:

Calculatorul de mai jos calculează coeficientul de corelare a rangului Spearman între două variabile aleatorii. Partea teoretică, pentru a nu fi distrasă de la calculator, este plasată în mod tradițional sub ea.

adăuga import_export mod_edit şterge

Modificări ale variabilelor aleatoare

săgeată_în sussăgeată_în jos Xsăgeată_în sussăgeată_în jos Y
Dimensiunea paginii: 5 10 20 50 100 chevron_left chevron_right

Modificări ale variabilelor aleatoare

Importă date Eroare de import

Puteți folosi unul dintre aceste simboluri pentru a separa câmpurile: Tab, ";" sau "," Exemplu: -50,5;-50,5

Import înapoi Anulare

Metoda de calculare a coeficientului de corelare a rangului Spearman este de fapt descrisă foarte simplu. Acesta este același coeficient de corelație Pearson, calculat doar nu pentru rezultatele măsurătorilor variabilelor aleatoare în sine, ci pentru acestea. valorile de rang.

adica

Tot ce rămâne este să ne dăm seama care sunt valorile de rang și de ce sunt necesare toate acestea.

Dacă elementele unei serii de variații sunt aranjate în ordine crescătoare sau descrescătoare, atunci rang elementul va fi numărul său în această serie ordonată.

De exemplu, să avem o serie de variații (17,26,5,14,21). Să-i sortăm elementele în ordine descrescătoare (26,21,17,14,5). 26 are rangul 1, 21 are rangul 2 etc. Seria de variații a valorilor rangului va arăta astfel (3,1,5,4,2).

Adică, la calcularea coeficientului Spearman, seriile de variații inițiale sunt transformate în serii de variații de valori de rang, după care li se aplică formula Pearson.

Există o subtilitate - rangul valorilor repetate este luat ca medie a rangurilor. Adică, pentru rândul (17, 15, 14, 15) rândul de valori ale rangului va arăta ca (1, 2.5, 4, 2.5), deoarece primul element egal cu 15 are rangul 2, iar al doilea are rangul 3 și .

Dacă nu există valori care se repetă, adică toate valorile seriei de ranguri sunt numere din intervalul de la 1 la n, formula Pearson poate fi simplificată la

Ei bine, apropo, această formulă este cel mai adesea dată ca formulă pentru calcularea coeficientului Spearman.

Care este esența tranziției de la valorile înseși la valorile lor de rang?
Ideea este că, studiind corelația valorilor rangului, puteți determina cât de bine este descrisă dependența a două variabile de o funcție monotonă.

Semnul coeficientului indică direcția relației dintre variabile. Dacă semnul este pozitiv, atunci valorile Y tind să crească pe măsură ce valorile X cresc; dacă semnul este negativ, atunci valorile Y tind să scadă pe măsură ce valorile X cresc. Dacă coeficientul este 0, atunci nu există nicio tendință. Dacă coeficientul este 1 sau -1, atunci relația dintre X și Y are forma unei funcție monotonă - adică pe măsură ce X crește, crește și Y, sau invers, pe măsură ce X crește, Y scade.

Adică, spre deosebire de coeficientul de corelație Pearson, care poate releva doar o dependență liniară a unei variabile față de alta, coeficientul de corelație Spearman poate dezvălui o dependență monotonă în care nu este detectată o relație liniară directă.

Să explic cu un exemplu. Să presupunem că examinăm funcția y=10/x.
Avem următoarele măsurători X și Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Pentru aceste date, coeficientul de corelație Pearson este -0,4686, adică relația este slabă sau absentă. Dar coeficientul de corelație Spearman este strict egal cu -1, ceea ce pare să sugereze cercetătorului că Y are o dependență monotonă negativă strictă de X.

Vizualizări