Metriske Korrelasjonsteknikker

Korrelasjon er en statistisk teknikk for å se på den lineære forholdet mellom to kvantitative variabler. Med andre ord ser det på hvor godt en rett linje passer dataene. Korrelasjoner varierer -1 til 1 ; en korrelasjon på -1 betyr en perfekt negativ sammenheng ( som en variabel går opp, går den andre ned) , samtidig som en korrelasjon på +1 betyr en perfekt positiv sammenheng (som man går opp, den andre går opp ) . En korrelasjon av 0 betyr ingen lineær sammenheng . Nonparametric korrelasjon gjør færre antakelser enn parametrisk korrelasjon. Parametrisk regresjon foruts variablene er intervall eller ratio skalert . Spearmans Rho

Spearmans rho ( den greske bokstaven ) forutsetter bare at variablene er ordens skalert . Ordens skalering betyr tallene som er gitt for hver variabel er i riktig rekkefølge , men ikke nødvendigvis i samme avstand . For eksempel, hvis du spør folk hvor mye de liker President Obama og valgene var " Ikke i det hele tatt ", " A little bit ", " Noe ", " Ganske mye , " og "A great deal" og disse valgene ble scoret 1 , 2, 3, 4 og 5, da tallene er i riktig rekkefølge , men det er vanskelig å si om forskjellen mellom " ikke i det hele tatt " og " litt " er det samme som differansen mellom " Stort sett " og " En god del. " For å beregne Spearmans R , rangere dataene og beregne vanlig korrelasjon mellom rekkene .
Kendall Tau

Kendall tau ( den greske bokstaven ) forutsetter også dataene er ordens , men det har en annen betydning enn Spearmans R. For å forstå Kendalls tau , må du først forstå konkordant og uharmoniske par. Et par er noen to fag i datasettet , for eksempel hvis du arbeider med mennesker , et par kan være Bob og Joe . Et par med verdier er overensstem hvis emnet som er høyere på den ene variable er også høyere på den andre. Et par er uharmoniske hvis motivet som er høyere på den ene variabelen er lavere på den andre. Kendall tau kan beregnes som (CD) /( n * n-1 /2) , hvor C er antallet av overensstemmende par , er D antall uharmoniske parene , og n er antallet av forsøkspersoner .

Goodman - Kruskal Gamma

Goodman - Kruskal gamma ( den greske bokstaven ) forutsetter også ordinale data . Den er beregnet som (CD) /( C + D) hvor C og D har samme betydning som i avsnitt 2. Gamma er mer hensiktsmessig når det er mange bundet observasjoner. Det er også noe lettere å forstå.
Chi - Square

Chi -kvadrat forutsetter bare at data er nominelle , som ikke har noen iboende orden. For eksempel, hvis du spør folk om deres etniske gruppe , og valgene er "White ", "Black ", " Latino ", " asiatisk " og " Annet ", så er det ingen pålegg til svarene . Av denne grunn , vil noen si at Chi -kvadrat er egentlig ikke et mål på samvariasjon, men det er absolutt et mål på forholdet mellom to variabler. For å beregne Chi -kvadrat , må dataene være i et beredskaps tabellen . Merke rader og kolonner med tall , og deretter beregne forventet verdi i hver celle (totalt kolonnen delt på totalsummen raden totale ganger) . Deretter finne forskjellene mellom de observerte og forventede frekvenser i hver celle , firkantet dem , dele dem med de observerte frekvensene , og legge alle kvotientene . I motsetning til andre tiltak , kan Chi -kvadrat ta på noen positive tall.

Hobbyer, spill © (www.northgames.biz)