Hva er R2 Lineær regresjon

? Statistikere og forskere har ofte et krav om å undersøke forholdet mellom to variabler , ofte kalt x og y . Hensikten med å teste noen to slike variabler er vanligvis å se om det er noen link mellom dem , kjent som en sammenheng i naturfag . For eksempel , en vitenskapsmann vil kanskje vite om timer med soling kan være knyttet til forekomst av hudkreft . For matematisk å beskrive styrken av en korrelasjon mellom to variabler , slike søkere ofte R2. Lineær regresjon

Statistikere bruke teknikken for lineær regresjon til å finne den rette linjen som passer best til en serie med x og y data par. De gjør dette gjennom en rekke beregninger som henter ligningen for beste linje. Denne matematiske beskrivelsen av linjen vil være en lineær ligning , og har den generelle form av y = mx + b , hvor x og y er de to variablene i datapar , m er helningen av linjen og b er dens y- aksen.
Korrelasjonskoeffisient

beregningene som finner den beste rett linje vil produsere en lineær likning som passer til ethvert sett med data , selv om dataene er faktisk ikke så veldig lineær. For å få en indikasjon på hvor godt dataene faktisk passer en rett linje , statistikere også beregne et tall som kalles korrelasjonskoeffisienten . Dette er gitt symbolet r eller R og er et mål på hvor nøye justert dataparene er til det beste rett linje gjennom dem .
Betydningen av R

R kan ha noen verdi betyr mellom -1 og 1. En negativ verdi av R rett og slett at den best passer rett linje skrår nedover beveger seg mot venstre til høyre, i stedet for oppover. Jo nærmere R er å enten av de to ytterpunktene , jo bedre tilpasning av datapunktene til linjen, med enten -1 eller 1 er en perfekt passform og en R verdi på null betyr at det ikke er passform og poengene er helt tilfeldig . Hvis datapunktene er godt justert til rett linje , er det sies å være noen sammenheng mellom dem , derav navnet korrelasjonskoeffisient for R.
R2

Noen statistikere foretrekker å arbeide med verdien av R2 , som er ganske enkelt korrelasjonskoeffisienten squared , eller multiplisert med seg selv , og er kjent som koeffisienten . R2 er svært lik R , og også beskriver korrelasjonen mellom de to variable, men det er også noe annerledes . Det måler den prosentvise variasjon i y- variabel som kan tilskrives variasjoner i x variabel. En R2- verdi på 0,9 , for eksempel, innebærer at 90 prosent av variasjonen i y- data er på grunn av variasjon i x -data. Dette betyr ikke nødvendigvis at x er virkelig påvirker y , men at det synes å være å gjøre det.

Hobbyer, spill © (www.northgames.biz)