Hvordan finne et problem med et restplott

I statistikk residualene er forskjellene mellom verdiene av den avhengige variabelen spådd av modellen og verdiene av selve avhengig variabel . Ordinær regresjon forutsetter at residualene er normalfordelt . Det forutsetter også at variansen av residualene er konstant på tvers av nivåene av de uavhengige variablene , og at restene ikke er relatert til den uavhengige . En måte å sjekke de to siste forutsetningene er å se på et restplott , som plotter en uavhengig variabel på x-aksen og residualene på y-aksen . Instruksjoner
1

Søk etter endring i spredning av variansen som selvstendig øker variable . Se på restene i nærheten av den nedre ende av den x - aksen , ved midten av x - aksen og i nærheten av den øvre ende . Avstanden mellom de høyeste og laveste residualene bør være omtrent lik over nivået av den uavhengige variabelen. Hvis de ikke er det, har du et problem som kalles heteroskedastisitet .
2

Se etter en økning eller reduksjon i residualene som uavhengig variabel øker. På alle nivåer av den uavhengige variabelen , restene burde være sentrert rundt 0. Det bør være verken en økning eller nedgang , eller bør det være en U - formet mønster (lav i midten , høy i begge ender ) eller en omvendt U -formet mønster. Tomten skal se ut som en blob. Hvis den ikke gjør det , da har du et problem med variablene i modellen.
3

Se etter uteliggere . Ingen rest burde være mye høyere enn de andre. Hvis ett punkt hopper ut , eller noen få do , enten mye lavere eller mye høyere enn de andre, da de kan være forbundet med rammene. Dette kan være en dataregistrering feil , eller det kan være en svært uvanlig sak .

Hobbyer, spill © (www.northgames.biz)