matematisk & Statistiske metoder for Genetic Analysis

Genetikk er en gren av biologi opptatt med studier av gener , variasjon , og arvelig i dyr og planter . Matematikk og statistikk spiller en stor rolle i den disiplinen genetikk , spesielt subdiscipline av populasjonsgenetikk . Populasjonsgenetikk studerer frekvens og fordeling av ulike alleler i en bestemt populasjon av organismer og hvordan de forholder seg til andre populasjoner av organismer . Alleler er deler av den genetiske kode som er knyttet til bestemte attributter. Gjennomsnitts

Den mest grunnleggende form for statistisk analyse er gjennomsnittlig . Det er tre typer gjennomsnitt : gjennomsnitt , median , og modus . Middelverdien blir funnet ved å finne summen av et sett av data , og dividere denne sum med antall datapunkter. Midtlinje er funnet ved alle datapunkter i rekkefølge av størrelsen og velge midtdatapunkt . Modusen er rett og slett dataverdien som vises oftest. Alle tre typer gjennomsnitt er brukt i populasjonsgenetikk , men den vanligste er middelverdien .
Avvik

Variansen er et mål på hvor mye av verdiene i en sett av data variere. Variansen er symbolisert ved s ^ 2 , eller en sigma squared symbol . Denne variansen blir beregnet ved å finne summen av kvadratet av forskjellen mellom hver verdi og den midlere verdi, og deretter dividere med en mindre enn antall datapunkter. Et eksempel på en variasjon kan omfatte antall flekker på en bestemt art av bille . Anta at det er fem biller i settet , og antall plasser på hver bille er 5 , 5 , 6 , 6 og 8 Gjennomsnittet er : .

( 5 + 5 + 6 + 6 + 8 ) /5 = 6

avviket er beregnet som følger : en

[ (5 - 6) ^ 2 + (5 - 6) ^ 2 + ( 6 - 6 ) ^ 2 + ( 6 - 6 ) ^ 2 + ( 8-6 ) ^ 2 ] /( 5 - 1 ) = 1,5
p Dette gir oss en indikasjon på spredningen av verdiene

Standardavvik

Standardavviket er et annet mål på spredning . Det er kvadratroten av variansen . Det har den fordel at den har de samme enhetene som datasettet det er avledet fra . I eksempelet over standardavviket er : en

( 1.5) ^ ( 0,5 ) = 1,22474

Dette indikerer at standardavviket i antall flekker på bestanden av biller er ca 1,22 flekker .
Korrelasjon

Korrelasjon er et mål på mengden av sammenhengen mellom to datasett . I populasjonsgenetikk kan korrelasjoner brukes til å studere forholdet mellom besittelse av bestemte gener og forekomster av bestemte egenskaper. Korrelasjonen er symbolisert med en r med senket xy , der x og y er variabler av de to datasettene . Korrelasjoner er alltid mellom -1 og 1. . -1 Betyr at det er en negativ korrelasjon , 0 betyr at det ikke er noen sammenheng , og en betyr at det er en positiv korrelasjon.
Regresjon

regresjon er et statistisk verktøy som brukes for å finne sammenhengen mellom to variabler . Regresjonen koeffisienten er gitt symbolet b med senket yx , hvor y og x er variable i de to settene med data. Regresjonskoeffisienten måler den anslåtte endringen i ay variabel per en enhet endring i variabel x .
Genetiske lidelser Nomenklatur

Når man diskuterer genetisk lidelse , er det flere tekniske termer som beskriver et mønster av uorden i den generelle populasjonen. Disse vilkårene omfatter insidens , prevalens , dødelighet og levetid risiko . Forekomsten av en genetisk lidelse er andelen i befolkningen med en bestemt genetisk lidelse . Forekomsten av en genetisk lidelse er antall mennesker innenfor en spesifikk undergruppe , for eksempel en bestemt aldersgruppe , som har en bestemt genetisk lidelse . Dødeligheten refererer til antall mennesker i en bestemt gruppe som dør av en bestemt forstyrrelse i året. Et eksempel på en dødelighet statistikk kan være " 10 000 mennesker i USA døde av syndrom X i 2010 . " Livstidsrisiko er gjennomsnittlig risiko for å utvikle en bestemt genetisk lidelse på et tidspunkt i en persons liv .

Hobbyer, spill © (www.northgames.biz)