Maskinlæring av genetisk hornstatus for ikkje-genotypa dyr
Ny metode vil gje auka avlsframgang for kolla-egenskapen.
Avlsforsker i Geno
arne.gjuvsland@geno.no
Å auka frekvensen av kolla dyr har vore eit mål i NRF-avlen sidan 1990-talet. I starten var det viktigaste tiltaket at når ein rekrutterte etter kolla oksar så var det berre kolla søner som blei kjøpt inn. I 2012, da genotyping blei tatt i bruk til utvalg av testoksar, blei det også laga ein test for genetisk hornstatus (kolla-genotype). Dermed kunne ein skilla mellom heterozygot kolla (KH) og homozygot kolla (KK) oksar. I 2017 blei kolla tatt inn i avlsmålet og i 2019 blei vekta auka til 5.3 prosent av avlsmålet.
Låg sikkerheit bremsar avlsframgangen for kolla
I utrekninga av avlsverdi er det talet på kolla-allel (allel er alternative utgaver av samme gen) som går inn som egenskap. For genotypa dyr bestemmer me dette med svært høg sikkerheit (>0.99). For ikkje-genotypa dyr er det fram til no hornanlegg registrert ved kalving som har blitt brukt. Figur 1 viser fordelinga av genetisk hornstatus og registrert hornanlegg for genotypa kalvar. For ikkje-genotypa dyr, blir denne fordelinga blir brukt til å rekna ut at forventa tal på kolla-allel frå registrert hornanlegg. Ei utfordring ved å bruka hornanlegg er at sjøl med perfekte registreringar vil ein ikkje kunna skilla mellom KH (heterozygot) og KK (homozygot kollet). I tillegg er det slik at ein del HH-kalvar (homozygot horna) blir registrert som kolla eller ukjent og nær 25 prosent av KH-kalvane blir registrert som horna (Figur 1). Noko av dette er nok feilregistrering, men for ein del kalvar er det er vanskeleg å vurdera hornanlegget, spesielt for dyr med nyvler (sjå Buskap 7, 2019). Uansett årsak fører dette til lågare sikkerheit (ca 0.8) for ikkje-genotypa dyr. I og med at berre rundt 15 prosent av NRF-kalvane blir genotypa begrensar dette avlsframgangen for kolla i heile populasjonen.
Ulike kjelder til informasjon om genetisk hornstatus
Hornanlegg seier mykje om genetisk hornstatus, men det er fleire andre relevante registreringar. Til dømes vil avhorning tala for at dyret er HH, men dersom det er ein oksekalv er det også mulig at den er KH og har nyvlar. Genetisk hornstatus til far og mor eller morfar inneheld også mykje informasjon. For ei ku som har fått fleire kalvar, vil registreringar på kalvane ha informasjon om kua sin genotype. Vidare er det variasjon i kvalitet på registreringane mellom buskapar og graden av samsvar mellom registrerte hornanlegg og avhorning varierer.
Korleis kan ein så kombinera alle desse registreringane for å laga ein god prediksjon (forutseiing) av den genetiske hornstatusen til eit dyr som ikkje er genotypa? Dei siste ti åra har det vore ei rivande utvikling innan maskinlæring og kunstig intelligens, med metodar som kan avdekka mønster i store datasett og bruka desse til å predikera viktige egenskapar. Dei største gjennombrudda har vore innan analyse av komplekse datatypar som bilde, tekst eller data frå bruk av sosial medier. Desse nye metodane har vore prøvd ut til å rekna avlsverdiar, men har så langt ikkje fungert bedre enn dei tradisjonelle, lineære modellane. Men, etter å ha testa litt viser det seg at maskinlæring fungerer bra til prediksjon av genetisk hornstatus.
Individ/buskap |
Data som blir brukt til prediksjon |
---|---|
Dyret som skal få predikert genetisk hornstatus |
Alle dyr: Hornanlegg, avhorning, alder ved avhorning, kjønn og fødselsår Kyr: Talet på kalvar, kolla kalvar og avhorna kalvar. Summen av kolla-allel frå fedrene til kalvane |
Far, morfar og mormors far |
Genetisk hornstatus |
Mor |
Hornanlegg, avhorning og eventuelt genetisk hornstatus |
Buskap |
Talet på dyr i buskapen, kor stor del av dyr i buskapen som er registrert som horna/ukjent. Graden av samsvar (korrelasjon) mellom «registrert horna/ukjent» og avhorna. |
Maskinlæring gjer høgare sikkerheit
Tabell 1 gjer oversikt over data henta ut frå Kukontrollen, genotypedata og slektskapsinformasjon. Dette datasettet kombinert med kjent genetisk hornstatus på dei genotypa dyra blei brukt til å trena opp maskinlæringsmodellar som kan predikera genetisk hornstatus for alle dyr. Den beste modellen gjer sikkerheit på 0.93, ei klar forbedring frå dagens metode. Modellen predikerer talet på kolla-allel ved å oppsummerera alle registreringane for eit dyr i eit desimaltall mellom 0 og 2. Figur 2 viser gjennomsnitt av predikert mot faktisk genetisk hornstatus for genotypa dyr. Ved genotyping (svart) blir talet på kolla-allel bestemt nøyaktig. Ved å bruka registrert hornanlegg (raud) greier ein å skilla HH-dyr frå KH/KK, men talet på kolla-allel blir klart undervurdert for KH-dyra og kraftig undervurdert for KK-dyr. Maskinlæring (grøn) gjer betre prediksjonar over heile linja, HH-dyr får snitt-prediksjonar nærare 0 (ingen kolla-allel), KH-dyr nær 1 og KK-dyr godt over 1.
Endring i avlsverdiar og forventa auke i avlsframgang
Me implementerer denne forbedringa i predikert genetisk hornstatus i avlsverdiutrekninga i løpet av sommaren 2021. Overgangen frå bruk av hornanlegg vil gjera at avlsverdien endrar seg for mange dyr, men endringa vil gje bedre sikkerheit og dermed auka avlsframgang for kolla uten å endra vekta i avlsmålet. Alle seminoksar blir genotypa før seleksjon, men på morsida er det mange gode dyr som ikkje er genotypa og desse dyra får no sikrare verdiar for kolla. Ved utlisting av mødre til seminokseemne og aktuelle embryokviger vil kolla kyr havna lenger opp på lista og det vil dermed bli fleire kolla kalvar å selektera frå.