Publisert: 22.03.2023 Oppdatert: 22.03.2023

Stikkord:

Ny maskinlæringsmodell for stykningsdeler

Straks en råne blir CT-skannet på teststasjonen Delta, blir bildene lastet opp i skyen. Der kjøres en nyutviklet maskinlæringsmodell for stykningsdeler som gir økt genetisk framgang.


Svin nr. 2 – 2023

 

 

Øyvind Nordbø, forsker i Norsvin

Den nye maskinlæringsmodellen er et viktig verktøy for å kunne bedre avlen på slakteprosent og spesielt verdifulle stykningsdeler, og for å kunne sortere gris til ulike markeder.

CT i svineavlen
I 2008 kjøpte Norsvin en CT-skanner for å kunne utføre målinger av kjøtt- og slakteprosent direkte på rånene på teststasjonen, og dermed fjerne halvsøskentesten. I begynnelsen var analysen av CT-bilder i stor grad manuell, der vi tegnet inn på bildene hvor snittet mellom innvoller og bryst/magehule skulle gå. Videre gjorde vi en automatisk analyse av slaktet, der vi brukte gråtoneskalaen på CT-bilder (se Figur 1a) til å si hvor stor andel av slaktet som var bein, fett og muskel. Dette var en stor forbedring i forhold til halvsøskentesten 

Automatisk analyse
I 2016 ble en mer automatisert «atlas»-metode for analyse av CT-bildene utviklet. Denne modellen kunne, i tillegg til automatisk å gjøre snittet mellom innvoller og magehule i 3D, også dele opp CT-bildet i stykningsdelene skinke, bog, hode, side og rygg. Dette var et stort steg mot full automatisering, men svakheten var at modellen var svært tung å kjøre. Ei kraftig datamaskin brukte en halvtime på å beregne stykningsdelene per dyr. 

Kunstig intelligens
Fra 2015 var det en voldsom utvikling av teknikker innenfor kunstig intelligens, og vi så relativt raskt at disse metodene var enklere å kjøre rutine­messig enn forløperne. Disse metodene kan kjøre helt automatisk, men de krever at vi har et stort datasett med annoterte data. Med annoterte data mener vi en fasit for hva vi ønsker at maskin­læringsmodellen skal utføre. 

I vårt tilfelle hadde vi allerede et godt datasett med segmenteringer (se faktaboks) fra «atlas»-­modellen som vi brukte til å trene modellen.
I 2020 ble første maskinlæringsmodell for stykningsdeler satt i drift. Denne modellen prosesserte alle CT-skanna gris både fra Norsvin og Topigs Norsvin i nesten tre år. 

 

Figur 1: Bilder fra CT, a) uten segmentering, b) segmentert med forrige maskinlæringsmodell, c) med manuelt korrigerte segmenteringer, brukt til å trene opp ny maskinlæringsmodell. Rosa er rygg, blå er innvoller, grønn er side, mens turkis er skinke. I c) har vi også lagt på ei ekstra klasse for krybba (i oransje).

 

Ny modell
I 2022 startet vi et arbeid med å re-trene maskinlæringsmodellen. Vi hadde oppdaget at den tidligere versjonen hadde noen svakheter som vi ønsket å forbedre. Spesielt gjaldt dette segmen­tering av testikler og innvoller, og vi så at i noen tilfeller ble også krybba som grisen ligger i under CT-skanninga inkludert som en del av grisen
(se Figur 1b). 

Men manuell segmentering er ensformig og langdrygt arbeid. I stedet for å segmentere alt fra bunnen av ønsket vi å bruke segmenteringene den gamle modellen produserte, og heller korrigere dem. Hode, rygg, bog og skinke var relativt godt segmentert, mens vi tegnet inn nye omriss av testikler, krybbe og innvoller manuelt i et tegneprogram på datamaskina, (se Figur 1c). 

Aktiv læring
Denne informasjonen ble så brukt til å trene opp modellen på nytt. Dette gjorde vi i en iterativ prosess, som kalles aktiv læring. Vi predikerte segmenteringer på noen nye dyr, kvalitetssjekket dem manuelt, korrigerte de som ikke var bra nok, og trente modellen på nytt med et stadig større datasett. Til slutt hadde vi en modell av tilfredsstillende kvalitet. Denne har vi nå brukt til å prosessere alle de 50.000 dyra som har vært scannet fra 2011 og fram til i dag.

Kvalitetsmål
Kvaliteten på en maskinlæringsmodell kan beregnes på mange måter. For segmenterings­modellen vår kan man beregne andelen piksler som blir klassifisert riktig i forhold til en fasit. Vi har også noen griser som har blitt skåret ned i tidligere forsøk, og man kan se på hvor godt prediksjonen stemmer med de faktisk veide stykningsdelene. 

Vi kan også kjøre en genetisk analyse av egenskapene og se hvor arvbare egenskapene er. Dersom egenskapene får høyere arvegrad (andel av egenskapen som kan forklares med gener), kan man si at det er mindre støy i systemet og at presisjonen til maskinlæringsmodellen er for­bedret. I Tabell 1 vises framgangen i arvbarhet på noen av de viktigste egenskapene som kommer ut fra maskinlæringsmodellen. 

 

Tabell 1: Arvbarheter på egenskaper fra ny vs. gammel maskinlæringsmodell

Egenskap Gammel ML-modell Ny ML-modell
Slakteprosent 0,32 0,33
Andel bog 0,36 0,45
Andel rygg 0,60 0,56
Andel side 0,37 0,58
Andel skinke 0,36 0,50

 

Stigende arvbarhet
Vi ser at for bog, side og skinke stiger arvbarheten betraktelig. For slakteprosent er nivå det samme, mens for andel rygg er arvbarheten noe lavere enn med den tidligere maskinlæringsmodellen. 

Den nye maskinlæringsmodellen er et kraftigere verktøy i svineavlen, men den tidligere versjonen var heller ikke dårlig. I tillegg til å forbedre selve modellen for stykningsdelene, har arbeidet også gitt oss kunnskap om hvordan man kan styre utviklinga av en maskinlæringsmodell på en effektiv måte. Denne erfaringa vil vi ta med oss inn i videre arbeid med å utvikle automatiserte modeller for skjelett-, hjerte- og lungehelse hos gris.

 

Fakta:

Maskinlæring: 

Maskinlæring er et samlebegrep om ulike metoder som man bruker for å gjøre prediksjoner. Typisk vil man gi datamaskinen eksempeldata og en fasit-tolkning på dataene.
I tillegg må man ha en modell med trenbare parametere som kan lære seg mønsteret mellom data og fasit. Så trener man modellen på eksempeldataene og ender med en prediksjonsmodell

 

Segmentering:
Segmentering er en metode for å kunne si hvilke piksler i et bilde som tilhører ulike klasser. I den siste maskinlæringsmodellen for stykningsdeler, har vi ni ulike klasser: bakgrunn, krybbe, innvoller, hode, rygg, side, bog, skinke og testikler.