Hoe gebruik je machine learning als er weinig gegevens zijn?
Software kan leren om kanker te herkennen in een medische scan, of spam uit je email box houden. Maar dat lukt alleen wanneer er genoeg voorbeelden zijn om het systeem te trainen. En dat is lastig wanneer er weinig gegevens zijn over een bepaalde taak, of zelfs helemaal ontbreken. Kerstin Bunte, hoogleraar machine learning, is een specialist in het werken met beperkte gegevens. Ze zwemt tegen de stroom in door niet alleen om meer te vragen.
FSE Science Newsroom | René Fransen
‘In bijvoorbeeld de kindergeneeskunde zijn er vaak weinig gegevens bekend over de patiëntjes’, zegt Bunte. Je kunt nu eenmaal niet veel bloed afnemen bij een pasgeborene, ziek of gezond. Daarom behandelen artsen kinderen vaak als ‘kleine volwassenen’, terwijl hun lichamen toch echt anders reageren op zowel ziekte als geneesmiddelen. Bunte heeft samengewerkt met kinderartsen om dit probleem op te lossen.
In haar aanpak combineert ze machine learning, waarbij een heleboel informatie nodig is om het systeem te trainen, met kennis van experts: alles wat de dokters weten over het onderwerp. Die kennis maakt ze zich zelf ook gedeeltelijk eigen, in haar project voor kindergeneeskunde bijvoorbeeld de effecten van geneesmiddelen in het laboratorium of bij proefdieren. ‘Uit dit soort gegevens kan ik een heleboel leren over bepaalde medische problemen en de behandeling ervan bij kleine kinderen’, legt Bunte uit. En ze heeft verschillende technieken ontwikkeld om dit soort kennis te gebruiken voor machine learning.
Boeren en kinderartsen
Naast medische vragen heeft Bunte ook projecten gedaan in de sterrenkunde en landbouw. ‘Sterrenkundigen hebben meestal heel veel gegevens, maar de aanwijzingen voor de evolutie van sterrenstelsels en het universum die ze willen bestuderen zitten daar diep in begraven’, legt zij uit. En boeren hebben een vergelijkbaar probleem als kinderartsen, wanneer zij bijvoorbeeld beelden willen gebruiken om ziekten te herkennen. Het is lastig om aan foto’s van zieke gewassen te komen om het systeem mee te trainen, aangezien die vaak kort aanwezig zijn in het seizoen. ‘En je kunt moeilijk een paar hectare aan planten handmatig onderzoeken.’
Door haar kennis van een bepaald domein te analyseren – zoals geneeskunde, sterrenkunde of landbouw – kan ze ontdekken waar er informatie ontbreekt. ‘En de structuur van wat we niet kunnen waarnemen kan informatie bevatten voor de oplossing.’ De combinatie van vaardigheden die Bunte bezit is vrij uniek, terwijl het aantal wetenschappers dat werkt aan het probleem van beperkte gegevens zelf ook nogal beperkt is.
Academici willen theorieën horen
Bovendien kost het flink wat tijd om voldoende kennis op te doen over een gebied waarin machine learning moet worden toegepast. Bunte: ‘Het kost ongeveer vijf jaar om een nieuw domein goed genoet te leren kennen om gerichte oplossingen te bedenken kost mij minstens vijf jaar.’ Elk domein vraagt bovendien om een eigen strategie voor machine learning. ‘Samen met collega’s heb ik inmiddels een reeks van technieken ontwikkeld, waardoor ik ervaring heb opgedaan met veel verschillende strategieën om dit te doen.’
Voor toekomstig onderzoek is ze zich aan het verdiepen in robots voor de slimme industrie. ‘Er is genoeg te doen in mijn vakgebied.’ Maar eerst wil ze met haar team de theorie achter de oplossingen voor het probleem van ontbrekende gegevens verder uitbouwen. ‘De oplossingen moeten beter schaalbaar worden. En de algoritmes die we hebben ontwikkeld vragen nogal wat rekentijd, daar willen we ook iets aan doen.’
Door al haar interdisciplinaire werk heeft Bunte geleerd te spreken voor allerlei verschillende groepen. ‘Wanneer ik met mensen uit de industrie praat willen ze weten welke oplossingen ik voor ze heb. Maar andere academici willen vooral iets horen over mijn theorieën en ideeën.’ Bunte werkt veel met wetenschappers van buiten haar eigen vakgebied, en heeft ook contact met de volgende generatie via schoolbezoeken. Ze ontwikkelde bijvoorbeeld een educatief spel waarin schijnbaar toevallige wiskundige processen allerlei fantastische structuren opleveren. ‘En als een vrouwelijke computerwetenschapper ben ik een rolmodel voor de meisjes op deze scholen.’ Ze kijkt al uit naar volgend jaar, als het eendaagse ‘Alice and Eve’ evenement, waarin de rol van vrouwen in computerwetenschap centraal staat, in Groningen plaatsvindt.
‘Ik geniet van al die verschillende ontmoetingen. Zo leer ik allerlei interessante mensen kennen en krijg ik de kans om boeiende plekken te bezoeken, van scholen tot ziekenhuizen, boerderijen of telescopen bovenop een hoge berg.’
Laatst gewijzigd: | 18 december 2024 10:21 |
Meer nieuws
-
30 januari 2025
Uitgelichte publicaties december 2024 - januari 2025
Lees hier over de uitgelichte publicaties van december/januari: nieuwe inzichten in elektronica van 2D materialen en in de eiwitklonten die de ziekte van Huntington veroorzaken.
-
28 januari 2025
Het heelal bestuderen om de wereld te begrijpen
Door de kosmos te begrijpen, kunnen we ook de fundamenten van onze wereld beter doorgronden. Dat is de gedachte achter het onderzoeksthema Fundamentals of the Universe, waarin drie instituten van de Rijksuniversiteit Groningen op unieke manier...
-
27 januari 2025
Werken aan betere AI (met minder geld dan de VS)
De VS gaat een duizelingwekkend bedrag van 500 miljard euro investeren in AI. Aan de Rijksuniversiteit Groningen werken onderzoekers juist aan Future-Proof Computing: energiezuinigere hardware en verantwoorde AI die kan samenwerken met de mens.