Vlinders herkennen met deep learning

Fontys ICT

Studenten helpen Naturalis vlinders herkennen met deep learning

Biodiversiteit monitoren is een uitdaging en die zit ‘m voor Naturalis vooral op het vlak van data. Het biodiversiteitscentrum steunt voor hun onderzoek naar de distributie en verplaatsing van, bijvoorbeeld, vlindersoorten op basis van waarnemingen van vrijwilligers. Zij maken foto’s van vlinders, die door experts geïndexeerd kunnen worden op soort. Zo krijgt Naturalis goede data, zonder zelf het veld in te gaan. Maar wat nou als artificial intelligence (AI) die data direct kan omzetten in bruikbare inzichten?

Citizen Science 
Bijdragen leveren aan wetenschappelijk onderzoek, zonder zelf onderzoeker te zijn gebeurt vaker. Citizen science heet dat, wanneer vrijwilligers data delen van archeologische vondsten of flora en fauna die ze tegenkomen in de natuur. Deze data, inclusief coördinaten en datum, worden gedeeld via een platform of app. Image Recognition Models (IRM) zorgen voor identificatie via de apps Iobs (iOS) en ObsIdentify (Android). Maar identificatie van wat dan op die foto staat kan lastig zijn als de beeldkwaliteit slecht is. Met vlindersoorten, waar dit project betrekking op had, zijn er ook gevallen waar twee soorten niet van elkaar te onderscheiden zijn. Daarnaast worden ook niet overal observaties gedaan, wat voor gaten zorgt in de data.

Species Distribution Models 
Species distribution models kunnen hierin uitkomst in bieden. Op basis van geografische en klimaat-gerelateerde data kan zo’n model voorspellen hoe waarschijnlijk het is dat een soort vlinder voorkomt op locatie X. Dit zou vrijwilligers meteen een identificatie van hun observatie kunnen bieden, en de datakwaliteit voor Naturalis verbeteren. Bovendien maakt dit het mogelijk om voorspellingen te doen over populatie distributie (bijvoorbeeld, op basis van klimaatverandering), en dus ook die gaten in observaties aan te vullen. Het ontwikkelen van zo’n model met AI was de opdracht voor Fontys Hogeschool ICT Studenten Max de Goede, Lars van Driel, Pol Roskam en Jochem Wienk gebaseerd op deep learning AI.

Deep learning voor betere inzichten 
De studenten ontwikkelden de tooling om data te verwerken en samen te voegen voor dit model. Een ‘data pipeline’ die in de toekomst uitgebreid kan worden. Hiervoor waren twee datasets beschikbaar, vertelt student Max de Goede: “De eerste set bestond uit de observaties van vlindersoorten door vrijwilligers via observation.org. Afbeeldingen, met daarbij de soort, coördinaten en datum. De tweede set data was verzameld door Naturalis zelf met geo-factoren, zoals hoogte, klimaat, en andere variabelen.”

Check hier ook de video uit de reeks Eyes on AI.