Personeelslijst
Ruben De Blaere
Biologie
Houtbiologie
Houtbiologie
Beschrijving
De Blaere, R., Van den Bulcke, J., Beeckman, H., Verwaeren, J. & Hubau, W. 2025. Identification of Congolese wood species by use of anatomical images and artificial intelligence. Gent : Ghent University. 259 p. (PR) ISBN: 9789463579025.
Book
Illegale houtkap vormt een ernstige bedreiging voor bossen en kan onherstelbare schade met zich meebrengen, zeker wanneer beschermde boomsoorten worden geëxploiteerd. Naar schatting is tussen de 30 en 90 procent van het verhandelde tropisch hout illegaal gekapt. Om dit tegen te gaan zijn verschillende regelgevingen en beleidsmaatregelen ingevoerd, gericht op meer transparantie en traceerbaarheid binnen de houtketen. Voorbeelden hiervan zijn het FLEGT-actieplan, de Europese Houtverordening (EUTR), de Europese Ontbossingsverordening (EUDR), de Amerikaanse Lacey Act en het CITES-verdrag. Het succes van deze maatregelen hangt in grote mate af van één cruciale voorwaarde: de snelle en betrouwbare identificatie van houtsoorten, van het moment van kap tot aan transport, opslag en uitvoer.
Houtidentificatie gebeurt a.d.h.v. anatomische, chemische en genetische technieken. Van deze methoden is de anatomische analyse – gebaseerd op de structuur van houtcellen en -weefsels – het meest gebruikelijk. De IAWA heeft gestandaardiseerde kenmerken opgesteld die wereldwijd als referentie gelden. Microscopische analyse levert een hoge nauwkeurigheid op, maar vereist gespecialiseerde apparatuur, training en tijdrovende voorbereiding van stalen. Daardoor is deze methode minder geschikt voor screening in het veld. Macroscopische analyse, waarbij gekeken wordt naar kenmerken die met het blote oog of een loep zichtbaar zijn op vers gezaagde of geschuurde oppervlakken, is veel toegankelijker en goedkoper. Vooral een dwarsdoorsnede van het hout toont belangrijke kenmerken zoals de ligging van vaten, breedte van stralen en verdeling van parenchym – elementen die vaak worden gebruikt in veldgidsen.
Toch kent deze methode duidelijke beperkingen. Het aantal waarneembare kenmerken is beperkt, en er bestaat vaak grote variatie binnen dezelfde soort. Dat maakt het moeilijk om met zekerheid een soort te benoemen. De IAWA-kenmerken zijn bovendien beschrijvend van aard (“aanwezig”, “variabel”, “afwezig”), wat subtiele maar relevante verschillen kan verhullen en interpretatie subjectief maakt. Bovendien is er tot op het heden weinig onderzoek uitgevoerd naar hoe goed deze kenmerken werkelijk onderscheid tussen houtsoorten mogelijk maken, vooral in soortenrijke tropische gebieden. Daardoor blijven betrouwbare identificatiesleutels en de ontwikkeling van nieuwe herkenningsmodellen achter.
Beeldherkenning via computer visie biedt hierin een veelbelovend alternatief. CNNs kunnen zelfstandig visuele kenmerken herkennen op foto’s van houtdoorsneden en zo automatisch en snel soorten identificeren. Deze technologie werkt op draagbare apparaten en wordt al toegepast in de praktijk, bijvoorbeeld met het XyloTron-systeem in Ghana. Toch kent ook deze aanpak uitdagingen. De trainingsdata bestaat vaak uit perfecte stalen, terwijl hout in de praktijk beschadigd kan zijn door bijvoorbeeld scheuren, verkleuring of aantasting door insecten of schimmels. Zulke schade kan kenmerken verbergen en de nauwkeurigheid van modellen aantasten. Recente studies (zoals Ravindran et al., 2023 en Owens et al., 2024) hebben aangetoond dat beschadiging de prestaties beïnvloedt, maar er wordt nog weinig rekening gehouden met dit soort schade tijdens het trainen van modellen.
Een ander knelpunt is dat de meeste CNN-modellen uitgaan van een gesloten systeem: ze gaan ervan uit dat elk monster tot een bekende soort behoort. In regio’s met veel biodiversiteit is dat niet realistisch, omdat daar ook onbekende of moeilijk te onderscheiden soorten voorkomen. Pogingen om dit op te lossen met opt-out categorieën of drempelwaarden hebben tot nu toe weinig succes gehad. Daarom groeit de belangstelling voor zogenaamde open-wereldmodellen. Een veelbelovende aanpak hierin is object-herkenning via re-identificatie: beelden worden vertaald naar zogeheten ‘embeddings’, een soort digitale vingerafdruk, waarbij beelden van dezelfde soort in dezelfde cluster vallen. Nieuwe beelden kunnen dan vergeleken worden met een referentiedatabase. Met technieken als triplet learning en binaire verificatie worden modellen getraind om subtiele verschillen tussen soorten te herkennen. Hoewel deze aanpak complexer is en nauwkeurige selectie van trainingsvoorbeelden vereist, sluit ze beter aan bij hoe experts in de praktijk te werk gaan: via vergelijking in plaats van categorisatie.
Een belangrijke uitdaging bij het opzetten van effectieve herkenningssystemen is de enorme soortenrijkdom van bomen wereldwijd, vooral in tropische gebieden zoals de DRC. Hout is bovendien een zeer variabel materiaal, beïnvloed door genetica, groeiplaats en de positie binnen de boom (bijvoorbeeld stam versus tak). Daardoor is het lastig om uniforme herkenningskenmerken vast te stellen. Ook worden wetenschappelijke namen regelmatig herzien, wat het samenstellen van betrouwbare databases bemoeilijkt. In de houtindustrie worden soorten bovendien vaak gegroepeerd onder handelsnamen, die niet altijd overeenkomen met botanische realiteit. Bestaande databases zoals InsideWood, macroHOLZdata, CITESWoodID en het Atlas of Macroscopic Wood Identification bieden nuttige informatie, maar bevatten vaak te weinig variatie binnen soorten en zijn niet altijd gekoppeld aan fysieke referenties. Daardoor zijn ze minder geschikt voor het trainen van robuuste AI-modellen. De beperkingen en achterliggend problematiek wordt omschreven in hoofdstuk 1 a.d.h.v. literatuur.
Om deze beperkingen tegemoet te komen, ontwikkelden we SmartWoodID – de grootste referentiedatabase van gelabelde macroscopische houtdoorsneden, specifiek bedoeld voor snelle en nauwkeurige soortherkenning in de DRC, waar illegale houtkap veel voorkomt. De database is gebaseerd op de uitgebreide Tervuren houtcollectie (ondergebracht in het Koninklijk Museum voor Midden-Afrika, Tervuren, België) en bevat meerdere, kwalitatief hoogwaardige beelden per soort, met focus op commercieel belangrijke taxa. In tegenstelling tot andere databases bevat SmartWoodID ook hout met zichtbare schade of variatie, zoals scheuren, schimmel of insectenvraat. Hierdoor zijn modellen die op deze beelden getraind zijn beter bestand tegen realistische veldomstandigheden. De bouw van deze databank wordt beschreven in hoofdstuk 2.
In hoofdstuk 3 onderzochten we de in welke mate de 31 gestandaardiseerde kenmerken bij 601 houtsoorten identificatie mogelijk maken, gebruikmakend van de SmartWoodID-database. Hoewel deze kenmerken helpen om binnen kleine taxonomische groepen te onderscheiden, bleken ze op bredere schaal onvoldoende onderscheidend. Modellen die alleen op deze kenmerken gebaseerd waren, behaalden slechts ongeveer 50% nauwkeurigheid op genusniveau bij 56 Congolese commerciële houtsoorten. Dit benadrukt de noodzaak om ook de andere houtanatomische kenmerken, zichtbaar op andere vlakken en bij grotere microscopische vergroting, te gebruikenen te combineren met andere methoden.
Hoofdstukken 4 en 5 onderzochten CNN-modellen die getraind werden op beelden van houtdoorsneden. Deze modellen bleken veel beter in staat om fijne kleur- en textuurpatronen te herkennen – informatie die experts intuïtief gebruiken, maar niet in vaste kenmerken wordt vastgelegd. CNNs presteerden aanzienlijk beter dan modellen op basis van handmatige geannoteerde kenmerken, met nauwkeurigheden boven de 85% en in meer dan 95% van de gevallen stond het juiste genus in de top zes voorspellingen. Dit bevestigt dat visuele data meer diagnostische waarde heeft dan eerder werd aangenomen, en dat AI deze informatie effectief kan benutten.
Omdat in de praktijk vaak een combinatie van visuele indrukken en gestandaardiseerde kenmerken wordt gebruikt, onderzochten we in hoofdstuk 6 of deze twee benaderingen gecombineerd konden worden. Het opnieuw rangschikken van CNN-voorspellingen met behulp van handmatige kenmerken leverde voor sommige soorten verbeteringen op, maar bij andere – waaronder belangrijke zoals Khaya – leidde het tot lagere nauwkeurigheid. Dit wijst op het belang van zorgvuldige afstemming bij het combineren van methodes.
We onderzochten ook hoe de samenstelling van de trainingsdata de prestaties beïnvloedt. Modellen presteerden beter naarmate er meer verschillende monsters en grotere scanoppervlakken beschikbaar waren. Modellen getraind op onbeschadigde beelden behaalden de hoogste sensitiviteit (90,5%), gevolgd door gemengde (88,4%) en beschadigde beelden (79,1%). Analyse met Grad-CAM liet zien dat modellen zich vooral richten op intacte structuren, wat het belang van zorgvuldig monsterbeheer en beeldkwaliteit benadrukt.
Tot slot keken we in hoofdstuk 5 naar herkenningsstrategieën voor open-wereldtoepassingen (scenario’s waarin niet alle mogelijke soorten vooraf in het model zijn opgenomen). Binaire verificatie, waarbij beelden vergeleken worden met referentievoorbeelden in plaats van direct geclassificeerd, bleek robuust en effectief – zelfs bij onbekende soorten. Deze aanpak is bijzonder geschikt voor situaties waarin de vraag niet is "welke soort is dit?" maar "komt deze soort overeen met wat is opgegeven?". In vrijwel alle gevallen presteerde deze methode minstens zo goed als of beter dan traditionele classificatie. We onderzochten ook triplet learning, waarbij beelden worden omgezet in numerieke vectoren die het anatomisch patroon vastleggen. Deze vectoren kunnen vervolgens worden vergeleken of ingevoerd in eenvoudige technieken zoals nearest neighbour of XGBoost. De eerste resultaten waren gemengd – mogelijk door suboptimale training – maar de aanpak blijft veelbelovend, vooral voor toekomstige systemen die meerdere soorten data (zoals DNA of chemische profielen) combineren.
Dit onderzoek biedt een directe vergelijking van houtidentificatie a.d.h.v. traditionele houtkenmerken en CNN-classificatie op houtsoorten in de DRC. Het benadrukt het belang van open-wereld benaderingen voor de ontwikkeling van betrouwbare, schaalbare en toegankelijke identificatiesystemen. De bevindingen bieden waardevolle handvatten voor de bestrijding van illegale houtkap en vormen de basis voor de volgende generatie AI-ondersteunde houtherkenningstools.