SCANFOODLABEL - De ontwikkeling van een databank met informatie over de etikettering en verpakking van voedingsproducten op de Belgische markt

Last updated on 2-9-2025 by Lieke Vervoort
Projectduur:
oktober 25, 2024
-
oktober 25, 2025

In het kort

Het SCANFOODLABEL-project heeft als doel een uitgebreide databank van voedingsproducten op de Belgische markt te ontwikkelen, waarin etiketteringsinformatie zoals ingrediënten, voedseladditieven (E-nummers) en voedingswaarden wordt gebundeld.

We verzamelen data van duizenden producten bij online retailers en creëren zo een waardevolle gegevensbron voor de domeinen voeding en voedselveiligheid. Om dit te realiseren ontwikkelen we geautomatiseerde methoden om grote hoeveelheden aan voedingsdata op te schonen en te verwerken, waaronder een AI-gebaseerde aanpak voor het classificeren van producten volgens de gestandaardiseerde categorieën die worden gebruikt in de voedingswetenschap en EU-regelgeving.

Door deze gegevens toegankelijk te maken, helpt dit project onderzoekers en beleidsmakers bij het monitoren van voedingsproducten op de markt, het identificeren van potentiële gezondheidsrisico’s, en het ondersteunen van een evidence-based voedingsbeleid.

 

 

Projectbeschrijving

Databank van voedingsproducten

De Belgische markt biedt een breed assortiment aan voedingsproducten, waarvan de etikettering cruciale informatie bevat voor voedselveiligheids- en voedingsbeleid. Onder de Europese regelgeving wordt veel van deze informatie verplicht of vrijwillig op de productverpakking vermeld. Enkele belangrijke elementen zijn:

  • Ingrediënten (incl. voedseladditieven met hun functies),
  • Voedingswaardedeclaratie (i.e., calorieën, vezels, eiwitten, vetten, suikers, …)
  • Allergenen
  • Gezondheidsbeweringen
  • Houdbaarheidsdata
  • Vrijwillige labels (zoals Nutri-Score).

Ondanks het belang ervan bestaat er geen uitgebreide databank die deze informatie samenbrengt. Met het SCANFOODLABEL–project willen we dit gebrek aan gegevens aanpakken door een hoogwaardige databank van etiketteringsgegevens te ontwikkelen voor voedingsproducten op de Belgische markt.

Data-verzameling & analyse

Voortbouwend op eerdere wetenschappelijke projecten hebben we via webscraping van online retailplatforms gegevens verzameld over een groot aantal voedingsproducten. In de huidige fase van het project omvat deze dataset bijna 100.000 unieke voedingsproducten.

Dergelijke ruwe data bevat echter onvermijdelijk inconsistenties en vereist grondige opschoning en verwerking voordat ze bruikbaar is voor analyse. Om het nut van de gegevens verder te vergroten, ontwikkelen we een methodologie met als doel het volgende te realiseren:

  • Het genereren van gestructureerde data over de aanwezigheid en functie van voedseladditieven door deze informatie af te leiden uit de ruwe tekstweergave van de ingrediënten.
  • De voedingsproducten classificeren volgens de relevante gestandaardiseerde voedselclassificatiesystemen.

Schaalbaarheid & Automatisering

Hoewel onze initiële dataset omvangrijk is, evolueert de markt voor voedingsmiddelen constant en ondergaat ze vaak snelle veranderingen. De databank up-to-date houden vormt om deze reden een aanzienlijke opgave. Handmatige en semi-geautomatiseerde methoden voor het schoonmaken en verwerken van gegevens worden onhaalbaar wanneer men geconfronteerd wordt met zo een voortdurend toenemende hoeveelheid aan data.

We pakken deze uitdaging aan door geautomatiseerde processen te ontwikkelen die de ruwe data transformeren conform de vereisten van onze database. Hiervoor onderzoeken we het gebruik van artificiële intelligentie (AI). Door het gebruik van machine learning-technieken, waaronder de toepassing van vooraf getrainde Large Language Models (LLM’s), kunnen we het praktische nut van grote datasets realiseren waarvoor de handmatige verwerking onhaalbaar zou zijn.

Expected Outcomes

Als onderdeel van dit project ontwikkelen we een dashboard om de toegankelijkheid van de gegevens te verbeteren en zo data-driven besluitvorming te verbeteren. Deze tool, waarmee gebruikers op efficiënte wijze de gegevens kunnen verkennen en analyseren, zal onderzoekers, regelgevende instanties en beleidsmakers ondersteunen. Visualisaties, geautomatiseerde analyses en configureerbare zoekopdrachten behoren tot de voornaamste functionaliteiten, die op maat worden gemaakt voor doeleinden voedselbeleid en risicobeoordeling.

Onze doelstelling op lange termijn is om de technieken en processen die in dit proefproject worden onderzocht verder te ontwikkelen tot een volledig geautomatiseerd kader dat systematische data-verzameling, -verwerking en -classificatie omvat.

Diensten die aan dit project werken

Geassocieerde gezondheidsonderwerpen

QR code

QR code for this page URL