Datakwaliteit is geen project maar een discipline
Datakwaliteit is geen eenmalige opschoonactie maar een doorlopende discipline. Productdata veroudert, brondata bevat fouten, medewerkers maken vergissingen en kanaalvereisten wijzigen. Zonder actief kwaliteitsbeheer degradeert de datakwaliteit geleidelijk — met directe gevolgen voor conversie, klanttevredenheid en operationele efficiëntie.
PIM biedt de tools om datakwaliteit meetbaar en beheersbaar te maken. Maar tools alleen zijn niet voldoende; het vereist ook processen, verantwoordelijkheden en een cultuur waarin datakwaliteit wordt gewaardeerd. Resources als PIM Vendors bieden bewezen frameworks voor structurele datakwaliteitsbewaking.
De zes dimensies van datakwaliteit
Volledigheid
Volledigheid meet of alle relevante attributen van een product zijn ingevuld. Een product met een beschrijving maar zonder afbeelding is onvolledig. Een product met Nederlandse content maar zonder Duitse vertaling is onvolledig voor de Duitse markt.
Volledigheid wordt uitgedrukt als een completeness score: het percentage ingevulde velden ten opzichte van het totale aantal relevante velden. De score kan worden berekend per product, per productcategorie, per kanaal of over de gehele catalogus.
Correctheid
Correctheid meet of de ingevulde waarden kloppen. Een product met een gewicht van 5.000 kilogram (terwijl het 5 kilogram zou moeten zijn) is incorrect. Een product met een EAN-code die niet voldoet aan het checkdigit-algoritme is incorrect.
Correctheid is lastiger te meten dan volledigheid. Automatische validatieregels vangen grove fouten op (onrealistische waarden, ongeldige codes), maar subtielere fouten (een verkeerde kleuromschrijving, een verouderde specificatie) vereisen menselijke controle.
Consistentie
Consistentie meet of dezelfde informatie op dezelfde manier wordt vastgelegd. Schrijft u "rood" of "Rood"? Is het gewicht in grammen of kilogrammen? Is de maat in centimeters of millimeters? Inconsistentie maakt de data onbetrouwbaar en onvergelijkbaar.
Consistentie wordt geborgd door het datamodel: keuzelijsten in plaats van vrije tekst, eenheden als attribuuteigenschap in plaats van in de waarde, en validatieregels die formaten afdwingen.
Actualiteit
Actualiteit meet of de data de huidige werkelijkheid weerspiegelt. Een product dat uit assortiment is maar nog als beschikbaar wordt getoond, is niet actueel. Een prijs die vorige maand is gewijzigd maar op de webshop nog de oude waarde toont, is niet actueel.
Actualiteit wordt geborgd door geautomatiseerde synchronisatie met bronsystemen en door periodieke reviews van de data.
Uniekheid
Uniekheid meet of elk product slechts één keer in het systeem voorkomt. Duplicaten ontstaan wanneer hetzelfde product via verschillende bronnen wordt geïmporteerd of wanneer de matchinglogica bij import onvoldoende is.
Duplicaten veroorzaken verwarring, dubbelwerk en tegenstrijdige informatie op kanalen. Automatische duplicaatdetectie op basis van EAN, artikelnummer of productkenmerken helpt om duplicaten te voorkomen en op te sporen.
Conformiteit
Conformiteit meet of de data voldoet aan externe standaarden en kanaalvereisten. Voldoen de productattributen aan de GS1-standaard? Bevat de Amazon-feed alle verplichte velden in het juiste formaat? Voldoet de data aan de eisen van de Digital Product Passport?
Conformiteit wordt gemeten per standaard of per kanaal en vereist gedetailleerde kennis van de betreffende eisen.
Meten in de praktijk
Completeness scores
De completeness score is de meest gangbare maat voor datakwaliteit in PIM. De meeste PIM-systemen bieden ingebouwde completeness-berekening die per product, per kanaal en per categorie kan worden ingezien.
Definieer per kanaal welke attributen verplicht zijn (must-have) en welke gewenst (should-have). De completeness score kan beide niveaus weerspiegelen: een harde score (alleen verplichte velden) en een zachte score (verplichte plus gewenste velden).
Validatieregels
Validatieregels controleren automatisch of waarden aan de gestelde eisen voldoen. Voorbeelden zijn: EAN-code moet 13 cijfers zijn en voldoen aan het checkdigit, gewicht moet tussen 0,01 en 9.999 kilogram liggen, prijs moet groter dan nul zijn, en afbeelding moet minimaal 1000x1000 pixels zijn.
Regels worden uitgevoerd bij import, bij bewerking en bij publicatie. Producten die niet aan de regels voldoen, worden geblokkeerd of gemarkeerd.
Dashboards
Kwaliteitsdashboards aggregeren de scores en regels tot overzichtelijke rapportages. Een goed dashboard toont de gemiddelde completeness per kanaal, de verdeling van producten over kwaliteitsniveaus, de trend over tijd (verbetert of verslechtert de kwaliteit?), de categorieën en attributen met de laagste scores, en het aantal openstaande kwaliteitsissues.
De verbetercyclus
Datakwaliteit verbeteren is een cyclisch proces.
Meten. Breng de huidige staat in kaart met completeness scores, validatierapporten en dashboards. Stel een baseline vast.
Analyseren. Welke dimensies scoren het laagst? Welke categorieën, attributen of bronnen zijn de oorzaak? Is het een structureel probleem (het datamodel mist een attribuut) of een operationeel probleem (het team heeft de verrijking niet afgerond)?
Actie. Voer gerichte verbeteracties uit: verrijkingscampagnes voor onvolledige categorieën, feedback naar leveranciers over datakwaliteit, procesaanpassingen om fouten bij de bron aan te pakken, of datamodel-uitbreidingen om ontbrekende attributen toe te voegen.
Monitoren. Controleer of de verbetering beklijft. Stijgt de completeness score? Daalt het aantal validatiefouten? Zo niet, dan is de actie onvoldoende geweest of is er een nieuw probleem ontstaan.
Borgen. Vertaal succesvolle verbeteringen naar structurele maatregelen: aangescherpte validatieregels, aangepaste workflows, gewijzigde importprocedures.
De menselijke factor
Tools en processen zijn noodzakelijk maar niet voldoende. Datakwaliteit vereist ook een cultuur waarin de waarde van goede data wordt erkend en waarin medewerkers zich verantwoordelijk voelen voor de kwaliteit van hun werk.
Dit begint bij het management: als datakwaliteit geen KPI is en geen aandacht krijgt in de periodieke reviews, zal het team het niet als prioriteit behandelen. Maak datakwaliteit zichtbaar, vier successen en bespreek problemen constructief.
Samenvatting
Datakwaliteit in PIM wordt gemeten langs zes dimensies: volledigheid, correctheid, consistentie, actualiteit, uniekheid en conformiteit. Completeness scores, validatieregels en dashboards maken de kwaliteit meetbaar. Een cyclus van meten, analyseren, actie, monitoren en borgen zorgt voor structurele verbetering. De menselijke factor — cultuur, verantwoordelijkheid en aandacht — is minstens zo belangrijk als de technische tools.