Data analytics kan een bepalende factor zijn voor de groei van je bedrijf. Maar als de kwaliteit van die data niet goed is, kan dat de groei juist belemmeren. Hier lees je hoe je slechte data kunt voorkomen.
In dit artikel
Tools voor data analytics en business intelligence kunnen op een bijna magische manier belangrijke inzichten geven en helpen bij de besluitvorming. Je data moeten dan wel schoon en nauwkeurig zijn, anders werkt je gegevensanalyse eerder als een rookgordijn.
Als mkb’er op zoek naar inzichten op basis van gegevens waarmee je je bedrijf kunt laten groeien, zul je zo snel mogelijk aan de slag willen met data-analyse. Maar als je waardeloze data gebruikt in je poging om je concurrenten een stap voor te blijven, doe je waarschijnlijk meer kwaad dan goed, omdat je dan beslissingen neemt op basis van onbetrouwbare informatie.
In dit artikel gaan we in op het belang van datakwaliteit en beschrijven we enkele best practices om de kwaliteit van de gegevens in je data-analyse te waarborgen.
Wat is datakwaliteit en waarom is het belangrijk?
Hoogwaardige gegevens zijn:
- Juist
- Compleet
- Up-to-date en contextueel
Als je bijvoorbeeld een set financiële gegevens over twee jaar hebt voor je bedrijf, mag die geen gegevensinvoerfouten bevatten, er mogen geen rapporten ontbreken en de gegevens moeten up-to-date zijn met de laatste rapporten. De gegevens moeten ook relevant zijn. Laat bijvoorbeeld geen inkomsten van bijkomend consultancywerk weg omdat je totale cijfers er hierdoor beter of slechter uitzien.
Slechte datakwaliteit wil zeggen dat de gegevens onjuist, onvolledig of verouderd zijn, of niet in de juiste context worden gebruikt.
Als je slechte data gebruikt, is dat net zoiets als de tank van je auto vullen met verdunde benzine. In het beste geval levert dat je onbetrouwbare en misleidende gegevensinzichten op. In het slechtste geval kun je door onjuiste gegevens echter hoge boetes en straffen krijgen of zelfs je bedrijf kwijtraken.
Je bent vaak ook wettelijk verplicht om te zorgen voor een goede datakwaliteit en om persoonsgegevens te beschermen. Het is dus belangrijk dat je op de hoogte bent van de AVG/GDPR-regels in de EU.
Een goed datakwaliteitsbeheer begint bij het verzamelen van de data, maar daar stopt het niet. Je moet grote datasets blijven monitoren om de kwaliteit te waarborgen. En dan is er ook nog de data-invoer, dataprofilering, data-opschonen, data-analyse: allemaal touchpoints waar de datakwaliteit risico loopt en beheerd moet worden.
Bekijk deze video voor meer informatie over de verschillende fasen van datakwaliteitsbeheer (in het Engels):
Zorg dat je alleen data van hoge kwaliteit gebruikt
Het waarborgen van de datakwaliteit is misschien niet het leukste deel van je bedrijfsvoering, maar databeheer en -kwaliteitscontrole zijn van cruciaal belang voor het succes van je bedrijf.
Volgens Melody Chien, senior director analyst bij Gartner, omvat een effectief datakwaliteitsbeheer niet alleen de dagelijkse taken die horen bij processen, beleidsregels, rollen en verantwoordelijkheden. Ook het strategisch prioriteren van de datakwaliteit als bedrijfsdoelstelling en het aanschaffen van technologie voor datakwaliteitsbeheer zijn van groot belang. (Volledig rapport beschikbaar voor klanten.)
Er zijn dus vijf cruciale onderdelen, aldus Chien:
Beperk het databereik tot wat er redelijkerwijs gemonitord kan worden. Hoe meer data je hebt, hoe lastiger het wordt om de hoogste informatiekwaliteit te handhaven voor die data. Stel je hebt een groente- en fruitbedrijf en tien medewerkers moeten elke dag de kwaliteit van 500 dozen vers fruit waarborgen. Dan schroef je de productie opeens op tot 1000 dozen zonder meer personeel in te zetten. Dan glipt er onherroepelijk ook fruit van een mindere kwaliteit doorheen. Zo werkt dat ook bij het controleren van de datakwaliteit. De oplossing is eenvoudig: beperk de omvang van je dataset tot wat je redelijkerwijs kunt beheren. Het is onmogelijk om de gegevensintegriteit voor elk aspect van je bedrijf voortdurend in de gaten te houden. Daarom moet je focussen op metrics die het belangrijkst zijn voor jouw bedrijfsdoelstellingen.
Stel een verantwoordelijke voor data governance aan voor elke gegevensset. Als er niemand expliciet verantwoordelijk is voor dataprofilering en datakwaliteitsbeheer, wordt datakwaliteit al gauw afgedaan als “niet mijn probleem”. Zorg dat deze rol duidelijk gedefinieerd is en dat elke verantwoordelijke de middelen en ondersteuning krijgt die nodig zijn om alle gecentraliseerde (gedeelde) data te overzien, om alle regels na te leven en om best practices te bevorderen.
Stel essentiële praktijken en processen op en distribueer deze. Bepaal regels en normen voor datakwaliteit, schoon de data regelmatig op aan de hand van die regels en blijf je gedeelde data voortdurend monitoren om ervoor te zorgen dat deze schoon zijn en voldoen aan interne en externe (wettelijke) normen.
Wijs cruciale rollen toe en ontwikkel vaardigheden voor datakwaliteitsbeheer. Hoewel een specifieke verantwoordelijke voor data governance cruciaal is, blijft het waarborgen van de kwaliteit en juistheid van de data voor het hele bedrijf altijd teamwerk. Je data quality manager moet van de leiding bevoegdheden krijgen om stewards op afdelingsniveau aan te sturen die de datakwaliteit kunnen monitoren en onderzoeken, en problemen kunnen oplossen.
Maak gebruik van moderne technologie voor datakwaliteit. Dit lijkt allemaal veel tijd en middelen te kosten, maar gelukkig is er datakwaliteitssoftware die de last aanzienlijk kan verlichten. Gartner voorspelt dat in 2025 “60% van de datakwaliteitsprocessen autonoom ingesloten en geïntegreerd is in kritieke zakelijke workflows, en niet meer uit afzonderlijke, individuele taken bestaat, in vergelijking met minder dan 30% in 2022”. (Volledig rapport beschikbaar voor klanten.) Dat betekent dus dat de meeste saaie en tijdrovende datakwaliteitstaken, zoals het verzamelen van data, controleren van masterdata, opsporen van datafouten en opschonen van data, automatisch achter de schermen door software wordt uitgevoerd.
Tips om je bedrijf op te schalen met datakwaliteitsbeheer
Overstappen van geen enkel programma voor datakwaliteitsbeheer naar een programma voor de hele organisatie mét de juiste mensen is niet iets wat je van de ene op de andere dag voor elkaar krijgt.
- Identificeer al je verschillende databronnen en leg deze vast. Gegevens waarvan je niet weet dat je ze hebt, kun je ook niet monitoren. Allereerst moet je dus alle verschillende bronnen op één plek bijeenbrengen om ze in te toekomst te kunnen monitoren. Dit kun je doen door aan de verschillende afdelingsleiders te vragen welke gegevensbronnen zij gebruiken.
- Wijs datamanagers op afdelingsniveau toe en geef ze de beschikking over processen en best practices voor datakwaliteit. Afhankelijk van de grootte van je bedrijf kun je het data quality management misschien al vanaf het begin overzien. Als je bedrijf echter groeit, heb je hulp op afdelingsniveau nodig om je normen voor datakwaliteit te handhaven.
- Richt een centraal team voor master data management op en geef dit team de beschikking over de juiste technologie. Als je mogelijkheden voor data-analyse eenmaal krachtig genoeg zijn, heb je een team van datawetenschappers nodig om je uiteenlopende datasets te monitoren en onderhouden. Op dit punt wil je ook technologie waarmee dit team zo effectief en efficiënt mogelijk kan werken.
Begin nu met het waarborgen van de datakwaliteit
Wij adviseren een tweeledige aanpak om de datakwaliteit voor je data-analyses te waarborgen:
- Best practices voor datakwaliteit, zoals hierboven beschreven en
- Tools voor datakwaliteit om het handmatige werk te beperken.
Hier zijn een paar dingen die je nu meteen al kunt doen om aan de slag te gaan:
- Maak een checklist voor datakwaliteit om binnen je hele bedrijf te distribueren. Zet hier bijvoorbeeld dingen in zoals “controleren of databronnen juist zijn” en “zorgen dat datasets de meest recente rapporten bevatten”.
- Gebruik die checklist om bestaande datasets te controleren. Terwijl je dit doet, kun je de checklist meteen bijwerken en uitbreiden.
- Stel nieuwe rollen en verantwoordelijkheden op voor het beheer van de datakwaliteit. Je kunt bijvoorbeeld een nieuwe data quality manager aannemen of gewoon een van je medewerkers aanwijzen om naast zijn of haar gewone werk je datasets te controleren, afhankelijk van de personeelsmiddelen die je hebt.
Als je eenmaal over data van hoge kwaliteit beschikt en een systeem hebt om die kwaliteit continu te waarborgen, ben je klaar om die nauwkeurige gegevens in te voeren in een business intelligence tool en betrouwbare inzichten te genereren op basis waarvan je beslissingen kunt nemen. In onze kopersgids voor business intelligence vind je alle informatie die je nodig hebt voordat je BI-software gaat kopen. We hebben ook een lijst met categorieleiders op het gebied van business intelligence. Deze bevat de 15 beste opties voor BI-software op basis van geverifieerde gebruikersreviews, zodat je efficiënt de data-inzichten kunt krijgen om jouw bedrijf in de juiste richting te sturen.