Datakwaliteit

Artikel

“3% foutieve data zorgt voor 30% hogere operationele kosten.”(Harvard)

Een gemiddelde organisatie kent 38 verschillende databases. Bij veel organisaties zijn deze als een spaghettilandschap aan elkaar geknoopt. Vaak is dit gekomen omdat de IT-afdeling op basis van processen leidend was en niet de informatiebehoefte van de gebruikers.

Het gevolg is een vervlechting van grote hoeveelheden systemen, waardoor beheerskosten enorm zijn. De flexibiliteit om snel aanpassingen te doen is weg en het overzicht volledig kwijt. Het is niet meer duidelijk of data die in het ene systeem staat, ook juist wordt overgenomen door een ander systeem. Hierdoor is er datavervuiling in systemen en is de kans groot dat er foutieve beslissingen worden genomen op basis van de verkeerde informatie.

Daarnaast zijn er ook ontzettend veel mutaties in data, denk bijvoorbeeld alleen al bij klantdata aan het feit dat er dagelijks duizenden personen verhuizen. In Nederland zelfs gemiddeld 7 keer op een mensenleven. Wanneer deze gegevens op 1 plaats in de organisatie worden verwerkt is het van groot belang dat deze automatisch ook op andere plekken aangepast worden.

Kosten van slechte datakwaliteit

Verschillende onderzoeken tonen aan dat slechte data binnen de meeste organisaties een grote impact heeft op het kostenaspect binnen een organisatie. Het kostenaspect wordt onderverdeeld in twee categorieën:

  • Kosten voor het opschonen en corrigeren
  • Kosten van incorrecte beslissingen

Voorbeelden van slechte datakwaliteit en dataprocessen binnen organisaties:

  • Dezelfde (artikel)codes met verschillende omschrijvingen
  • Verschillende (artikel)codes met dezelfde omschrijvingen
  • Ontbrekende mapping, denk aan een klantorder zonder een klant
  • Verschillende datadefinities in verschillende bronsystemen
  • Verschillende (master) data uit verschillende bronsystemen, maar onmogelijk eenvoudig te koppelen door ontbrekende logica
  • Processen voor het beheren (maken, bewerken, verwijderen) zijn niet gestandaardiseerd en het beheer vindt plaats op ad-hoc basis
  • Er zijn geen duidelijke afspraken omtrent het invoeren van data

De correctie van deze datakwaliteit is een arbeidsintensieve taak. De daarmee gepaard gaande kosten zijn voor een deel zichtbaar, maar voor een deel ook verborgen. Denk aan periodiek uitgevoerde activiteiten om de data weer te schonen, opschonen van data in Excel bestanden door gebruikers. Tijd die nuttiger besteed moet worden in de dagelijkse operatie.

Het tweede aspect van kosten, zijn de kosten van incorrecte beslissingen. Op het moment dat het management belangrijke beslissingen neemt, moet het blindelings kunnen vertrouwen op de kwaliteit van de data. Verkeerde data leidt tot verkeerde inzichten en daardoor foutieve beslissingen. Voorbeelden zijn het structureel te hoog inschatten van de klantvraag, waardoor er te veel voorraden worden aangehouden. Of een verkeerde investeringsbeslissing, die in de praktijk niet terugverdiend wordt. Het hebben van de juiste data verhoogt de kwaliteit van beslissingen en reduceert kosten.

Hoe zorg je voor datakwaliteit?

Is je datakwaliteit goed? Dan haal je veel meer uit je organisatie. Maar ook uit je investeringen. Zoals die in je CRM, Analytics, KPI’s of een datawarehouse. Alles staat of valt met de kwaliteit van je data. Maar, hoe verhoog je de kwaliteit van data?

  • Laat business in lead zijn. Wat is er nodig?
  • Het verbeteren van datakwaliteit is geen eenmalige activiteit. Er moet blijvend aandacht voor zijn.
  • Koppel verschillende softwarepakketten binnen de organisatie. Integreer gewenste informatie in het juiste pakket. Bijvoorbeeld ERP, CRM, urenregistratietool, ziekteverzuimtool etc.
  • Zorg dat je meer weet dan alleen de klanthistorie uit je eigen systeem, staaf informatie ook bij officiële bronnen. Denk hierbij ook aan open data: Vrij beschikbare data van bijvoorbeeld overheden en kennisinstituten. Denk aan de data van het CBS, KVK, GIS systemen of RDW. Het doel van open data is hergebruik. Door die te koppelen met bedrijfsdata kun je die enorm verrijken.
  • Vergeet ook de Zero data niet, dit is data die niet in de database zit. Deze data geeft bijvoorbeeld aan wat klanten niet kochten (zoals abandoned shopping carts).
  • Vergelijk automatisch data van je partners met de data in je eigen systeem en krijg een melding wanneer hier afwijkingen in zijn.

Bescherming data

Hou ook rekening met de bescherming van je data. Denk hierbij ook aan de AVG wetgeving.

Privacy is een belangrijk aspect. Je klanten en partners vertrouwen hun gegevens aan jouw organisatie toe. Zorg ervoor dat alleen de gegevens die noodzakelijk zijn, zichtbaar zijn in de diverse applicaties en toegankelijk voor de mensen die hier recht toe hebben.

Security is ook een hot topic. Het moet niet mogelijk zijn om data te hacken uit een online database.

Transparantie wordt steeds belangrijker. Welke klantdata sla je op en welke data deel je met derden?

Quickscan

Om inzicht te krijgen in het huidige en gewenste niveau van de datakwaliteit kan er een Quickscan uitgevoerd worden. Deze kan intern in de organisatie worden uitgevoerd of met behulp van een derde partij. In deze assessment worden alle data gerelateerde processen en systemen onder de loep genomen. De eerste stap is het identificeren van alle databronnen en de bijbehorende data producenten (welk systeem genereert de data) en de dataconsumenten (welk systeem heeft de data nodig). Dit zorgt voor meer inzicht in de processen rondom data en hoe hiermee wordt omgegaan binnen de organisatie. Dit is een trend waarbij IT en gebruikers meer gaan samenwerken.

Wanneer duidelijk is welke informatie waar nodig is, kan de informatie via logische flows gekoppeld worden.

Lees hier ook meer over hoe Dovetail in dit traject te werk gaat en jullie hierbij kan ondersteunen.

Korte samenvatting

  • Data van slechte kwaliteit kost een organisatie veel geld
  • Het bewaken van de kwaliteit van de data is een continu proces
  • Verrijking van data met informatie uit andere bronnen is essentieel

Wat kan Dovetail betekenen in het bewaken van de datakwaliteit?

Dovetail kan koppelingen realiseren tussen systemen en ervoor zorgen dat er naadloze data-integratie plaatsvindt.

Data-integratie is het verbinden van bestaande en nieuwe bedrijfsapplicaties in een netwerkomgeving en met de buitenwereld. Data vertrekt vanuit een beginpunt, wordt getransporteerd en als bruikbare data getransformeerd naar het eindpunt.

  • Door het integreren van data wordt de kwaliteit van de data beter
  • De kwaliteit van de data wordt continu gewaarborgd
  • Medewerkers kunnen hierdoor efficiënter werken en hebben meer tijd om de organisatie naar een hoger niveau te brengen
  • Systeemdata kan eenvoudig worden getoetst met data uit andere bronnen om het zo zuiver mogelijk te houden
  • Error routing kan worden ingesteld om fouten snel op te sporen en te verbeteren

Dovetail werkt op basis van een ESB (Enterprise Service Bus). Indien meerdere systemen gekoppeld worden is het verstandig om applicaties niet direct met elkaar te koppelen, maar gebruik te maken van een een tussenliggende software laag. Het direct koppelen leidt vaak tot spaghetti en een moeilijk te onderhouden IT-landschap. Om directe koppelingen te voorkomen en een overzichtelijk goed beheersbaar landschap te creëren wordt daarom
vaak een ESB gebruikt. Zie een ESB als een universele stekkerdoos waarmee diverse systemen automatisch gekoppeld kunnen worden en er logica kan worden aangebracht zodat de berichten die over en weer gaan bewerkt of verrijkt kunnen worden. De ESB zorgt er tevens voor dat de berichten naar het juiste eind-station worden gestuurd.

Dovetail is dé oplossing voor al je integratie uitdagingen. Het platform beschikt over een gebruiksvriendelijke, grafische user interface waardoor integraties op basis van no-code ook eenvoudig te maken zijn door niet-programmeurs.

Screenshot 2019-02-19 at 13.51.47
Screenshot 2019-02-19 at 13.52.53