Datakwaliteit

Onderzoek datakwaliteit datawarehouse

Onderzoek naar datakwaliteit van gegevens in datawarehouse vanwege discutabele KYC screening alerts

Lees verder

Klantcase - Datakwaliteitsonderzoek datawarehouse

Klant typering :

International gerenommeerde financiële instelling met focus op verzekeringen

Project Context :

Een financiële instelling is in het kader van anti-witwas- en sanctiewetgeving verplicht om klantgegevens te screenen. De screening vindt voor een deel geautomatiseerd plaats waarbij op basis van gegevensvergelijkingen matches worden gegenereerd. Hierna bepaalt een medewerker of de match terecht is of onterecht. De klantgegevens komen uit een centraal datawarehouse dat dagelijks wordt bijgewerkt op basis van operationele systemen.

Uitdaging :

De kwaliteit van de gegenereerde vergelijksresultaten staat ter discussie onder andere door dubbele en incomplete aanleveringen. Hierdoor duurt de dagelijkse afwikkeling te lang, waarmee onder andere de verplichting te voldoen aan wet- en regelgeving onder druk staat. Om betrokken stakeholders te activeren moet het probleem inzichtelijk gemaakt worden. De totale dataset bevat ruim 4,5 miljoen records met 20 kenmerken.

Opdracht :

Onderzoek de kwaliteit van de klantgegevens. Gebruik hierbij middelen die toegankelijk zijn voor niet technische medewerkers zonder complexe technische omgeving. Lever de resultaten zodanig op dat er makkelijk vervolgonderzoek gedaan kan worden.

Aanpak :

Transcriptum heeft de datakwaliteit module van de methode DataTranscript ingezet als losse aanpak voor het onderzoek. Samen met de beleidsmedewerker en medewerkers uit de operatie is vervolgens een set controleregels gemaakt waarmee het onderzoek is uitgevoerd.

De te onderzoeken dataset is vanwege technische beperkingen opgedeeld in logische subsets. Hierdoor kon het onderzoek plaatsvinden binnen de gewone werkplek van de betrokken medewerkers.

Resultaten zijn opgeleverd in csv formaat en rapportages in excel.

Activiteiten :

  • Inventariseren problematische screeningresultaten;
  • Bepalen en vastleggen datakwaliteitsregels;
  • Analyseren kwaliteit van de brondata;
  • Rapporteren onderzoeksresultaten.

Resultaat :

  • Door gebruik te maken van de methode DataTranscript is relatief eenvoudig aangetoond dat er in de brongegevens veel data ontbrak, inconsistent was en ook dubbel werd aangeleverd.
  • De informatie die uit de DataTranscript rapportages gehaald werd zorgde ervoor dat de organisatie een verbeterplan voor zowel proces als data heeft opgezet en dit onder coördinatie van de interne auditdienst heeft uitgevoerd.
  • Door gedetailleerde datakwaliteitsgegevens vast te leggen kon het verbeterplan goed uitgewerkt worden in verschillende concrete maatregelen. Het effect was dat betere checks in het proces konden worden ingebouwd en dat de screeningsresultaten verbeterd werden, waardoor de organisatie beter kan voldoen aan wet- en regelgeving.