Nieuw datawarehouse in aanbouw bij de Volksbank
De Volksbank wil eind 2020 een nieuw datawarehouse realiseren dat voldoet aan alle gestelde eisen vanuit zowel de toezichthouder als de eigen organisatie. De wereld staat in de tussentijd niet stil. Op technologisch vlak, op het gebied van energiezuinigheid en in termen van privacy blijven ontwikkelingen plaatsvinden. Het datawarehouse zal dus zelfs tijdens de ontwikkeling al geschikt moeten zijn om zeer snel aanpassingen aan te kunnen. Jurriaan Groot, Architect Finance Innovation, en Jaco van der Laan, Lead Modelleur leggen uit hoe ze dit bij de Volksbank aanpakken.
De Volksbank bouwt aan een nieuw datawarehouse, waar alle data van de bank en van de onderliggende merken samenkomt. Wat is de aanleiding voor dit project en wat is deambitie?
“Data is voor de Volksbank een belangrijk onderdeel van haar bedrijfsvoering. Data beschrijft alle informatie van en over onze klanten, de ontwikkelingen in de markt én wordt als input voor onze modellen gebruikt, die op hun beurt ook weer data genereren. Om deze data goed te kunnen gebruiken dient er een plek te zijn waar deze data samenkomt en klaargezet wordt voor de (eind)gebruikers. De laatste jaren hebben we een sterke toename van gedetailleerde vragen gezien vanuit onze interne organisatie, maar ook van externe partijen zoals toezichthouders. Om deze vragen binnen de gestelde tijdslijnen, kwaliteits- en inhoudseisen op te kunnen leveren heeft de Volksbank besloten om een nieuw datawarehouse te bouwen met een nieuwe data modelleringsaanpak.”
Wat gaan jullie klanten en medewerkers merken van dit datawarehouse en de mogelijkheden die dit biedt?
“Voor onze klanten zou er in principe niet veel moeten veranderen. Wij moeten blijven aantonen dat we goed met hun data omgaan. Daarnaast willen we op tijd kunnen inspelen op ontwikkelingen bij onze klanten en de maatschappij. Én voldoen aan alle vereiste rapportages en vragen van externe partijen zoals de toezichthouders. Als alles goed is ingericht dan zijn onze medewerkers minder tijd kwijt zijn met het opvragen van data en krijgen ze juist meer tijd om onder meer die data te analyseren.”
Wat zijn de belangrijkste uitdagingen bij het bouwen van dit datawarehouse?
“Bij zulke omvangrijke ICT-trajecten is een succesvol einde niet vanzelfsprekend. Een verklaring hiervoor is dat vaak enkel de start en het eindresultaat vergeleken worden en dan ook nog heel binair: het is wel of niet gelukt. We werken volgens een andere aanpak door te werken in korte cycli waarbij iedere (deel)oplevering genoeg reden tot succes geeft, maar ook de ruimte om meteen daarna verder te kunnen bouwen. Een voordeel van deze werkwijze is dat wij telkens eerder kunnen bijsturen en doorlopend leren.”
“Edison heeft het ooit mooi verwoord door zijn experimentele aanpak als volgt te beschrijven: ‘I have not failed, I’ve just found 10.000 ways that don’t work’. Alle betrokkenen brengen hun eigen ervaring mee waarbij iedereen mee kan praten over alle keren dat iets niet bleek te werken zoals verwacht. Natuurlijk gaan we genoeg momenten meemaken dat we even terug naar de tekentafel moeten, maar dat gebeurt nu terwijl we het huis bouwen in plaats van pas tijdens de oplevering. Dit bereiken we door een nieuwe manier van bouwen; het automatiseren van de datastromen. Maar met alleen de techniek gaan we niet het verschil maken. Daarom kijken de afnemers van de data continu mee naar alle onderdelen die gebouwd worden. Zo krijgen onze afnemers meer kennis van het huis, zodat ze zelf ook weten waar de leidingen lopen en welke apparaten bij welke groep horen. En het geeft ze ook meer de ruimte om zelf na te denken over eventuele aanpassingen aan het huis. Er zullen altijd aanpassingen aan onze rapportageketen nodig zijn vanwege bijvoorbeeld nieuwe eisen vanuit een toezichthouder, interne rapportagewensen of migratie van een bronsysteem.”
Op welke wijze hebben jullie de data ontsloten uit alle systemen inclusief legacy?
“De meeste informatie wordt dagelijks ontsloten naar een specifieke laag in onze database omgeving. Hier voegen we technische sleutels aan toe om de koppelingen te vereenvoudigen en mutaties te verwerken. Onze klanten kunnen hun eigen data op ieder moment opvragen. Diezelfde data is voor ons noodzakelijk om onze taken uit te voeren, maar als het om interne en externe financiële rapportages gaat is er in de meeste gevallen nog geen noodzaak om deze data real-time te benaderen.”
“Natuurlijk zijn we ondertussen aan het onderzoeken welke technische mogelijkheden er zijn om de ontsluiting te versnellen. We hebben hiervoor een datavirtualisatie-platform ingericht dat de mogelijkheid heeft aangetoond om data veel sneller beschikbaar te maken dan via traditionele methodes. Samen met het nieuwe datawarehouse kunnen we zo goed blijven inspelen op de huidige en toekomstige informatiebehoefte van onze klanten, de toezichthouder en onze aandeelhouder.”
“De laatste jaren hebben we niet zozeer een toename in de vastlegging van nieuwe data gezien, maar vooral een toename in het gebruik van deze data. Vragen als ’wat valt op’, ‘hoe relateert dit tot andere data’, ‘hoe goed is de kwaliteit’ en ‘hoe recent is deze informatie’ krijgen een steeds prominentere rol bij het verwerken van data. En voordat deze vragen beantwoord kunnen worden dient al bepaald te zijn of deze informatie gedeeld kan worden conform onze privacyrichtlijnen zoals vastgelegd in onze Datavisie. Zo kijken we niet alleen naar de wijze van ontsluiten van data maar ook steeds meer naar de manier van verwerken.”
Wat bedoelen jullie met het automatiseren van technische datastromen en wat levert dit op?
“We kunnen het datawarehouse het beste beschouwen als een datafabriek waar ruwe brondata via halffabricaten wordt omgevormd tot data-eindproducten. Binnen deze fabriek stroomt data vanuit de bronnen, via de centrale database naar de data-afnemers. We kunnen deze datastromen op een logische manier modelleren zonder hierbij nog iets te zeggen over de technische realisatie ervan. De vertaling van deze logische datastromen naar technische datastromen hangt namelijk erg af van allerlei factoren zoals bijvoorbeeld het database platform dat wordt gebruikt.
"Met onze model-gedreven werkwijze kunnen we snel aanpassingen doorvoeren aan het datawarehouse. Datastromen zijn zodoende op een eenvoudige en overzichtelijke manier te maken en te onderhouden."
In veel bestaande data warehouses worden technische datastromen vaak handmatig gebouwd. Ze zijn daardoor complex en als gevolg lastig te onderhouden. Met de nieuwe werkwijze die we binnen het DWH-team van de Volksbank gebruiken, worden de technische datastromen automatisch gegenereerd op basis van de logische modellen gecombineerd met standaard patronen. Door deze model-gedreven werkwijze te hanteren kunnen we snel aanpassingen doorvoeren in het datawarehouse en zijn de datastromen op een eenvoudige en overzichtelijke manier te maken maar ook te onderhouden.”
Welke afdelingen binnen de Volksbank zijn het nauwst bij dit project betrokken en waarom?
De nadruk in deze fase ligt op het opleveren van de inrichting van het datawarehouse voor de Finance en Risk afdelingen. Daarom zijn er nu voornamelijk collega’s uit IT, Finance, Risk en het CDO Office betrokken bij het vaststellen van de wensen en eisen voor het datawarehouse. Tevens is er veel ondersteuning vanuit de afdelingen die verantwoordelijk zijn voor de primaire vastlegging van data. En is er expliciet aandacht voor het goed bewaken van alle aspecten van ons datamanagement-raamwerk.
Hoe borgen jullie de verschillende belangen in dit project? Waar komen de belangen van deze afdelingen overeen en waar verschillen ze?
Op zich is dit een hele terechte vraag, maar daarmee benadruk je wel erg de verschillen. Natuurlijk brengen de business- en IT-afdelingen verschillende expertise in het project in. Maar het uiteindelijke belang van iedereen is hetzelfde: eind 2020 een datawarehouse opleveren dat voor alle gebruikers een grote stap vooruit is. Het verschil gaat zitten in de fase daarna. De gebruikers gaan het datawarehouse intensief gebruiken terwijl de collega’s van IT weer andere trajecten gaan oppakken. Er zal voldoende vraag zijn naar uitbreidingen van het datawarehouse voor andere afdelingen, maar als deze aanpak zich heeft bewezen dan kunnen we deze verder binnen het bedrijf toepassen en veel sneller de gewenste uitbreidingen realiseren.
Hoe zorgen jullie ervoor dat medewerkers straks in de nieuwe situatie het maximale weten te halen uit het datawarehouse?
We laten onze gebruikers vanaf het begin meedenken en meekijken tijdens de bouw. Hiervoor krijgen ze voldoende tijd. Ook laten we onze gebruikers nu al meekijken in het pakket dat we gebruiken voor het opzetten van alle datamodellen. En hebben we een aantal organisatie onderdelen, waaronder Finance – Accounting, Reporting & Control, al ingericht om data-driven te werken. Een gebruiker zou bij iedere taak, zoals een rapportage opstellen, specifieke analyse doen of een vraag van de toezichthouder beantwoorden, zelf de details moeten kunnen raadplegen en begrijpen hoe de data tot stand is gekomen. Pas wanneer er echt een nieuwe informatiebehoefte ontstaat, is er een technische aanpassing in de keten nodig, maar deze kunnen we nu ook binnen weken in plaats van maanden realiseren.
Morgen - dinsdag 17 december - organiseert Jaco van der Laan namens de Volksbank de Meetup ‘’Modeldriven DWH Automation with PowerDesigner’’. Hierin licht hij toe hoe de Volksbank grenzen verlegt in het gebruik van PowerDesigner, de bekende datamodelleringstool van SAP, die veel grote organisaties gebruiken om hun datawarehouse te modelleren. De Volksbank is actief op zoek naar nieuwe collega’s om een bijdrage te leveren aan het nieuwe datawarehouse en nodigt geïnteresseerden van harte uit om te solliciteren.