Het is zeker niet eenvoudig om de juiste architectuur te kiezen wanneer u de data-infrastructuur van een organisatie moderniseert. Zakelijke gebruikers zullen waarschijnlijk moeite hebben met het begrijpen van het grote aantal technische concepten dat op hun pad komt. Een niet-uitputtende lijst: database, datalake, datawarehouse, datafabric, data mesh, data lakehouse, datamart. Als je hoofd begint te tollen, voelen we je. Ingaan op de technische details van elk zou iets zijn om aan te pakken in onze technische posten van donderdag. Wat vanuit zakelijk perspectief belangrijk is, is het begrijpen van de ‘centrale componenten’ waaruit de ‘datareis’ bestaat, voordat deze kan worden geconsumeerd in de vorm van visualisaties/rapporten. Laten we eens kijken:
Zoals je in de bovenstaande afbeelding kunt zien, doen veel bedrijven het ‘achteruit’. Ze beginnen zich zorgen te maken over visualisaties (werken in Power Bi, Tableau, …) en Machine Learning voordat ze tijd en moeite hebben geïnvesteerd in het opzetten van duidelijke ETL- (extract, transform, load) of dataverwerkingsprocessen. Een belangrijke les van onze kant – van wat we bij klanten hebben gezien – is dat technologieën zo grondig verkeerd kunnen worden begrepen dat ze voor de verkeerde taken worden gebruikt. We krijgen bijvoorbeeld regelmatig vragen over welk datawarehouse we moeten kiezen om er vervolgens achter te komen dat de organisatie een app wenst die data raadpleegt (pull) zonder dat daar analytics voor nodig is. In dit geval zou een datawarehouse niet alleen duur zijn, maar ook zijn doel voorbijschieten – een eenvoudige database zou waarschijnlijk voldoende zijn.
Wij begrijpen als geen ander dat de businessbehoeften centraal staan bij het kiezen van een architectuur. Dat gezegd hebbende, zijn we ons er ook van bewust dat de zakelijke behoeften snel kunnen veranderen. Door de jaren heen is de evolutie van wat een ‘moderne data-architectuur’ vormt nogal wat veranderd:
Een McKinsey-artikel (2020) bracht zes fundamentele verschuivingen aan het licht die de manier waarop we met data omgaan zo diepgaand veranderden dat het onverstandig zou zijn om ze te negeren. We vermelden ze hier:
- Van on-premise tot cloud
- Van batch tot realtime
- Van vooraf geïntegreerde commerciële oplossingen tot modulaire best-of-breed platforms
- Van point-to-point tot ontkoppelde datatoegang
- Van een enterprise datawarehouse tot domeingebaseerde architectuur
- Van rigide datamodellen naar flexibele, uitbreidbare dataschema’s
Elk van deze trends benadrukt wat we in de trefwoorden zouden vangen: openheid, flexibiliteit, innovatie en snelheid. Terwijl we steeds meer data verzamelen en naar antwoorden zoeken in deze ‘datatsunami’, hebben we robuuste maar toch aanpasbare architecturen nodig om aan onze snel toenemende eisen te voldoen. Kies verstandig – maar neem vooral weloverwogen beslissingen op basis van een datastrategie. Geen idee waar we het over hebben? Bel of mail ons gerust, dan hebben we een eerste (gratis) gesprek om te kijken of we u van dienst kunnen zijn.