In 2023 was AI op zijn zachtst gezegd een hot topic, voornamelijk vanwege de explosieve groei van generatieve AI-tools. Bedrijven staan dan ook onder toenemende druk van hun directies om AI succesvol te implementeren en zo een voorsprong te krijgen op hun concurrenten. Maar hoewel AI zich op snel tempo ontwikkelt, moet het implementeren ervan worden gezien als een marathon, en niet als een sprint.
Waarom? In al die AI-hectiek komen diepere problemen met de data-infrastructuur van organisaties aan het licht, waardoor AI-projecten mislukken. In S&P Global’s 2023 Global Trends in AI report was datamanagement het meest genoemde technologische obstakel voor AI/ML-implementaties, voor beveiliging en computerprestaties.
In plaats van het doorgaan met de ene na de andere AI-implementatie die mislukt, moeten bedrijven de balans opmaken en in plaats daarvan hun aandacht richten op data-intelligentie en ‘AI readiness’. In essentie moeten organisaties zich realiseren wat de datakwaliteit, governance, toegang en opslagvereisten zijn voor AI. Pas daarna kunnen ze gaan nadenken over digitale transformatie- of verbeterprogramma’s.
Data is de essentie van AI
Verbazingwekkend genoeg aarzelen veel bedrijven over hun gegevens en slaan ze aanzienlijke hoeveelheden op. Simpelweg omdat ze niet begrijpen hoe ze deze moeten gebruiken of dat ze deze daadwerkelijk nodig hebben. En deze zelfde gegevens worden gebruikt om AI-modellen te trainen.
Als organisaties niet weten of hun data accuraat en up-to-date is, on-demand beschikbaar of gearchiveerd, correct geclassificeerd en ‘doorzoekbaar’, compliant en of ze gevoelige informatie bevatten zoals persoonlijk identificeerbare informatie (PII) of beschermde gezondheidsinformatie (PHI), hoe kunnen we dan verwachten dat we er een slim en capabel AI-model mee kunnen trainen en tegelijkertijd compliant kunnen blijven?
Zichtbaarheid in organisatiegegevens is dus een cruciale en vaak over het hoofd geziene eerste stap op weg naar een succesvol gebruik van AI. De sleutel hiertoe is om de inspanningen te richten op data-intelligentie, met de ondersteuning van een hybride cloudplatform.
Waarom AI leunt op data-intelligentie
Bij data-intelligentie gaat het om inzicht in de gegevens die een bedrijf heeft en inzicht in de manier waarop deze gebruikt kunnen worden. IDC definieerde zes fundamentele vragen die organisaties kunnen beantwoorden door middel van data-intelligentie:
- Wie gebruikt welke data?
- Waar is de data nu en waar komt het vandaan (afkomst en herkomst)?
- Wanneer wordt data opgevraagd en wanneer is het voor het laatst bijgewerkt?
- Waarom hebben de data? Waarom moeten we data bewaren (of weggooien)?
- Hoe wordt data gebruikt, of misschien specifieker: hoe zou de data gebruikt moeten worden?
- Relaties – welke relaties zijn inherent aan data en met datagebruikers?
Het identificeren van de antwoorden op deze vragen is cruciaal voor het verbeteren van de besluitvorming en voor succesvolle technologie-implementaties, vooral met AI: data-intelligentie en AI gaan hand in hand.
Waarom? We kunnen AI alleen beheersen en volledig benutten door de informatie die we het geven. Daarom willen we irrelevante, oude, dubbele of gevoelige informatie vermijden. Dit soort gegevens zal niet alleen het potentieel van AI verstoren, maar kan ook leiden tot het delen van kritieke bedrijfsinformatie met de verkeerde mensen. AI weet niet of het de CEO is of een breder teamlid die een vraag stelt; het kent alleen de data die het heeft gekregen.
Alleen door de data in een bedrijf goed en intelligent te beheren en precies te weten welke data inzichten kan opleveren, wat nodig is voor compliance en welke data je kunt schrappen, zullen organisaties echt klaar zijn om hun data in handen te geven van een AI-systeem.
Slimmere data maakt AI ook milieuvriendelijker
Naast de uitdaging om AI succesvol te implementeren, is het ook nog zo dat de groeiende energie- en computervereisten voor AI-systemen gevolgen hebben voor het milieu. De middelen die nodig zijn om grote AI-modellen te draaien, zorgen namelijk voor een aanzienlijke toename van het stroomverbruik en daarmee van de CO2-voetafdruk van bedrijven en datacenters.
Data-intelligentie kan helpen om dit in evenwicht te brengen. Naarmate bedrijven hun datasets verfijnen door consolidatie- en opschoningsprocessen, zullen ze de oude en dubbele data die in AI-modellen wordt ingevoerd verminderen, en een beter inzicht krijgen in hun eigen data en hoe AI deze kan gebruiken.
Verfijnde, rijke datasets kunnen kleinere, slimmere AI-modellen voeden die minder stroom nodig hebben. Deze beter getrainde modellen zullen ook beter presteren dan de grotere modellen die gebaseerd zijn op ruwe rekenkracht.
Slagen of falen met AI: je data op orde krijgen is de sleutel
AI bestaat niet in een vacuüm. Het moet worden gebruikt als onderdeel van de bredere paraplu van data-intelligentie. Hoewel dataprojecten voor verkoop, klantenservice en soortgelijke laaghangende initiatieven al door veel bedrijven in gang zijn gezet door de implementatie van data analytics, machine learning en AI, ontstaat er vaak een knelpunt wanneer wordt geprobeerd dezelfde technologie te integreren in meer geavanceerde, hoogwaardige toepassingen.
Door middelen in te zetten voor betere data-intelligentie kunnen bedrijven eindelijk de kracht van AI benutten voor deze belangrijke initiatieven. Dit betekent dat bedrijven hun onsamenhangende datasets kunnen omvormen naar één enkele bron van de waarheid, en dat zorgt weer voor meer innovatiemogelijkheden en een beter reactievermogen naar klanten toe. Door deze technologieën op een duurzame manier te implementeren, zowel wat betreft snelheid als de impact op het milieu, kunnen bedrijven het concurrentievoordeel leveren dat IT-managers uit AI willen halen.
Arjo de Bruin is solutions architect, Benelux & Nordics bij Nasuni