Op weg naar een door data gedreven Europese economie
European Data Forum
Op het European Data Forum, dat op 29 en 30 juni werd georganiseerd in het Evoluon in Eindhoven, vertelden bedrijven en organisaties hoe ze big data inzetten om hun diensten te verbeteren. Hoofdorganisator van het European Data Forum was het aan de TU Eindhoven verbonden Data Science Centrum Eindhoven. Wetenschappelijk directeur van der Aalst, eveneens hoogleraar Information Systems aan de Technische Universiteit Eindhoven, blikt terug op een succesvol congres. ‘De opkomst was enorm en de presentaties waren inspirerend.’ Namens CBS verzorgde Barteld Braaksma, samen met Albrecht Wirthmann van het Europese statistiekbureau Eurostat, een presentatie over mogelijkheden voor gebruik van big data in de officiële statistiek. Dat was op uitnodiging van medeorganisator DG Connect, het directoraat van de Europese Commissie dat zich sterk maakt voor het bevorderen van een bloeiende data gedreven economie in Europa.
Grenzen van de rekenkracht
Een van de andere sprekers op het congres was bestuursvoorzitter Frans van Houten van Philips. Van der Aalst: ‘Hij vertelde hoe zijn bedrijf zich transformeert van een apparatenverkoper naar een databedrijf op het gebied van gezondheid. Philips brengt veel apparaten op de markt die zijn verbonden met het internet. Innovatief voorbeeld is de ontwikkeling van een tandenborstel met sensoren, die kanker kunnen detecteren. Anders Arpteg van muziekstreamingdienst Spotify vertelde hoe zijn bedrijf het luistergedrag van honderden miljoenen gebruikers analyseert en de grenzen van de rekenkracht opzoekt. En Jacob van den Borne van Van den Borne Precision legde uit hoe data worden gebruikt bij het verbouwen van aardappelen en de bestrijding van ziekten.’
Nieuwe technologie
Uit de highlights van Van der Aalst blijkt dat big data wordt ingezet in vele geledingen van de economie. ‘Je ziet dat bedrijven het steeds sneller oppakken en het toepassen op veel gebieden. Kijk naar een nieuwe technologie als process mining, dat zich richt op het verbeteren van bedrijfsprocessen door de inzet van big data. Binnen Siemens Duitsland gebruiken meer dan tweeduizend mensen regelmatig process mining software om knelpunten binnen het bedrijf te analyseren. Big data wordt zó belangrijk dat organisaties die er geen gebruik van maken, zullen ophouden te bestaan.’
Data science bacheloropleiding
Van der Aalst geldt als een autoriteit op het gebied van data science en is Europa’s meest geciteerde informaticus. Zijn Data Science Centrum Eindhoven, waar 400 wetenschappers zijn aangesloten, ontplooit data science initiatieven binnen de TU Eindhoven. Samen met de Universiteit Tilburg biedt de TU Eindhoven als eerste in Nederland een data science bacheloropleiding. Ook lopen er sinds vorig jaar al twee masteropleidingen op het gebied van data science. Specialiteit van Van der Aalst is process mining. Het Data Science Centrum Eindhoven is wereldleider op dit gebied.
‘Gelukkig zien we, zowel landelijk en in sterkere mate in Eindhoven, een spectaculaire stijging van het aantal studenten informatica en wiskunde’
Process mining
‘Process mining kan overal worden toegepast’, aldus Van der Aalst. ‘Neem de afhandeling van bagage op luchthavens. Door het volgen van alle koffers creëer je een enorme hoeveelheid data. Door vervolgens die data te analyseren en knelpunten op te sporen kun je het afhandelingssysteem verbeteren. Op vergelijkbare manier kun je process mining inzetten voor de verkorting van wachttijden in ziekenhuizen. Process mining zal zich in korte tijd ontwikkelen tot een basistechnologie. In de afgelopen vijf jaar zijn er meer dan 20 commerciële process mining tools op markt gekomen gebaseerd op onze ideeën.’ Ook CBS werkt sinds twee jaar met delen van de process mining techniek van het Data Science Centrum Eindhoven. CBS gebruikt de techniek als onderdeel van een grootschalig Lean Six Sigma programma. Analyse van informatie uit interne statistiekproductieprocessen levert onverwachte inzichten in knelpunten aan de betrokken medewerkers en zet ze op het spoor van efficiencyverbetering. In hoeverre process mining in belang zal toenemen voor CBS is afhankelijk van de ontwikkeling van het statistiekbureau, zegt Van der Aalst. ‘Ik ken CBS voornamelijk als leverancier van globale vaak geaggregeerde statistische data. Process mining wordt pas relevant als je meer fijnmazig en in detail het gedrag van de bevolking of organisaties gaat analyseren.’
Wereldwijde concurrentie
Met het oog op de snelle ontwikkeling van big data en de toepassing daarvan dringt zich de vraag op of statistiekbureaus en universiteiten voldoende zijn voorbereid om op dit gebied bij te dragen aan de oplossing van economische en maatschappelijke vraagstukken van de 21e eeuw. ‘Onvoldoende’, luidt het resolute antwoord van Van der Aalst. ‘Dat komt omdat er niet genoeg wordt geïnvesteerd in de kerndisciplines van data science: onderzoek naar databases, statistiek, data mining, machine learning en visualisatie. Er gaat wel relatief veel geld naar toepassingsgebieden. Het gaat dan vaak om ad hoc vragen. Dat is op zich prima, maar daarbij moet het échte data science onderzoek niet uit het oog worden verloren. Er is op dit gebied sprake van wereldwijde concurrentie. Willen wij iets voorstellen dan moeten we in actie komen. Anders zal veel op het gebied van data science door de VS worden uitgevoerd. Daar is funding, zowel vanuit de overheid als vanuit het bedrijfsleven, beter geregeld. Kijk naar Google. Dat is ontstaan als een onderzoeksproject van Larry Page and Sergey Brin, die beiden als PhD werkten aan Stanford University.’
Schreeuwend tekort
Eén van de terugkerende thema’s op het gebied van data science is het schreeuwend tekort aan specialisten en het gevecht om deze talenten. ‘Gelukkig zien we, zowel landelijk en in sterkere mate hier in Eindhoven, een spectaculaire stijging van het aantal studenten informatica en wiskunde. Jongeren zien het belang van de vakgebieden in en dat is een positieve ontwikkeling.’ Daarnaast merkt Van der Aalst, die eveneens nauw betrokken is bij de Nationale Wetenschapsagenda, dat ook burgers zich steeds meer bewust worden van het belang van big data. ‘Zij zien in dat big data dé grote ontwikkeling van dit moment is. Mijn grote hoop is dan ook dat die aandacht zal leiden tot een investeringsgroei in de kerndisciplines van data science.’
Curriculum vitae Wil van der Aalst
Prof. dr. ir. Wil van der Aalst is voltijd hoogleraar Information Systems aan de Technische Universiteit Eindhoven. Daarnaast is hij wetenschappelijk directeur van het Data Science Center Eindhoven. Sinds 2003 heeft Van der Aalst een deeltijd aanstelling aan Queensland University of Technology. Zijn interesses gaan uit naar onder meer workflow management, process mining, businessprocess management en simulatie. Van der Aalst heeft meer dan 600 artikelen gepubliceerd en heeft diverse invloedrijke boeken geschreven. Zijn ideeën hebben een grote invloed gehad op standaardisatieprocessen en commerciële softwareproducten.