Data-analyse en programmeren

Data-analyse optimaal inzetten voor jouw organisatie

Data is overal. De kunst is om daaruit belangrijke verbanden en trends te halen. Daarbij is het gebruik van statistische methoden de afgelopen jaren sterk verbreed en het belang in toepassing sterk toegenomen. Niet alleen in klassieke omgevingen zoals laboratoria en de industrie, maar in alle technische werkvelden. Expert Koo Rijpkema, senior lecturer toegepaste statistiek (TU/e) en PAOTM-cursusleider, weet als geen ander hoe belangrijk data-analyse is en hoe je het succesvol toepast. We spraken hem!

Waarom is data-analyse een onmisbare discipline in een technische omgeving?
Meten is weten” is het uitgangspunt. Het efficiënt opzetten van experimenten, beoordelen van de kwaliteit van de verkregen data en ontwikkelen van geschikte beslissingsondersteunende modellen heeft een belangrijke rol. Net als het doeltreffend rapporteren en communiceren van resultaten en conclusies. En het vinden van een weg in de veelheid aan automatisch gelogde data in industriële processen. Weliswaar zijn daarvoor tegenwoordig vele methoden en (software)tools voorhanden. Maar omdat deze voortdurend in ontwikkeling zijn, is het voor een verantwoord gebruik belangrijk overzicht en inzicht te hebben en te houden over de beschikbare mogelijkheden en de “do’s en don’ts”. Ook is het belangrijk om op data gebaseerde rapportages en adviezen kritisch op hun waarde te kunnen beoordelen.

Hoe snel gaan de ontwikkelingen in het vakgebied?
Snel! Public-domain beschikbare software voor data-analyse, zoals Python en R, kunnen direct inspelen op nieuwe mogelijkheden en trends. Bij R nadert het aantal beschikbare packages de 20.000, terwijl ook in Python het aantal packages gestaag toeneemt. Ook zijn er steeds meer initiatieven om de mogelijkheden van R en Python te koppelen en te komen tot een ‘best of both worlds’!

Kun je een voorbeeld geven van een technisch vakgebied waar data-analyse snel terrein wint?
Dat gebeurt in veel technische vakgebieden. Denk aan energie, de elektriciteitsvoorziening en ‘the smart grid’ en infrastructuur die in de toekomst nodig is voor het laden van elektrische voertuigen. In de waterhuishouding is er in de afgelopen jaren, bijvoorbeeld vanuit de waterschappen, veel belangstelling getoond voor voorspelmethoden om de gevolgen van klimaatveranderingen voor de risico’s van wateroverlast of droogte in kaart te brengen. PAOTM heeft er ook speciale cursussen aan gewijd! Verder kun je denken aan Autonoom rijdenModel predictive maintenance, de farmacie en High-Throughput Experimentation (HTE) in chemistry.

Wanneer data-analyse verkeerd wordt toegepast kan dit grote (maatschappelijke) gevolgen hebben. Hoe voorkom je dat?
Big data kan, indien verkeerd toegepast, een ravage aanrichten. De redenen kunnen van alles zijn, zoals gebrek aan tools, technische problemen, gegevens van lage kwaliteit, verkeerde of onnodige gegevens. Een van de bekendste big data-fouten was Google Flu Trends. Deze webservice moest griepuitbraken in zo’n 25 landen voorspellen. De logica was simpel: analyseer Google-zoekopdrachten over griep in een bepaalde regio. De uitkomsten bleken maar liefst 140 procent af te wijken van de realiteit! Het algoritme bleek gebrekkig en de zoektermen waren te breed gekozen. En wat als het gaat om gevoelige informatie? Dan zijn de gevolgen echt onacceptabel: bijvoorbeeld bij het targetten van een doelgroep waarbij privégegevens bekend worden (bv. de winkels Target en OfficeMax). En zo zijn er vele voorbeelden van verkeerd data-gebruik. Gelukkig zijn daarvoor remedies voorhanden. We besteden daar in de PAOTM-cursussen ruimschoots aandacht aan door niet alleen in te gaan op de methoden en technieken, maar ook op context, gebruik en toepassing.

Zijn de cursussen alleen voor data-analisten? Of kun je als manager ook leren hoe je data leest en interpreteert?
Er zijn niet alleen cursussen voor specialisten, die bijvoorbeeld zelf data-analyse-projecten uitvoeren, maar ook voor generalisten die dergelijke projecten managen of op basis van rapportages verantwoorde beslissingen willen vormen. Met name de cursussen Practical Data Science en Essentials of Predictive Analytics lenen zich hier uitstekend voor, omdat interpretatie en onderbouwing van de gevonden conclusies een centrale plaats inneemt! Ook slaan ze een brug tussen de meer klassieke statistische data analyse en het moderne data science vakgebied.

Nieuwsgierig geworden?
PAO Techniek en Management biedt een reeks cursussen waarin je brede statistische basiskennis opdoet of waarbij je, in de meer specialistische cursussen, voor verdere verdieping kunt kiezen. Ongeacht in welk (technisch) werkveld je ook actief bent. Koo brengt je in enkele dagen volledig op de hoogte. In alle cursussen leer je te werken met representatieve public domain beschikbare software, zoals R of Python, en kun je eigen cases inbrengen.

Cursusleider

Data-analyse en programmeren

dr. Koo Rijpkema

Technische Universiteit Eindhoven (TU/e)

“Lesgeven staat voor mij voor het delen van kennis en passie, mensen inspireren en fascineren door de toepassing van statistiek.”

Download de studiegids

Wil je graag een compleet overzicht van al onze cursussen en opleidingen? Download dan de digitale studiegids!

Gerelateerde cursussen