Cursus

Data mining & predictive modeling

Fundamentele concepten voor het begrijpen en succesvol toepassen van data mining methoden

Het wordt steeds eenvoudiger en gebruikelijker om grote hoeveelheden gegevens te verzamelen en op te slaan. Dit geldt bijvoorbeeld voor consumentengegevens, voor gegevens over individueel gedrag, voor garantie- en storingsdata en voor productieprocessen waarbij sensoren op grote schaal data loggen.

Met behulp van data mining is het mogelijk om in dergelijke grote hoeveelheden gegevens verbanden en structuren te ontdekken en voorspelmodellen te ontwikkelen. Technieken uit de toegepaste statistiek, de kunstmatige intelligentie en de machine learning worden daarbij ingezet.

In deze cursus leer je fundamentele concepten voor het begrijpen en toepassen van data mining methoden. Tijdens de cursus doe je ervaring op in het visueel programmeren van data workflows, waarmee model-fit, -validatie en -optimalisatie eenvoudig in de praktijk uit te voeren zijn.

Data mining methoden & business analytics succesvol toepassen

Na afloop van deze cursus:

  • Heb je een overzicht over actuele methoden voor predictive modeling, zoals die beschikbaar zijn binnen de gebieden van statistiek, kunstmatige intelligentie en machine learning.
  • Kun je zelf, in standaard situaties, dergelijke modellen ontwikkelen, daarbij gebruik makend van software, zoals bijvoorbeeld IBM-Modeler, SAS-Enterprise Guide en Enterprise Miner of Orange om data workflows visueel te programmeren.
  • Heb je praktische ervaring opgedaan met het valideren, interpreteren en vergelijken van alternatieve modellen en het gebruik ervan bij beslissingsondersteuningen.

Bedoeld voor

Academici en hbo’ers die in  hun werk geconfronteerd worden met data mining vraagstukken en de analyse van omvangrijke databestanden. De cursus is ook geschikt voor docenten van universiteiten en hogescholen die kennis willen nemen van actuele methoden op het gebied van data mining.

Het gevolgd hebben van een specifieke studierichting is niet vereist. Kennis van statistische basistechnieken zoals toetsen, schatten en regressiemodellering is wenselijk.

In overleg met de deelnemers kan deze cursus in het Nederlands of Engels worden gehouden. 

De technieken die tijdens de cursus gedemonstreerd worden met de Python gebaseerde visuele programmeeromgeving Orange, zijn ook in Python uit te voeren en leveren vergelijkbare resultaten op. Deelnemers ontvangen bestanden met voorbeelddata, zodat ze met hun favoriete software voor data analyse de resultaten kunnen reproduceren. Wil je Python gaan gebruiken of meer mogelijkheden van Python ontdekken? Bekijk onze cursus Python voor ingenieurs.

Benieuwd naar de achtergrond van de cursusleider en zijn kijk op het belang van data in de wereld van techniek? Lees het interview met Koo Rijpkema!  Of wil je meer weten over de gebruikerservaringen bij een incompany uitvoering van deze cursus? Lees dan het interview met Hendrik-Jan de Kort (SPIE)

Bekijk ook het overzicht van alle data-analyse en statistiek cursussen

Deel deze pagina

  • Informatie
    Cursusleider(s): Dhr. Dr. J.J.M. Rijpkema (Technische Universiteit Eindhoven (TU/e))
    Cursusdata: 8, 15, 22 en 29 maart 2023
    Dagindeling: 9:00-17:00
    Locatie: Aristo Utrecht
    Prijs: € 1.995,00 excl. btw
    Taal
    Dit programma kan op verzoek in het Engels worden gegeven.
  • Programma

    Dag 1 - 8 Maart 2023

    • Inleiding tot cursus, software, voorbeelden en casestudies
    • Principes in predictive analytics:
      • Data pre-processing, data exploratie & data reductie
      • Overfitting en modeltuning
    • Resampling-methoden en regularisatie
       

    Dag 2 - 15 Maart 2023

    • Basisprincipes van voorspellingsmethoden:
      • Overzicht van veelgebruikte voorspellingsmethoden, zoals lineaire regressie, neurale netwerken, desion trees, random forests, support vector machines en nearest neighbour algoritmen
    • Selectie, validatie en gebruik van voorspellingsmodellen in de praktijk
       

    Dag 3 - 22 Maart 2023

    • Basisprincipes van classificatie methoden:
      • Overzicht van veelgebruikte classificatiemethoden, zoals logistische regressie, neurale netwerken, decision trees, random forests, support vector machines en nearest neighbour algoritmes
    • Selectie, validatie en gebruik van classificatiemodellen in de praktijk
       

    Dag 4 - 29 Maart 2023

    • Basisprincipes van cluster- en segmentatiemodellen:
      • Overzicht van veelgebruikte cluster- en segmentatiemethodes, zoals hiërarchische, k-Means en Louvain clustering
      • Selectie, validatie en gebruik van cluster- en segmentatiemodellen in de praktijk
    • Epiloog: overzicht, trends en volgende stappen
  • Reviews
    Deze cursus wordt beoordeeld met een 8,3
    “Met deze cursus snap je beter wat je met data mining doet: de basis om het verantwoord toe te passen.”
    Max Welling (Welling IT Consultancy BV)
    “Zeer concrete cursus die veel moeilijkheden bij het beginnen met data mining kan voorkomen.”
    cursist van Sligro Food Group
    “Cursus heeft veel inzicht gegeven, maar was op sommige punten wel pittiger dan verwacht.”
    cursist van DAF Trucks NV
    “Goede kennismaking met de materie.”
    cursist van Ministerie van Defensie
    “Erg goede cursus, goed boek, goede uiteenzetting, goede aanvullende literatuur. Enthousiaste docent.”
    Coen Hoogervorst (Strukton Worksphere)
    “Goed overzicht van alle gerelateerde kennis. Goed extra lesmateriaal, erg leuke docent.”
    Yuzhong Lin (TU/e)
    “Goede cursus, uitstekende docent.”
    Peter van der Hagen (INFOTAM)
    “Hoge snelheid, goede inhoud.”
    Marc de Wolf (Effect Photonics)