Cursus

Practical data science with R

Statistiek voor big data & business intelligence

Als gevolg van de explosieve toename van data is het gebruik van statistische methoden sterk verbreed en zijn belang en betekenis van data science toegenomen. Niet alleen in het laboratorium en de industrie maar bijvoorbeeld ook in marketing en business intelligence.

Deze cursus biedt voor dergelijke toepassingen de essentiële inzichten in statistische concepten en vaardigheden om verantwoord aan de slag te gaan met technieken voor data-analyse. Je leert statistisch correct te werken en weet datasets op de juiste wijze te interpreteren.

De cursus start met een herhaling van basis principes uit de vakgebieden statistiek en kansrekening. Dit geeft een goed uitgangspunt voor de data-analyse-methoden binnen de belangrijke vakgebieden data mining (big data) en time series analysis. Ook doe je ervaring op in het doelmatig werken met de statistische software R.

Verantwoord aan de slag met data science

De cursus bestaat uit drie onderdelen:

  1. Statistiek en toegepaste kansrekening
    Bedoeld als opfriscursus voor de principes en technieken die worden gebruikt binnen de toegepaste kansrekening en statistiek voor de analyse en modellering van gegevens.
  2. Data mining in een notendop
    Biedt een inleiding en overzicht van veelgebruikte methoden op het gebied van predictive analytics om voorspellingen en classificaties te genereren op basis van adequate modellen en om patronen in grote gegevenssets te herkennen.
  3. Tijdreeks (time series) analyse in een notendop
    Behandelt methoden voor het modelleren van tijdsafhankelijke gegevens en voor het maken van voorspellingen voor de toekomst op basis van deze modellen.


Deze cursus geeft je ook een sterke basis voor de specialistische vervolgcursussen op het gebied van statistiek zoals Data mining & business analytics en Time series analysis and forecasting.

Bedoeld voor

Academici en hbo’ers die in hun werk gebruik (willen gaan) maken van moderne toegepaste statistische technieken en zich de bijbehorende vaardigheden eigen willen maken. De cursus is ook geschikt voor docenten van universiteiten en hogescholen die kennis willen nemen van actuele methoden op het gebied van data-analyse en data science.

Je hebt wiskunde op vwo-niveau. Enige kennis op statistisch gebied is wenselijk.

In overleg met de deelnemers kan deze cursus in het Nederlands of Engels worden gehouden. Voorbeelden zijn in R.

De technieken die tijdens de cursus gedemonstreerd worden met R, zijn ook in Python uit te voeren en leveren vergelijkbare resultaten op. Deelnemers ontvangen bestanden met voorbeelddata, zodat ze met hun favoriete software voor data analyse de resultaten kunnen reproduceren. Het is mogelijk om R vanuit Python en Python vanuit R te gebruiken en zo de voordelen van elk te combineren. Wil je Python gaan gebruiken of meer mogelijkheden van Python ontdekken? Bekijk onze cursus Python voor ingenieurs

Bekijk ook het overzicht van alle data-analyse en statistiek cursussen.

Interesse in aanpalende cursussen? Kijk ook eens naar de cursus Data mining & predictive modelingMultivariate data analysisTime series analysis and forecasting, Python voor ingenieursDesign of Experiments (InCompany training) en Essentials of predictive analytics (InCompany training).    

Benieuwd naar de achtergrond van cursusleider Koo Rijpkema en zijn kijk op het belang van data in de wereld van techniek? Lees het interview!

Deel deze pagina

  • Informatie
    Cursusleider(s): Dhr. Dr. J.J.M. Rijpkema (Technische Universiteit Eindhoven (TU/e))
    Cursusdata: 20, 27 november en 4, 11 december 2023
    Dagindeling: 9:00-17:00
    Locatie: Aristo Utrecht
    Prijs: € 1.995,00 excl. btw
    Taal
    Dit programma kan op verzoek in het Engels worden gegeven.
  • Programma

    Dag 1 - Statistiek en toegepaste kansrekening, inclusief een introductie tot het softwareprogramma R

    • Inleiding en overzicht van de cursus en de te gebruiken software R
    • Exploratieve data analyse
    • Inleiding kansen, kansrekening en kansverdelingen
    • Oefeningen explorative data analyse en kansrekening
    • Statistisch testen en schatten in een notendop
    • Selectie, validatie en gebruik van kansverdelingen in de praktijk
    • Oefeningen kansverdelingen en principes van toetsen/schatten

    Dag 2 - Data mining in een notendop

    • Voorspelmodellen op basis van regressie methoden
    • Selectie, validatie en gebruik van regressie modellen in de praktijk
    • Oefeningen regressie modellen
    • Classificatiemodellen op basis van logistische regressie methoden
    • Selectie, validatie en gebruik van logistische regressie modellen in de praktijk
    • Oefeningen logistische regressie modellen
    • Alternatieve methoden voor voorspellen en classificeren
    • Selectie, validatie en gebruik van voorspel- en classificatiemodellen in de praktijk
    • Cluster analyse
    • Oefeningen voorspellen, classificeren en cluster-analyse

    Dag 3 - Time series analysis in een notendop

    • Inleiding, karakterisering en exploratieve analyse van tijdreeksdata
    • Tijdreeksmodellen op basis van exponential smoothing
    • Selectie, validatie en gebruik van exponential smoothing modellen in de praktijk
    • Oefeningen exponential smoothing modellen
    • Box-Jenkins modellen voor tijdreeksdata
    • Selectie, validatie en gebruik van Box-Jenkins modellen in de praktijk
    • Oefeningen Box-Jenkins modellen
  • Reviews
    Deze cursus wordt beoordeeld met een 8,5
    “Goede start om R te gaan gebruiken. Je krijgt echt instrumenten in handen om data te analyseren.”
    cursist van Royal HaskoningDHV
    “Prima cursus, voldoet aan alle verwachtingen.”
    cursist van NXP Semiconductors BV Nijmegen
    “Erg informatief en toepasbaar.”
    cursist van Albemarle Catalysts BV
    “Zeer informatief: goed startpunt voor het gebruiken van R.”
    cursist van Albemarle Catalysts BV
    “Zeer interessant. Ondanks de moeilijkheidsgraad een goede start om in de praktijk mee door te gaan.”
    cursist van Abbott
    “Inzichtvol in de basis (wel/niet verwerpen hypothese), inhoudelijk goed de diepte in (lineaire/logistische regressie) en verbredend met een doorkijk naar verschillende naastgelegen toepassingsvelden. Verder heel veel mogelijke achtergrond als je op een bepaald onderdeel verder zou willen.”
    Jos de Greef - Witteveen+Bos Raadgevende Ingenieurs B.V.