Cursus

Practical data science

Statistiek voor Big Data & Business Intelligence (with R)

In deze vierdaagse cursus staat inzicht in de statistische concepten en vaardigheid in het omgaan met de bijbehorende technieken centraal. Je leert statistisch correct en verantwoord werken en weet datasets op de juiste wijze te interpreteren. Essentiele kennis voor iedere business analist en organisatie die aan de slag wil met Big Data.

'Practical data science' start met een korte herhaling van de kennisbasis van de vakgebieden statistiek en kansrekening. Dit geeft een goed uitgangspunt voor de data-analyse-methoden binnen de belangrijke vakgebieden Data Mining (Big Data) en Time Series Analysis. Ook maak je kennis met het snel opkomende softwarepakket R. Tijdens de cursus leer je hier doelmatig mee te werken.

Verantwoord aan de slag met analyse van data

De cursus 'Praktische Data Science met R' bestaat uit drie modules:

  1. Statistiek en toegepaste kansberekening
    bedoeld als opfriscursus voor de principes en technieken die worden gebruikt binnen de toegepaste kansberekening en statistieken voor de analyse en modellering van gegevens.
  2. Data Mining in een notendop
    biedt een inleiding en overzicht van veelgebruikte methoden op het gebied van Predictive Analytics om voorspellingen en classificaties te genereren op basis van adequate modellen en om patronen in grote gegevenssets te herkennen.
  3. Tijdreeksanalyse in een notendop
    behandelt methoden voor het modelleren van tijdsafhankelijke gegevens en voor het maken van voorspellingen voor de toekomst op basis van deze modellen.


Als gevolg van de explosieve toename van data is het gebruik van statistische methoden sterk verbreed en zijn belang en betekenis toegenomen. Naast de klassieke toepassingen in het laboratorium en de bewaking van de kwaliteit van producten in de industrie heeft de statistiek inmiddels ook toepassing gevonden in vakgebieden als marketing en business intelligence. Deze cursus biedt voor alle toepassingen de essentiele inzichten en vaardigheden om verantwoord aan de slag te gaan met analyse van data.

Deze cursus geeft je ook een sterke basis voor de specialistische vervolgcursussen op het gebied van statistiek: zoals Data Mining & Business Analytics en Time series analysis.

Bedoeld voor

Deze cursus is bestemd voor academici en HBO-ers die in hun werk gebruik (willen gaan) maken van moderne toegepaste statistische technieken en zich de bijbehorende vaardigheden - weer - eigen willen maken, en daarnaast kennis willen maken met de nieuwste statistische freeware R. Je hebt wiskunde op VWO-niveau. Enige kennis op statistisch gebied is wenselijk.

Op verzoek van de deelnemers kan deze cursus in het Nederlands of Engels worden gehouden.

Cursusmateriaal:

Aan het begin van de cursus wordt een manual verstrekt. Daarin staat ook aanvullende informatie over de gebruikte software: R en R Commander. Deelnemers worden uitgenodigd om hun eigen laptop mee te nemen tijdens de cursus, met de software R en R Commander erop geïnstalleerd.

Deel deze pagina

  • Programma

    I Statistiek en toegepaste kansberekening, inclusief een introductie tot het softwareprogramma R

    • Inleiding en overzicht van de cursus en de te gebruiken software R
    • Exploratieve data analyse
    • Inleiding kansen, kansrekening en kansverdelingen
    • Statistisch testen en schatting
    • Selectie, validatie en gebruik van kansverdelingen in de praktijk
    • Oefeningen kansverdelingen en principes van toetsen/schatten

    II Data Mining

    • Voorspelmodellen op basis van regressieve methoden
    • Selectie, validatie en gebruik van regressie modellen in de praktijk met oefening
    • Classificatiemodellen op basis van logistische regressie methoden
    • Selectie, validatie en gebruik van logistische regressie modellen in de praktijk met oefening
    • Alternatieve methoden voor voorspellen en classificeren
    • Selectie, validatie en gebruik van voorspel en classificatiemodellen in de praktijk
    • Cluster analyse
    • Oefeningen voorspellen, classificeren en cluster-analyse

    Time Series Analysis

    • Inleiding, karakterisering en exploratieve analyse van tijdreeksdata
    • Tijdreeksmodellen op basis van exponential smoothing
    • Selectie, validatie en gebruik van exponential smoothing modellen in de praktijk met oefening
    • Box-Jenkins modellen voor tijdreeksdata
    • Selectie, validatie en gebruik van Box-Jenkins modellen in de praktijk
    • Oefeningen Box-Jenkins modellen
  • Reviews
    Deze cursus wordt beoordeeld met een 8,4
    “Goede start om R te gaan gebruiken. Je krijgt echt instrumenten in handen om data te analyseren.”
    cursist van Royal HaskoningDHV
    “Prima cursus, voldoet aan alle verwachtingen.”
    cursist van NXP Semiconductors BV Nijmegen
    “Erg informatief en toepasbaar.”
    cursist van Albemarle Catalysts BV
    “Zeer informatief: goed startpunt voor het gebruiken van R.”
    cursist van Albemarle Catalysts BV