Cursus

Practical data science

Statistiek voor Big Data & Business Intelligence (with R)

Als gevolg van de explosieve toename van (de snelle beschikbaarheid van) data is het gebruik van statistische methoden sterk verbreed en zijn belang en betekenis toegenomen. Naast de klassieke toepassingen in bijv. het laboratorium en de bewaking van de kwaliteit van producten in de industrie heeft de statistiek inmiddels ook toepassing gevonden in vakgebieden als Marketing of Business Intelligence. Begrippen als Big Data en Data Science zijn ook bij het brede publiek bekend geworden. In de media worden bijv. de voordelen als nuttig gebruik bij medische diagnostiek en onderzoek genoemd. Maar ook wordt gewezen op gevaren als verlies van privacy en de macht die grote hoeveelheden informatie commerciele bedrijven of overheidsinstanties verschaffen.

De cursus start met een korte herhaling van de kennisbasis van de vakgebieden statistiek en kansrekening. Dit geeft u een goed uitgangspunt voor de data-analyse-methoden binnen de momenteel belangrijke vakgebieden Data Mining (Big Data) en Time Series Analysis. Ook maakt u kennis met het snel opkomende softwarepakket R (in tegenstelling tot bijv. SPSS gaat het hier om freeware) en leert u tijdens deze cursus daarmee direct hands-on werken.

Onderdelen van de cursus zijn:

  • Analysis; Data Analyse, Kansrekening en inleiding R
  • Data Mining in a Nutshell
  • Time Series Analysis in a Nutshell

Deze cursus geeft u dan ook een sterke basis om onze specialistische vervolgcursussen op het gebied van statistiek succesvol te kunnen volgen. Wij bieden diverse vervolgcursussen aan, als bijv. Data Mining, Mulitvariate Data Analyse of Time Series Analysis.

In de cursus staat het verkrijgen van inzicht in de statistische concepten en vaardigheid in het omgaan met de bijbehorende technieken centraal. U leert dan ook statistisch correct en verantwoord werken met welke statistisch softwarepakket dan ook en weet datasets op de juiste wijze te interpreteren.

Bedoeld voor

Deze cursus is bestemd voor academici en HBO-ers die in hun werk gebruik (willen gaan) maken van moderne toegepaste statistische technieken en zich de bijbehorende vaardigheden - weer - eigen willen maken, en daarnaast kennis willen maken met de nieuwste statistische freeware R. 
U heeft wiskunde op VWO-niveau. Enige kennis op statistisch gebied is wenselijk.

Resultaat

De cursus geeft u inzicht en operationele vaardigheid in het gebruik van statistische technieken voor het verwerken en analyseren van gegevens. Na afloop van de cursus bent u staat de behandelde technieken zelfstandig in uw eigen werkomgeving toe te passen en daarbij op een verantwoorde manier gebruik te maken van relevante statistische software. 

Deel deze pagina

  • Informatie
    Cursusleider(s): Dhr. Dr. J.J.M. Rijpkema (Technische Universiteit Eindhoven (TU/e))
    Cursusdata: 6, 11, 13 en 18 april 2018
    Locatie: Eindhoven
    Op of in de nabijheid van het terrein van de Technische Universiteit, op loopafstand station CS
    Prijs: € 2.250,00 excl. btw
    In samenwerking met: TU/e faculteit Wiskunde & Informatica
  • Programma

    I Applied Probability and Statistics Revisited, including an introduction to the freeware R

    •  Inleiding en overzicht van de cursus en de te gebruiken software R
    •  Exploratieve data analyse
    •  Inleiding kansen, kansrekening en kansverdelingen
    •  Statistical testing and estimation in a nutshell
    •  Selectie, validatie en gebruik van kansverdelingen in de praktijk
    •  Oefeningen kansverdelingen en principes van toetsen/schatten

    II Data Mining in a Nutshell

    •  Voorspelmodellen op basis van regressieve methoden
    •  Selectie, validatie en gebruik van regressie modellen in de praktijk met oefening
    •  Classificatiemodellen op basis van logistische regressie methoden
    •  Selectie, validatie en gebruik van logistische regressie modellen in de praktijk met oefening
    •  Alternatieve methoden voor voorspellen en classificeren
    •  Selectie, validatie en gebruik van voorspel en classificatiemodellen in de praktijk
    •  Cluster analyse
    •  Oefeningen voorspellen, classificeren en cluster-analyse

    III Time Series Analysis in a Nutshell

    •  Inleiding, karakterisering en exploratieve analyse van tijdreeksdata
    •  Tijdreeksmodellen op basis van exponential smoothing
    •  Selectie, validatie en gebruik van exponential smoothing modellen in de praktijk met oefening
    •  Box-Jenkins modellen voor tijdreeksdata
    •  Selectie, validatie en gebruik van Box-Jenkins modellen in de praktijk
    •  Oefeningen Box-Jenkins modellen
  • Reviews
    Deze cursus wordt beoordeeld met een 8,3
    “Goede start om R te gaan gebruiken. Je krijgt echt instrumenten in handen om data te analyseren.”
    cursist van Royal HaskoningDHV
    “Prima cursus, voldoet aan alle verwachtingen.”
    cursist van NXP Semiconductors BV Nijmegen
    “Erg informatief en toepasbaar.”
    cursist van Albemarle Catalysts BV
    “Zeer informatief: goed startpunt voor het gebruiken van R.”
    cursist van Albemarle Catalysts BV