Data-analyse en programmeren

Hoe Orange data science begrijpelijk maakt

Data-analyse, machine learning en kunstmatige intelligentie worden vaak gezien als domeinen voor specialisten. Maar met de juiste tools kan vrijwel iedereen ermee aan de slag, ook zonder programmeerkennis. Een goede tool die je daarvoor kunt gebruiken is Orange, een visueel en intuïtief open source softwareprogramma dat door cursusleider en data-expert Koo Rijpkema al jaren met succes wordt ingezet in data science-onderwijs. “Ik vergelijk Orange vaak met Lego. Je bouwt een analyse op uit basiscomponenten en ziet direct wat er gebeurt.” We spraken Koo over de voordelen en het gebruiksgemak van Orange en hoe hij zijn cursisten op weg helpt om de tool in hun dagelijkse praktijk te gebruiken.

Orange is een open-source analysetool die draait op Python, maar zonder dat je zelf een regel code hoeft te schrijven. Gebruikers bouwen hun workflow door visuele elementen – zogenaamde ‘widgets’ – aan elkaar te koppelen. “Je sleept de onderdelen in beeld, verbindt ze, past een paar parameters aan, en je ziet meteen het effect op je data of model,” legt Koo uit. Deze manier van werken biedt snelheid en overzicht. “Het is niet alleen handig, het helpt mensen ook om beter te begrijpen waarom een model iets doet. Dat inzicht krijg je veel moeilijker als je eerst tijdenlang moet programmeren.”

Cursussen met impact
Koo gebruikt Orange onder andere in de cursussen Essentials of Predictive Analytics en Practical Data Science. Die geeft hij zowel via open inschrijving en recent ook als incompany bij onder meer SPIE, Witteveen+Bos en Endress+Hauser. “Voor bedrijven is het ideaal om deelnemers snel op weg te helpen met datagedreven werken. Binnen tien minuten hebben ze hun eerste model draaien.”

Orange blijkt in die context ook bijzonder geschikt voor prototyping: het verkennen van verschillende technieken op kleine datasets. “Een engineer of analist kan met een paar muisklikken regressie, decision trees of support vectormachines testen en vergelijken. Dat is niet alleen leerzaam, het is ook een praktische eerste stap naar toepassing binnen de eigen organisatie.”

Geen voorkennis vereist – wél resultaat
Een van de grootste pluspunten van Orange is de lage instapdrempel. “Je hoeft geen programmeur te zijn,” zegt Rijpkema. “Zelfs middelbare scholieren in Slovenië – waar Orange is ontwikkeld – leren ermee werken. Tegelijkertijd kunnen we er in onze cursussen ook geavanceerde technieken mee uitleggen, zoals regularisatie, ROC-curves of model stacking.”

Die aanpak werkt. “Bijna iedereen die ik de mogelijkheden van Orange laat zien, wil daarna zelf aan de knoppen zitten,” vertelt Koo enthousiast. “Het nodigt uit tot experimenteren. En dat is precies wat je nodig hebt om data science echt te begrijpen: zélf doen, zélf fouten maken, zélf verbeteren.”


https://orangedatamining.com/

Brede toepasbaarheid
Orange is niet alleen voor dataspecialisten of engineers. Ook managers en beleidsmakers kunnen er veel aan hebben. “Zij moeten vaak keuzes maken over AI-projecten of data-initiatieven. Als ze in een cursus zelf ervaren wat het betekent om een model te bouwen of parameters aan te passen, krijgen ze meer grip op de inhoud. Dan zien ze wat er technisch speelt en waarom een model soms instabiel of onbetrouwbaar is.”

Volgens Rijpkema is dat vooral waardevol in organisaties die bezig zijn met het opbouwen van data literacy: het vermogen om kritisch met data om te gaan. “Orange helpt daar enorm bij, omdat je snel en visueel ontdekt hoe een model zich gedraagt. En omdat het gratis beschikbaar is, kunnen mensen er ook na de cursus mee doorgaan.”

Flexibel en uitbreidbaar
Naast de basisfunctionaliteit biedt Orange tal van uitbreidingen, bijvoorbeeld voor tekstmining, beeldherkenning of tijdreeksanalyse. “Het platform is flexibel genoeg om ook specialistische toepassingen te ondersteunen.” Koo prijst bovendien de stabiliteit en continuïteit van het programma. “Orange wordt ontwikkeld door de Universiteit van Ljubljana. Het is solide, stabiel en er zit een duidelijke educatieve missie achter.”

Ervaren is begrijpen
Wat Orange volgens Koo vooral uniek maakt, is dat het deelnemers de ruimte geeft om zelf te ontdekken en te begrijpen. “Onze cursussen zijn niet gericht op het leren van Orange, maar op het begrijpen van modellen. Wat gebeurt er als ik deze parameter verhoog? Waarom werkt een random forest hier beter dan een regressiemodel? Dankzij Orange kun je die vragen meteen onderzoeken.”

Of het nu gaat om het trainen van promovendi aan de TU of het begeleiden van data-initiatieven binnen het bedrijfsleven; Orange speelt een centrale rol in Rijpkema’s onderwijsfilosofie. Zo ook in zijn cursussen bij PAOTM: “Je leert niet zwemmen door een boek te lezen. En je leert geen data science door alleen theorie te horen. Je moet het doen. Orange maakt dat mogelijk.”

Zelf aan de slag
Ga jij binnenkort zelf aan de slag met Orange, of ben je benieuwd naar de mogelijkheden van de software in combinatie met de nieuwste kennis op het gebied van predictive analytics of andere data science onderwerpen? Bekijk hieronder de cursussen die Koo geeft. Heeft een cursus geen datum? Meld je interesse! Of laat het ons weten wanneer je team een kennisvraag heeft; we helpen je graag met een incompany cursus op maat.

Cursusleider

Data-analyse en programmeren

dr. Koo Rijpkema

Technische Universiteit Eindhoven (TU/e)

“Lesgeven staat voor mij voor het delen van kennis en passie, mensen inspireren en fascineren door de toepassing van statistiek.”

Programmamanager

Waarom PAOTM

  • De nieuwste postacademische kennis en kunde
  • Toegespitst op vraagstukken die spelen in een technische omgeving
  • Interactief en direct toepasbaar in de praktijk
  • Topdocenten vanuit wetenschap, onderzoek en bedrijfsleven

PAOTM wordt gemiddeld beoordeeld met een

8,3

Download de studiegids

Wil je graag een compleet overzicht van al onze cursussen en opleidingen? Download dan de digitale studiegids!

Gerelateerde cursussen