Machine learning

Een van de doelstellingen van Industrie 4.0 is te komen tot intelligente machines – machines die zich zonder menselijke tussenkomst kunnen aanpassen aan wijzigingen in hun omgeving en daardoor ook uit zichzelf steeds performanter worden. De technologie die dat mogelijk moet maken komt uit de IT-wereld en heet Machine learning. Maar wat is dat eigenlijk?

Machine learning is een populaire term die vaak gebruikt wordt in combinatie met Big Data. Het is het werkveld van de Data Scientists – een nieuwe generatie wizz kids die zich in een alternatief universum lijkt te begeven. Of toch in ieder geval een universum waar een taal gesproken wordt die voor buitenstaanders nauwelijks verstaanbaar is.

Dat is uiteraard geen toeval, want die mysterieuze taal draagt er net toe bij dat de Data Scientist door Harvard Business Review uitgeroepen werd tot ‘Sexiest job of the 21st century’. Indien de wizz kids het gewoon zouden hebben over lineaire regressie of de stelling van Bayes, zou de aantrekkingskracht een flink stuk minder geweest zijn.

Het weze hen gegund, natuurlijk. Maar laat ons toch eens even kijken onder de motorkap, naar wat er precies met machine learning bedoeld wordt.

Drie types van machine learning

Machine learning slaat op het gebruik van algoritmes die uit zichzelf kunnen leren van data en/of ervaring. In het vakgebied worden drie soorten van dergelijke algoritmes onderscheiden, met elk hun eigen toepassingsgebied.

Het eerste type heet supervised learning, wat typisch gebruikt wordt in toepassingen waarbij een algoritme op basis van een input (x) een bepaalde output (y) moet geven. Het algoritme is in wezen een functie (of een beslissingsboom) waarbij machine learning tot doel heeft de parameters in deze functie te bepalen. In Big Data toepassingen kunnen die parameters bepaald worden op basis van datasets (gekende combinaties van x en y).

Bij unsupervised learning gaat het om data zonder input/output-relatie. De opdracht is dan om bepaalde structuren terug te vinden in grote hoeveelheden data. Een voorbeeld is wat Netflix doet om haar leden suggesties te geven over films en series die ze allicht willen zien. Ook Amazon gebruikt deze methode om u producten voor te stellen waarvan zij menen te weten dat u ze wilt kopen.

De derde methode in machine learning heet reinforcement learning. Het is de meest intelligente vorm van machine learning omdat ze los komt van vooraf gedefinieerde functies en algoritmes. In de plaats daarvan laat men een machine – voor dit soort toepassingen komt men al snel bij neurale netwerken – via trial & error zoeken naar de ideale manier om een bepaald doel te bereiken. In ons artikel over Artificiële intelligentie staat een mooi voorbeeld over een robot die op die manier leert bin picken.

Lineaire regressie

Om dit alles nog wat concreter te maken bekijken we een methode in supervised learning die iedereen kent, namelijk lineaire regressie. De methode bestaat erin van gekende data (combinaties van een input x met bijhorende output y) in een grafiek weer te geven en vervolgens een lijn te tekenen die zo goed mogelijk aansluit bij de getekende punten. De positie van die lijn en de helling bepalen de parameters in de functie y = a x + b. Machine learning bestaat er dan in van a en b te bepalen aan de hand van een beschikbare dataset. Eens dat gebeurd is, kan het algoritme voor elke willekeurige x een verwachte waarde y opgeven.

Lineaire regressie is uiteraard slechts voor een beperkt aantal toepassingen mogelijk, maar de methode kan eenvoudig uitgebreid worden door meer complexe functies met dan ook meer parameters te gebruiken.

Een speciaal geval zijn nog de toepassingen met een binaire output (ja of neen), waarbij dan principes voor logische regressie of methodes uit de statistiek gebruikt worden. Concreet voorbeeld: als een machine data krijgt over regenbuien waarbij in 1000 gevallen slechts 3 keer een regenboog te zien is, zal de machine bij een volgende regenbui zeggen dat hij nadien geen regenboog verwacht. Zo eenvoudig kan machine learning dus zijn.

Apriori algoritme

Ook de methodes die in unsupervised learning gebruikt worden, zijn vaak een stuk minder complex dan de omschrijving doet vermoeden. De voorbeelden die we eerder aanhaalden van Netflix en Amazon worden bijvoorbeeld gerealiseerd met een methode die het Apriori algoritme genoemd wordt. In feite kijkt men gewoon naar de beschikbare data en telt men hoe vaak bepaalde associaties zich voordoen. Als van 1000 mensen die naar House of Cards gekeken hebben, 400 mensen ook naar Orange is the new Black gekeken hebben en slechts 200 ook naar Narcos, zal men iemand die House of Cards bekeek, eerder Orange is the new Black aanraden.

Al klopt dat niet helemaal, want de methode houdt in een tweede stap rekening met de populariteit van de reeksen op zich. Bovenstaand voorbeeld kan immers meer zeggen over de populariteit van de genoemde reeksen, dan over de associatie in voorkeur. Daarom wordt de frequentie waarin een combinatie zich voordoet gedeeld door de absolute waarden waarin de individuen zich voordoen om de associatie meer betekenis te geven. Concreet: als Narcos een grootte-orde minder vaak bekeken wordt dan Orange is the new Black, wordt de combinatie House of Cards – Narcos plots relevanter dan de combinatie House of Cards – Orange is the new Black, en zal de Netflix klant die House of Cards bekeek, Narcos aanbevolen krijgen.

Verbanden zoeken in data

Wat deze voorbeelden illustreren is dat machine learning in de meeste gevallen minder spectaculair is dan de term doet vermoeden. Het gaat in de praktijk immers veelal om het toepassen van gekende principes uit de wiskunde en statistiek.

Toch zit er in machine learning een principe dat behoorlijk revolutionair is, zeker in industriële toepassingen. Daar wordt al langer gebruikgemaakt van wiskundige modellen van processen, bijvoorbeeld om simulaties te doen, maar die werden in het verleden meestal opgebouwd vanuit de wetten van de fysica. In machine learning is de link met die wetten niet langer noodzakelijk om vanuit datasets tot een wiskundig model te komen. Het is met andere woorden niet langer noodzakelijk om een proces te begrijpen om het te kunnen modelleren. Bovendien kan zo een abstract model dat via machine learning bekomen werd, ook nog eens nauwkeuriger zijn dan een klassiek model, precies omdat het via reële data tot stand gekomen is.

Een tweede (mogelijke) revolutie zit in de kracht van unsupervised learning om verbanden te zoeken in grote hoeveelheden data – ook verbanden die men vanuit de bestaande inzichten in processen niet zou verwachten. Op die manier kan machine learning nieuwe inzichten verschaffen met toepassingsmogelijkheden in bijvoorbeeld procesoptimalisatie en predictief onderhoud.

Toch blijft er in de industrie flink wat scepsis bestaan tegenover machine learning, en dat is allicht een goede zaak. Wat bijvoorbeeld te denken van het adagium dat met statistiek zowat alles te bewijzen valt, nu we weten dat machine learning in veel gevallen slechts een oefening in statistiek is? Neem als voorbeeld de reële data uit bijgaande grafiek, waaruit een iets minder artificieel intelligente machine al snel de verkeerde conclusies zou kunnen trekken.

© Productivity.be, Tekst: Erwin Vanvuchelen


Feel free to share

Newsletter Factory Automation

VDW

METAV 2018

Van de laatste technologieën in traditionele productietechnieken tot nieuwe oplossingen voor Industrie 4.0 - ze komen allemaal aan bod op de vakbeurs METAV, van 20 tot 24 februari 2018 in Dusseldorf.
Naast het hoofdthema metaalbewerking heeft de beurs speciale zones met aandacht voor kwaliteitscontrole, additive manufacturing, molding en medical.
Meer info en inschrijving: www.metav.com

Start To Make Smarter

Op 7 en 8 februari ontvangt het MTMS Network Event in Kortrijk Xpo een 3000-tal bezoekers uit metaal- en kunststoffentransformatie, subcontractors, OEM’s en machinebouwers om te netwerken met 165 technologie- en componentenleveranciers.
Het event omvat kleine partnerstanden, netwerkrecepties en de Ideas Battle Arena met tal van inspirerende ondernemers. Dit jaar wordt voor de eerste maal ook de POM Late Shift georganiseerd.
Registreer u (en uw collega's)