Het onzichtbare leger huurlingen achter artificiŽle intelligentie

ArtificiŽle intelligentie is een term die vele ladingen dekt, maar ook in zijn meest gesofisticeerde vorm Ė met machine learning op basis van neurale netwerken Ė kruipt er heel wat manuele arbeid in het ontwikkelen van performante toepassingen. Aanbieders van AI oplossingen houden ervan om een zekere mythe rond de technologie te cultiveren en verzwijgen daarom meestal het onzichtbare leger huurlingen dat achter de schermen werkt.

Aanleiding voor dit artikel is een recent interview met Elon Musk op de website CleanTechnica waarin hij zegt dat Tesla 500 mensen in dienst heeft als labelers Ė een aantal dat hij wil optrekken tot 1000. Over het interview zelf en wat Tesla doet in AI willen we het verder hier niet hebben, onder meer omdat we van mening zijn dat het verhaal meer nuance verdient dan in het artikel is weergegeven. Maar de uitspraak over de labelers is interessant om een aspect van artificiŽle intelligentie te bespreken dat doorgaans weinig aandacht krijgt: het manuele werk achter de schermen dat nodig is om de magie van AI tot leven te wekken.

Zoals aangegeven in de artikels Deep learning en Lineaire regressie hier op Productivity.be komen heel wat toepassingen van artificiŽle intelligentie neer op het toepassen van lineaire regressie. Zelfs neurale netwerken, die qua opzet soms moeilijk te vatten zijn, komen in wezen neer op het toepassen van deze statistische methode.

Wanneer men het in machine learning vervolgens heeft over gelabelde data, dan wordt de populatie bedoeld van inputs met gekende output die gebruikt wordt in de lineaire regressie.

Lineaire regressie

Zullen we het anders toch nog even over Tesla hebben? Tot nu toe slaat artificiŽle intelligentie in hun verhaal vooral op beeldherkenning. Het doel daarvan is dat de auto in camerabeelden niet alleen de beschikbare rijweg kan herkennen maar ook alle verkeerslichten, borden, wegwijzers en uiteraard alle mogelijke obstakels. Het besturen van de auto op basis van al die informatie gebeurt vervolgens met eerder klassieke algoritmes. De AI zorgt voor het vertalen van camerabeelden in input voor die algoritmes.

Om een neuraal netwerk zover te krijgen moet het getraind worden met grote hoeveelheden gelabelde data. In beeldherkenning zijn dat fotoís waarvan op voorhand manueel bepaald is wat er allemaal te zien is in de beelden. En net zoals een eenvoudige lineaire regressie nauwkeurigere resultaten oplevert naarmate men meer punten heeft om een lijn door te trekken, zo zal het neurale netwerk beter verkeersborden kunnen onderscheiden naarmate het tijdens de training meer fotoís te zien heeft gekregen met en zonder deze borden.

Maar dat betekent dus ook dat er veel meer werk kruipt in het labelen van beelden. Het aangehaalde artikel dat melding maakt van 500 labelers lokte bij specialisten in AI op sociale media overigens de reactie uit dat 500 mensen niet eens zo veel is voor wat Tesla in het project wil bereiken. Grote IT-bedrijven in Silicon Valley zoals Microsoft, Google en Facebook hebben blijkbaar nog veel grotere legers van labelers die ingezet worden in machine learning. Het is een werk dat uitbesteed wordt aan bedrijven zoals Bunch, dat net als veel zijn concollegaís in de Filipijnen opereert. Een full-time labeler kost er 950 tot 1150 dollar per maand.

Inzicht in wat men wil herkennen

Ook in industriŽle toepassingen Ė vaak gaat dan eveneens over beeldverwerking voor kwaliteitscontrole, maar ook over signaalherkenning voor de detectie van anomalieŽn Ė biedt artificiŽle intelligentie geen of-the-shelf oplossingen die meteen resultaat opleveren. Het gaat veelal om omvangrijke projecten waarin eerst een grondig inzicht verworven moet worden in wat men wil herkennen en welke inputs daarvoor relevant zijn. Vervolgens moet er een uitgebreide dataset voorbereid worden en moeten relevante statistische methodes gekozen worden. Dit alles is mensenwerk en dan nog wel van het arbeidsintensievere soort Ė een aspect dat in de promotie van artificiŽle intelligentie weinig of niet aan bod komt.

© Productivity.be, 23/08/2020


Feel free to share



Productivity.be

is een publicatie van
Redactiebureau ConScript

Contact

Erwin Vanvuchelen
+32 (0)475 64 99 34
erwin@conscript.be
erwinvanvuchelen