De Machine Learning Revolutie in de Artificiële Intelligentie

Deze samenvatting is gebaseerd op:

  • Luc De Raedt, Over Machines die Leren, in: Visie en Vooruitgang. Lessen voor de XXIste eeuw, Universitaire Pers Leuven, 2009. https://people.cs.kuleuven.be/~luc.deraedt/Visie.pdf

  • Luc De Raedt, De artificiële-intelligentierevolutie en de impact ervan, in: Bart Raymaekers, Wetenschap in een veranderende wereld. Lessen voor de XXIste eeuw, Universitaire Pers Leuven, 2020, in druk. https://people.cs.kuleuven.be/~luc.deraedt/AI.pdf (zal wellicht pas na verschijnen van het boek op 23 maart beschikbaar zijn).

Artificiële intelligentie heeft, net als menselijke intelligentie, veel facetten. Nuttig voor AI is het onderscheid tussen leren en redeneren, dat ook soms als data- versus kennisgebaseerd gekarakteriseerd wordt. Redeneren maakt het mogelijk om nieuwe conclusies af te leiden uit beschikbare kennis, terwijl leren een proces is waarbij nieuwe kennis wordt geleerd uit ervaring (vaak in de vorm van data).

Hoewel AI zich aanvankelijk op het redeneren heeft gericht, situeren de recente doorbraken in AI zich allemaal op het gebied van machinaal leren. Die doorbraken liggen aan de basis van tal van nieuwe technologieën, zoals zelfrijdende auto’s, snellere en nauwkeurigere systemen voor medische diagnose, en intelligente virtuele assistenten, zoals Siri en Alexa.

Het is interessant om te definiëren wat machinaal leren nu eigenlijk is. Volgens Tom Mitchell ’leert een machine, indien zijn prestaties op een welbepaalde taak beter worden met ervaring’. Deze definitie vermeldt verschillende elementen. Met de term ‘machine’ wordt hier een robot, een computer, of zelfs een computerprogramma bedoeld. De machine moet een bepaalde taak vervullen, en de prestaties van die machine (de performantie) moeten meetbaar zijn. Naarmate de machine meer ervaring opdoet, worden de prestaties van lerende machines beter.

Klassieke voorbeelden van toepassingen van het machinaal leren zijn: het classificeren van email als gewenst of ongewenst (‘ham’ of ‘spam’), het herkennen van voetgangers in beelden, het vertalen van zinnen uit het Engels naar het Nederlands, het stellen van een medische diagnose op basis van de symptomen van een patiënt, het aanbevelen van een product aan een potentiële klant, et cetera. Machinaal leren moet worden beschouwd als een vorm van automatisch programmeren. In plaats van computerprogramma’s handmatig te schrijven, kunnen (elementen van) computerprogramma’s geleerd worden op basis van gegevens. Bovendien kunnen sommige taken, zoals het classificeren van e-mails als gewenst of ongewenst, of het identificeren van uitgezaaide kanker in medische beelden, of voetgangers in straatbeelden, niet met de hand worden geprogrammeerd, omdat de nodige kennis niet beschikbaar is of omdat het programma aangepast moet worden aan de persoonlijke voorkeuren van de gebruikers.

Volgens Pedro Domingos zijn er vijf verschillende scholen of paradigma’s in machinaal leren (hij spreekt over tribes). Ruwweg komt elk paradigma over- een met een bepaalde klasse van modellen. Een aantal van deze paradigma’s zullen kort voorgesteld worden in de lezing.

De artificiële intelligentie en het machinaal leren bieden tal van mogelijkheden voor nieuwe toepassingen en doorbraken. Ze hebben nu al een invloed op heel wat aspecten van ons leven en het heeft een enorme impact op onze samenleving. Er is enerzijds een enorm potentieel om AI in te zetten voor positieve doeleinden, waaronder betere productiefaciliteiten en werkomstandigheden, verbeterde gezondheids- en ouderenzorg, efficiënter transport, robottechnologie voor thuis en op het werk, meer toegankelijke en gepersonaliseerde onderwijsprogramma’s, verhoogde openbare veiligheid en beveiliging en intelligente gepersonaliseerde assistenten. Anderzijds bestaan er ook bezorgdheden, die heel wat aandacht krijgen in de media, en die in de andere lezingen van deze cyclus aan bod komen.

Maar naast de uitdagingen die meer met het gebruik en de impact van AI te maken hebben, zijn er ook tal van technische uitdagingen rond AI en machinaal leren.

Ten eerste kan het verkrijgen van toegang tot en het selecteren van de juiste gegevens erg moeilijk zijn. Technologieën zoals deep learning hebben grote hoeveelheden data nodig, en bij gesuperviseerd leren moeten die gegevens ook nog van een label voorzien zijn. Het labelen van datapunten kan tijdsintensief zijn (als het handmatig gebeurt), de data kunnen privacygevoelig zijn waardoor de verwerking de gangbare ethische normen en regelgeving moet respecteren, voor bepaalde toepassingen zijn de relevante kenmerken ook niet beschikbaar in de data, …

Verder kunnen datasets vertekend zijn (men noemt dit ‘bias’). Zo geeft Kate Crawford voorbeelden van zoekopdrachten naar beelden van CEO’s in Google, die quasi alleen maar beelden van blanke mannen opleverden, en van beelden van personen met Afrikaanse roots die als gorilla’s geclassificeerd werden door software. Dit is uiteraard onaanvaardbaar. De reden voor deze fouten is dat de data die gebruikt werden in het leerproces een sterke bias vertoont, omdat ze nauwelijks vrouwelijke CEO’s of personen met Afrikaanse roots bevatte. Er zijn ook controversiële AI-toepassingen waarbij mensen met een andere huidskleur oneerlijk behandeld worden bij een beslissing over hun lening, of hun vrijstelling op borg. Er bestaat dan ook heel wat onderzoek rond het vermijden van bias.

Deep learning levert black-box-modellen op, dat zijn modellen die niet te interpreteren zijn en geen verklaring kunnen geven voor de beslissing of classificatie die ze voorstellen. Bovendien blijkt dat geleerde modellen erg grillig kunnen zijn. Zo zijn er analyses bij beeldherkenning waaruit blijkt dat het wijzigen van een pixel in een beeld kan volstaan om een andere classificatie te bekomen (bijv. hond in plaats van vliegtuig). Het is ook moeilijk om in te schatten welke kenmerken bijdragen tot een voorspelling, en om de voorspellingen van black-box-modellen te vertrouwen. Bovendien voorziet de wet (bij wijze van de AVG) dat men recht heeft op een verklaring wanneer een computersysteem een beslissing neemt dat een significant effect heeft op een persoon, zoals een financiële of wettelijke beslissing. Er is dan ook heel wat onderzoek rond ‘explainability’ in AI.

Luc De Raedt
Luc De Raedt
Full professor