Informatie Professional
terug |
Machine learning: Trend of Hype? |
20 (2016) nr. 9 (dec)
|
Eric SievertsJe kunt geen blog, blad of tweet meer openslaan, of machine learning komt ter sprake - een duidelijk teken van een hype. In de laatste aflevering van Gartners hype cycle stond machine learning helemaal bovenin de 'peak of inflated expectations', met de verwachting dat 'mainstream adoption' nog wel twee tot vijf jaar kon duren.* Met die 'inflated expectations' zullen Google en allerlei andere grote techbedrijven het vast niet eens zijn, want die zetten er zwaar op in en passen de techniek al volop toe. Maar zij zijn natuurlijk ook niet 'mainstream'.
Machine learning is een techniek uit het domein van de kunstmatige intelligentie,
die vooral wordt ingezet voor het oplossen van complexe problemen.
Die worden vaak gekenmerkt door de aanwezigheid van zo grote aantallen parameters en afhankelijkheden
dat die niet meer allemaal afzonderlijk kunnen worden onderscheiden
en niet meer vooraf gemodelleerd kunnen worden met een hanteerbaar aantal 'als-dan'-regels.
Het idee van machine learning is om een computerprogramma het dan maar zelf te laten uitzoeken,
op basis van voorbeelden waaruit de machine kan leren.
Deep learning
Deze technieken worden - door onder meer Google - ook wel deep learning genoemd.
Vorig najaar heeft Google hiervoor ontwikkelde software als open source beschikbaar gesteld, onder de naam TensorFlow.
Zelf gebruiken ze het om daarmee allerlei specifieke toepassingen te ontwikkelen.
Zo zorgt bijvoorbeeld Rankbrain dat hun zoekmachine steeds beter leert begrijpen wat zoekers met hun vragen bedoelen,
zodat de ranking van zoekresultaten daarop aangepast (en dus verbeterd) wordt.
DeepMind is gespecialiseerd in spellen en heeft intussen zo goed het denkspel Go leren spelen,
dat het de wereldkampioen heeft verslagen.
Gebruikte techniekenVoorbeelden van toepassingen van machine learning staan in bijgaand kader. Elk soort toepassing vraagt haar eigen aanpak en optimale daarvoor te gebruiken techniek. De technieken of algoritmes die bij machine learning worden toegepast zijn namelijk heel divers. Zo zal voor een toepassing waarbij tekst - dus letters en woorden - geanalyseerd moet worden om daaruit af te leiden waar die over gaat, een andere techniek worden toegepast dan bij de analyse van beeldmateriaal waar alleen maar pixels beschikbaar zijn. Welke techniek voor een bepaalde toepassing het beste werkt, kan vaak nog niet nauwkeurig voorspeld worden. In de praktijk moet dus nog veel worden uitgeprobeerd.Een techniek die in dit verband veel genoemd wordt is die van neurale netwerken. Dat is al een betrekkelijk oude techniek. Maar door de beschikbaarheid van steeds meer rekenkracht kan die nu voor steeds meer en steeds complexere problemen worden ingezet. Vooral voor visuele problemen schijnt dat succesvol te zijn, of dat nu gaat om herkenning van onderwerpen in beeldmateriaal of het interpreteren van de ruimtelijke stelling bij het Go-spel. Google noemt zijn vertaalmodule ook al 'neural machine learning'.
BeeldherkenningBij beeldherkenning wordt met zogenaamde feature extraction een veelheid aan karakteristieken van een afbeelding geanalyseerd. Dat leidt tot een soort profielen of vingerafdrukken van die afbeeldingen. Voor het leerproces is vervolgens veel inhoudelijke input nodig. Voor elk te herkennen onderwerp is een flink aantal zorgvuldig geselecteerde voorbeeldafbeeldingen vereist. En soms zowel positieve als negatieve voorbeelden. En dan nog kan zo'n systeem alleen die voorstellingen herkennen waarop het getraind is. Daarom wordt ook gebruik gemaakt van grote corpora met al (inhoudelijk) beschreven materiaal, waarin in principe bijna alle onderwerpen al voorkomen. Die beschrijvingen kunnen bijvoorbeeld de tags of zinnetjes zijn, die men op een uploadsite als Flickr aan foto's heeft toegekend.
ComplexOp dit terrein is ook Google actief, in eerste instantie om tags toe te kennen aan door gebruikers in Google Photo geüploade foto's. Daarnaast experimenteert Google met het in zinnen omschrijven van wat op een foto is afgebeeld, zoals 'a person on a beach flying a kite'. Voor de verschillende elementen uit een foto kunnen daarvoor gegevens uit diverse voorbeeldfoto's gecombineerd worden. Overigens komen herhaaldelijk voorbeelden in de media van onjuiste, vaak politiek niet correcte, of zelfs ronduit kwetsende tags of beschrijvingen. Soms zijn dat echte fouten, soms reflecteert dat domweg discriminerend of racistisch taalgebruik in het materiaal waaruit geleerd wordt. Dat nadeel van zelflerende systemen die helemaal aan zichzelf worden overgelaten, kan bijvoorbeeld ook optreden bij chatbots die leren van de discussies die gevoerd worden. Een probleem is ook dat deze modellen zo complex zijn geworden, dat meestal niet meer nagegaan kan worden op basis waarvan ze hun conclusies getrokken hebben. Zelfs de technici van Google begrijpen hun werking niet meer precies.
Tot slotUit de gegeven voorbeelden blijkt dat machine learning al aardig bezig is zich van een hype naar een trend te ontwikkelen. De grote techbedrijven stimuleren dat ook flink, door software ter beschikking te stellen waarmee inventieve ontwikkelaars zelf nieuwe toepassingen kunnen bouwen. Google doet dat met TensorFlow, IBM met Watson. Voor bedrijven biedt Google machine learning ook als cloud-dienst aan. Zelfs voor de doe-het-zelver verschijnen regelmatig aankondigingen van systemen waarmee niet-nerds de toepassing van machine learning kunnen uitproberen.
|
|||||
© |
Eric Sieverts en Informatie Professional (Uitgeverij IP, Voorburg)
Voor een abonnement op Informatie Professional:
|