Machine learning

Machine Learning (ML) is het door een computer laten uitvoeren van taken die voorheen uitsluitend (goed) door mensen konden worden uitgevoerd. Machine Learning is van alle tijden. Het is lastig voor te stellen, maar voordat er rekenmachines op de markt kwamen werd rekenwerk uitgevoerd door mensen, en bestond er een functie ‘calculator’. Dialogic ontwikkelt zelf algoritmes en software voor machine learning, primair om in haar eigen onderzoeken te gebruiken.

Tekstclassificatie: een machine leren lezen

In veel onderzoeken komen we tot inzichten op basis van statistieken. Soms zijn de benodigde cijfers niet beschikbaar in gestructureerde vorm, maar in ongestructureerde teksten. Zo kunnen we op basis van vacatureteksten cijfers verzamelen over de vaardigheden die op de arbeidsmarkt gevraagd worden. Met tekstclassificatie kan dit worden geautomatiseerd en kan een computer automatisch een ‘label’ toekennen aan een stuk tekst. De door ons ontwikkelde algoritmes zijn betrouwbaar en resistent tegen (bijvoorbeeld) spelfouten.

In onderstaand voorbeeld laten we zien hoe eenvoudig het is om een computer het onderscheid te leren tussen Nederlandse jongens- en meisjesnamen. We maken gebruik van de door Dialogic zelf ontwikkelde software en modellen voor machine learning.

Met tekstclassificatie kunnen grote hoeveelheden tekst worden geanalyseerd. Een voorbeeld is het analyseren van grote hoeveelheden literatuur op de mate waarin artikelen van een universiteit betrekking hebben op duurzaamheidsdoelen (SDG’s). Onderstaande afbeeldingen tonen de resultaten hiervan voor een Nederlandse universiteit.

Afbeeldingsclassificatie: een machine leren zien

Steeds vaker gebruiken we naast gestructureerde data ook ongestructureerde gegevens in onze onderzoeken. Naast tekstuele data vinden we daarin ook afbeeldingen en zelfs video terug. Denk bijvoorbeeld aan foto’s die door een medewerker van een gemeente worden verzameld tijdens onderhoud aan de buitenruimte, afbeeldingen die zijn gescraped van online winkelwebsites, et cetera.

Om statistieken te kunnen verzamelen op basis van deze afbeeldingen (bijvoorbeeld: hoe vaak is een prullenbak vernield in een gemeente, of wat voor soorten goederen worden online aangeboden?) is het nodig om afbeeldingen te classificeren. Met machine learning kan dit werk, dat enkele jaren geleden alleen nog door mensen (goed) kon worden uitgevoerd, worden geautomatiseerd.

In onderstaand voorbeeld laten we zien hoe eenvoudig het is om een computer het onderscheid te leren tussen verschillende merken colaflesjes. We maken gebruik van de door Dialogic zelf ontwikkelde software en modellen voor machine learning.

AI is bij uitstek geschikt voor repetitieve taken die voorheen door mensen moesten worden uitgevoerd. Hieronder zie je een door Dialogic ontwikkeld model dat afval kan herkennen in de openbare ruimte.

meer weten over machine learning? Neem contact op met Tommy van der Vorst
Partner