De waarde van machine learning voor de financiële sector

25 juni 2018 Banken.nl

Machine learning is één van die termen die vaak langskomt als het gaat over kunstmatige intelligentie. De opkomst van Big Data heeft de ontwikkeling van machine learning een nieuwe impuls gegeven, vooral in de VS en China. Consultancybureau Solid Professionals gaat in op de invloed van machine learning op de ontwikkeling van de financiële sector, met oog voor kansen enerzijds en risico’s anderzijds.

Wat is machine learning? Het is goed om die vraag eerst verder uit te diepen. Machine learning is een onderdeel van kunstmatige intelligentie (artificial intelligence, A.I.) dat zich richt op het ontdekken van patronen in grote hoeveelheden data. Voor een menselijk brein zijn veel datapools simpelweg te groot om er binnen een redelijk tijdsbestek iets nuttigs uit te halen, maar computers zijn een ander paar mouwen. Computers kunnen met hun huidige verwerkingskracht oneindig veel verschillende soorten data scannen, vergelijken en uiteindelijk patronen herkennen. Die patronen vormen vervolgens de basis voor nieuwe algoritme, wat door het toevoegen van nieuwe data verder blijft ‘leren’ en zodoende zichzelf blijft ontwikkelen en nieuwe patronen blijft ontdekken.

De waarde van machine learning voor de financiële sector

De opkomst van Big Data heeft gezorgd voor een sterke opleving van interesse in A.I. en machine learning. Dat is ook terug te zien in het aantal vacatures waarin gezocht wordt naar data-analytici. Vooral in de V.S. en in het bijzonder in China wordt veel geïnvesteerd in machine learning. Dat komt door de grote beschikbaarheid van Big Data. Met 90% van de bevolking actief op social media en zonder strenge privacywetten kunnen Chinese ontwikkelaars hun hart ophalen. In de V.S. is ook een goede 70% actief op social media.

Nederlandse voorbeelden

Nederlandse banken zijn vanzelfsprekend ook bezig met de ontwikkeling van A.I. en van machine learning. De ABN AMRO app Grip is hier een voorbeeld van. Door inzicht te bieden in toekomstige betalingen en uitgaven (op basis van patronen uit het verleden) kunnen consumenten beter inschatten om een bepaalde inkoop wel of niet te doen. ING introduceerde vorig jaar Katana, een tool die op basis van prijsfluctuaties uit het verleden (data) patronen kan ontdekken en obligatiehandelaren helpt om beslissingen te nemen. Of het risicomodel van NIBC dat de bank inzicht geeft in het betaalgedrag van hypotheekklanten waarmee mogelijk betalingsmoeilijkheden of -achterstanden in een vroeg stadium worden herkend. Vergeleken met China en de V.S. gaan de ontwikkelingen in Europa echter mondjesmaat, wat mede komt door invoering van de GDPR. In Europa mag data alleen worden verzameld als het een specifiek doel dient, de data mag bovendien niet lang bewaard worden.

Deep learning

Belangrijk in de ontwikkeling van machine learning is de ontwikkeling van deep learning. Die tak van sport behandelt niet zomaar een menselijke nauwkeurigheid in tekst-, beeld- en spraakherkenning, maar zelfs een bóvenmenselijke nauwkeurigheid. Neem onderstaande figuur als voorbeeld, waarin computers meer hondjes leren ontwaren dan echte mensen.

Vision Error Rate

Nieuwe ontwikkelingen binnen deep learning maken het mogelijk om conventionele en lineaire modellen anders te benaderen en betere voorspellingen te doen, ook in de bancaire sector. Deep learning technieken presteren het om abstractere verbanden en niet-lineaire patronen te ontdekken. Ontwikkelingen die bijdragen aan risicomodellen. Een praktisch voorbeeld is de invloed van (slechte) hypotheken op het financiële systeem als geheel, één van de grootste oorzaken van de financiële crisis, die conventionele modellen niet zagen aankomen.

De capaciteit om abstractere en niet-lineaire patronen te ontdekken maakt nieuwe modellen mogelijk voor het voorspellen van trends, fraude en risico. Voor banken en consumenten kunnen dit extreem waardevolle ontwikkelingen zijn.

Risico’s

Het lijkt haast een wetmatigheid dat de meest fantastische dingen ook altijd duistere kanten hebben. Zo ook met deep learning. De enorme vrijheid en hoeveelheid abstracte rekenstappen kunnen A.I.-modellen ook moeilijk interpreteerbaar maken, waardoor causale verbanden kunnen vervagen. Onderstaande afbeelding laat zien wat er kan gebeuren. De input van een model is licht aangepast, op een niveau dat voor het menselijk oog niet te detecteren is. Het laat zien dat deep learning ook niet onfeilbaar is en dat manipulatie mogelijk is. 

Panda confidence

Causale verbanden kunnen vervagen, ze kunnen ook ongewenst gelegd worden, bijvoorbeeld op het vlak van etniciteit. Zonder dat het in de uitkomst zichtbaar kunnen A.I.-modellen afleiden uit data wat iemands etniciteit is. Daarmee kunnen modellen bevooroordeeld zijn. GDPR geeft mensen tegenwoordig echter de mogelijkheid om automatisch gegenereerde beslissingen aan te kaarten en een menselijk besluit af te dwingen.

Het leggen van verbanden is de kracht, maar tegelijk ook de zwakte van machine learning. Het is vooraf niet altijd duidelijk hoe verbanden met elkaar gaan interacteren. Dat kan leiden tot instabiliteit in het financiële systeem.

Ten slotte kunnen A.I.-modellen ‘overfitten’. Ze passen bijvoorbeeld erg goed op een trainingsset, maar hebben vervolgens geen enkele voorspellende waarde voor nieuwe data. Een model dat verkeerd getraind is, draagt het risico om zich te gaan ontwikkelen in een richting die we wellicht helemaal niet willen of die volledig onbruikbaar is. Modellen waarvan niet duidelijk is wat ze met onze data doen worden ‘black boxes’ genoemd.

Oplossingen

Er zitten dus nog wat haken en ogen aan wat in potentie een geweldige vorm van technologie is. De recente ontwikkeling van explainable A.I. (XAI) zorgt voor meer interpreteerbaarheid en reguleerbaarheid binnen de nieuwe modellen. Kern van XAI is een nieuwe manier van onderscheid maken van verschillende eigenschappen. In plaats van dat de verbanden kriskras door de ruimte gelegd worden, probeert deze techniek op een logische manier verbanden te leggen door eigenschappen te bevestigen of uit te sluiten. Onderstaande vorm van machine learning is nog volop in ontwikkeling, maar biedt wel nieuwe en onbekende kansen. Het beantwoordt de roep om interpreteerbaarheid. Duidelijk zichtbaar is dat de software nadenkt en beredeneert en uiteindelijk bij een kat uitkomt.

xai

Solid Professionals is in de Nederlandse financiële sector actief bij zowel banken als verzekeraars, waar het helpt met ontwikkeling van machine learning toepassingen in de praktijk. 

Lees voor extra achtergrondinformatie de volledige paper van Solid Professionals.