Fast data in het Internet of Things

Het Internet of Things (IoT) is een ontwikkeling die veel mogelijkheden biedt voor klanten van ING. Om onze klanten hierin zo goed mogelijk van dienst te zijn, is ING bezig om een data lake te bouwen, waarin fast data en streaming analytics een belangrijke rol spelen.

The bank of things

In de nabije toekomst worden steeds meer apparaten verbonden met het internet en daarmee met onze smartphones, laptops en tablets. Er is een enorme groei in sensoren, processoren en netwerkverbindingen in auto’s, huishoudelijke apparaten, machines in de industrie en wearables. Er zijn vele scenario’s te bedenken voor ING om in het IoT een rol te spelen en om onze klanten te helpen met innovatieve toepassingen. Je kunt bijvoorbeeld denken aan het automatisch betalen van gas/water/licht, persoonlijke hypotheekadvies op basis van gps data, auto’s die zelf hun brandstof betalen…[i]. Of het zover komt, weten we niet, maar de mogelijkheden zijn er.                                                 

Een bank als ING heeft een unieke positie in zo’n verbonden wereld; zodra een betaalactie gedaan moet worden, kan ING deze dienst leveren. ING wil alle data altijd en overal, onafhankelijk van device of contactpersoon van de bank, beschikbaar maken voor klanten.

 

Data lake

Het staat buiten kijf dat de datastromen binnen en buiten ING zullen toenemen in grootte, aantal, snelheid en variëteit. ING bouwt daarom aan een data lake waarin alle data van de bank worden opgeslagen. Met een combinatie van technologieën (Hadoop, Spark, IBM InfoSphere, Netezza) wordt een centraal knooppunt van data opgebouwd met diverse outputmogelijkheden: gestructureerde rapportages, ad-hoc analytics en machine learning op streaming data. Hierbij wordt onderscheid gemaakt tussen verschillende soorten van dataverwerking (zie Figuur 1).

Figuur 1: Drie vormen van datastromen

De architectuur van het data lake is gebaseerd referentiearchitecturen, zoals de lambda architecture die bij Twitter de basis vormde voor het Storm framework.

 

Fast data

Om streaming analytics in het IoT op grote schaal mogelijk te maken, bouwt ING aan een generiek framework (genaamd Coral) dat realtime events uit bronsystemen omzet naar acties. Een voorbeeld van een use case van dit framework is fraudedetectie. ING wil een monetaire transactie kunnen blokkeren op basis van datakenmerken. De criteria kunnen volgen uit business rules of uit machine learning algoritmen.

Coral is een platform van API’s dat zeer schaalbaar is opgezet. Het wordt gebouwd met Akka als actor framework, Cassandra als in-memory database en Spark als in-memory analytics engine. De broncode van Coral is te vinden op Github[ii].

Figuur 2: Architectuur van ING's fast data platform (Natalino Busa)

 

Wordt ING het nieuwe Google?

Naast de technologische uitdagingen is ING continu bezig om de manier van werken te verbeteren. Dat is niet alleen leuk en houdt het mensen scherp, maar het is vooral nodig om de snelle technologische veranderingen bij te houden. ING heeft een traditie van het snel doorvoeren van nieuwe werkwijzen, zoals scrum, DevOps en continuous delivery.

Het nieuwe organisatiemodel is gebaseerd op hightechbedrijven, zoals Google, Netflix en Spotify. Door bewust af te stappen van traditionele organisatievormen en manieren van werken, wordt ING nu al de Google van de financiële wereld genoemd[iii]!

Hoe ziet de wereld van de banken en bankieren in het IoT eruit? Dat weten we nog niet precies. Maar het is zeker dat er veel kansen en uitdagingen liggen op gebied van technologie, beveiliging, privacy en werkwijze.

 

Links