Welke schepen op de Noordzee verdienen een bezoek van kustwacht of douane? Met een speciaal computermodel is dit makkelijker te achterhalen. Slimme algoritmes bekijken bijvoorbeeld hoe vaak een schip van naam is veranderd en waar de matrozen over ‘facebooken’.
Het is als het zoeken naar een speld in een hooiberg. Welke bemanning van de duizenden schepen die op de Noordzee varen, heeft minder goede bedoelingen? Operators kunnen wel een aantal schepen in de gaten houden, maar op het drukst bevaren gebied in de wereld is het ondoenlijk om ieder schip handmatig te volgen. Dan komen computers en algoritmes van pas.
Een algoritme is een serie opdrachten die de computer doorloopt. In dit geval combineren slimme algoritmes de informatie uit verschillende bronnen, zoals radarinformatie en data van social media. De computer schotelt daarmee de operator vervolgens een plaatje voor waarmee hij smokkelaars van wapens, mensen en drugs eenvoudiger kan traceren. Hij ziet in één oogopslag welke schepen een risico vormen en kan actie ondernemen. De kustwacht of de douane kunnen dan het schip controleren om vast te stellen wat er echt aan de hand is. Kustwacht controleert voor de veiligheid en naleving van wetten op zee, de douane is verantwoordelijk voor naleving douanewetgeving.
Als promovendus bij de Radboud Universiteit hield de Duitse Steffen Michels zich met name bezig met het programmeren van deze algoritmes, als onderdeel van het Metis-project van Commit, waar verder de Vrije Universiteit Amsterdam, TU Delft, TU Eindhoven, onderzoeksgroep TNO-ESI en defensiebedrijf Thales betrokken zijn. Samenwerking met de experts van Thales werd gezocht om te achterhalen hoe criminelen te werk gaan. Die kennis is in het computermodel verwerkt zodat op de juiste aanwijzingen wordt gelet. “Als bijvoorbeeld de kleur van een schip op zee wordt overgeschilderd. Dan weet je dat de schipper iets te verbergen heeft en kun je er een patrouilleboot op afsturen.”
Kansmodel
De algoritmes combineren verschillende factoren, zoals snelheid en boottype. Via een trechtermodel zetten de wiskundige modellen ongestructureerde data om naar gestructureerde data. Een containerboot kan niet zo snel varen als een speedboot. Als een containerboot dat wel doet, dan klopt er iets niet: Of de snelheidsmeting klopt niet of er vaart een ander type schip dan opgegeven is.
De onderzoekers gebruiken ook data afkomstig van social media zoals MyShip.com, een ‘social en career website’ waarop crewleden uit verschillende landen van schepen over de hele wereld met elkaar in contact kunnen komen en kunnen laten weten op welke schepen ze nu en in het verleden hebben gevaren, welke rang ze hebben en of ze op zoek zijn naar ander werk. Michels erkent dat die informatie niet altijd betrouwbaar is. “We gebruiken daarom een kansmodel, dat dat het mogelijk maakt om de betrouwbaarheid van bronnen te modelleren. Het algoritme weegt op basis van alle beschikbare informatie, op basis van de betrouwbaarheid, de correctheid af en komt tot een conclusie.”
De wiskundige modellen kijken vooral of de informatie van de verschillende bronnen overeenkomt. Het blijft een inschatting, legt de onderzoeker uit. Pas als douane of kustwacht naar het schip toegaan, weten ze of het alarm echt terecht was. Michels geeft een voorbeeld. “De ene bron zegt: ik ben een containerschip, de andere bron geeft aan dat het een passagiersschip is. Dat is verdacht. Of misschien klopt het wel dat het een containerschip is, maar blijkt uit andere data dat het schip in een gebied vaart, waar dat niet is toegestaan. Dan gaat er een belletje rinkelen. Maar het kan natuurlijk ook een fout in één van de databases zijn.”
Het onderzoeksproject is in 2016 afgerond, maar het systeem is nog niet in gebruik. De Radboud Universiteit kijkt naar de mogelijkheid van een vervolgstudie in samenwerking met de kustwacht. Ook wordt gekeken naar commerciële exploitatie van het ict-systeem.