In iedere PhD komt een tijd dat je voor een paar maanden ‘op kot’ wil gaan in Antwerpen. Dat moment is nu voor mij aangebroken.
‘Kot’ is een van die mooie Vlaamse woorden die duidelijk maken dat Vlaanderen toch echt in het buitenland ligt, ook al verstaan we elkaar prima. Friet haal je er in een ‘frietkot’, en een studentenkamer heet een ‘studentkot’. Universiteit heet gewoon ‘universiteit’. Je kan niet alles hebben.
Fietssnelweg
Afgezien van het bewonderen van Vlaamse woorden, doe ik Antwerpen niet veel anders dan ik Nijmegen al deed. Wij taaltechnologen hebben aan een computer met goede internetverbinding genoeg om ons onderzoek uit te voeren. Het is vooral de verandering van omgeving die voor een stimulans kan zorgen. Terwijl ik in Nijmegen over één langgerekt fietspad naar de universiteit rijd, is fietsen door Antwerpen een ware hindernisbaan. Dat houdt je scherp.
Verantwoordelijkheid
Het belangrijkste zijn echter de mensen. Ook daar is het goed om de vaste patronen te onderbreken. Bij mijn onderzoeksgroep aan de Radboud Universiteit (de Lama’s) was ik bijvoorbeeld in de rol gesleten van degene die de gezamenlijke lunchpauze beëindigt voor iedereen. Een belangrijke taak, dat geef ik meteen toe. Maar ook een zware verantwoordelijkheid die op je schouders rust. Bij de onderzoeksgroep in Antwerpen, het Computational Linguistics and Psycholinguistics Research Centre (CLIPS), beslist ieder voor zichzelf hoe lang de lunch duurt. Een verfrissend concept.
Stylometrie
Ik ben vooral in Antwerpen om nieuwe kennis op te snuiven. Iedere onderzoeksgroep, ook al delen ze hetzelfde vakgebied, heeft een eigen focus. Bij CLIPS is dit onder meer stylometrie en psycholinguïstiek. Vooral de stylometrie, het automatisch extraheren van persoonskenmerken op basis van schrijfstijl, is interessant voor mijn eigen onderzoek. Het is bijvoorbeeld mogelijk om op basis van het woordgebruik van een persoon automatisch te herkennen of dit een man of een vrouw is, en zelfs wat de globale leeftijd is. Dit zou ik kunnen gebruiken om in kaart te brengen welk geslacht en welke leeftijd prominent is in tweets over gebeurtenissen.
Raadsels
Tot slot is er ook nog plaats voor totaal verschillend werk. Een collega in Antwerpen heeft gewerkt aan een systeem dat zelf raadsels bedenkt en deze op twitter plaatst, de TheRiddlerBot. Erg interessant werk, aangezien taaltechnologie vooral gericht is op de _interpretatie_ van taal zoals mensen dat doen. Bij de
TheRiddlerBot gaat het juist om het automatisch genereren van tekst die niet voor die van een mens onder moet doen. Dit valt in het vakgebied van ‘computationele creativiteit’. Een erg uitdagende taak, aangezien het heel moeilijk is om creativiteit in regels te vatten. Wij gaan proberen om de @TheRiddlerBot te leren om zijn eigen raadsels op waarde te schatten, en dus te herkennen wanneer een raadsel creatief is. Voor een Faces of Science blog die door een computer gemaakt wordt hoeven jullie niet bang te zijn. Zo ver zijn we nog lang niet.