Twee Nederlandse onderzoekers bedachten 50 jaar geleden de term bioinformatica, nog onwetend dat dit een compleet nieuw onderzoeksveld zou worden. NEMO Kennislink sprak met drie verschillende onderzoekers om duidelijk te maken wat bioinformatica nou precies is en waarom het zo belangrijk is. Dit keer met Rob de Boer, hoogleraar theoretische biologie aan de Universiteit Utrecht.
Waarom gaat jouw immuunsysteem wel de strijd aan met een ernstige bacterie en niet met iets onbekends dat je voor het eerst eet? Om dat goed te onderzoeken, is veel rekenwerk nodig. De bioinformatica maakt het mogelijk om naar dit soort processen in het lichaam te kijken. Hierbij wordt niet alleen kennis uit de biologie gebruikt, maar ook uit de informatica, wiskunde en statistiek. In deze serie belichten we drie onderzoekers die op verschillende manieren werkzaam zijn binnen de bioinformatica. Ditmaal Rob de Boer. Hij is hoogleraar theoretische biologie en zet meerdere vormen van bioinformatica in om de werking van het immuunsysteem te bestuderen.
Waarom gebruikt u bioinformatica om naar het immuunsysteem te kijken?
“Je immuunsysteem is een complex systeem dat op dagelijkse basis moet beslissen of het gaat reageren op nieuwe deeltjes die jij binnenkrijgt. Ik noem dit altijd het ‘mango-probleem’. Stel, ik ga op vakantie naar India en eet voor het eerst in mijn leven een mango. In mijn darmen zit nu een nieuw mango-eiwit. Gelukkig besluit mijn immuunsysteem niet te reageren en kan ik morgen weer een mango eten. Maar stel nou dat er een cholerabacterie op die mango zit, dan beslist mijn immuunsysteem om wél op die bacterie te reageren. Dit komt omdat verschillende cellen van het immuunsysteem met elkaar gepraat moeten hebben, voordat er een reactie op gang komt.”
Hoe werkt dit?
“Sommige cellen, zoals macrofagen, herkennen de cholerabacterie als een ziekteverwekker omdat deze een bepaald patroon aan de buitenkant heeft die de macrofaag kan binden. De macrofagen geven deze informatie door aan een ander soort cellen, de lymfocyten, die alleen een specifiek cholera eiwit hebben herkend. Lymfocyten moeten van de macrofagen horen dat dat vreemde eiwit van een bacterie komt. Als ze dit gehoord hebben, verandert hun gedrag op zo’n manier dat ze stoffen maken tegen de bacterie waardoor deze opgeruimd wordt. Als ik dan volgende week weer een cholerabacterie tegenkom, heb ik een heleboel lymfocyten in mijn bloed die dat eiwit kunnen herkennen en die óók weten dat het een bacterie is. Ze kunnen dan een specifieke reactie maken op die bacterie en zo ben ik immuun voor cholera.”
“Het mango-eiwit kwam van een mango, en die wordt door de macrofagen niet herkend als een ziekteverwekker. De lymfocyten zien dan wel een vreemd eiwit, maar krijgen geen signalen van de macrofagen en starten dus geen reactie tegen dat eiwit. Het immuunsysteem leert en reageert dus op zijn omgeving doordat er informatiestromen binnen het immuunsysteem lopen. Dit is op zichzelf al een bioinformatische kijk op het immuunsysteem en past bij de oorspronkelijke definitie van het woord. Om dit soort informatiestromen duidelijk te maken, hebben we een model gemaakt.”
Oké, dat is de modelmatige kant, maar gebruikt u bioinformatica ook nog op andere manieren?
“Lymfocyten herkennen specifieke eiwitten doordat ze receptoren op hun buitenkant hebben die aan die eiwitten kunnen binden. Deze receptoren zijn voor elke cel uniek. In totaal heb je iets van honderd miljard lymfocyten in je bloed, dus als er dan een ziekteverwekker binnenkomt, is er altijd wel een cel die daaraan kan binden. Nu willen wij graag het hele repertoire van receptoren in kaart brengen: is echt elke cel uniek, of zijn er bepaalde receptoren die veel vaker voorkomen? Door nieuwe sequencing methoden kunnen we nu de receptorsequentie (de DNA volgorde die gelezen wordt om de receptor te maken – red.) van een miljoen cellen tegelijk bepalen. Maar omdat ze bijna allemaal uniek zijn, is het heel lastig vast te stellen wanneer er foutjes zijn gemaakt tijdens de sequencing, je hebt geen referentie. Om deze foutencorrectie zo goed mogelijk te doen, hebben we een computerprogramma (pipeline – red.) gemaakt.”
“Wat het ook lastig maakt, is dat je maar een miljoen cellen kunt onderzoeken, terwijl de volledige collectie aan receptoren veel groter is. Om toch een voorspelling te maken van de verdeling van receptoren in de totale populatie, gebruiken we een computermodel. Dat model maakt een kunstmatig repertoire van honderd miljard receptoren en voorspelt hoe de sequenties over dat repertoire verdeeld zijn. De ene sequentie verwacht je bijvoorbeeld maar één keer te zien, en een andere vijf keer. Vervolgens vergelijk je de experimentele data van een miljoen echte cellen met het computermodel en probeer je te achterhalen hoe de populatie er in werkelijkheid uit ziet.”
Hoe heeft de bioinformatica uw veld, de immunologie, veranderd de afgelopen 50 jaar?
“De grootste ontwikkeling was denk ik de mogelijkheid om grote hoeveelheden immuuncellen te kunnen sequencen, de high throughput sequencing noemen we dat. Daarna is de ontwikkeling van bioinformatische pipelines, computerprogramma’s, om die data te analyseren belangrijk geweest. Wij zijn niet de enige die daarmee bezig waren: er zijn denk in zo’n tien á twintig verschillende pipelines om dit soort gegevens te verwerken. Over de tijd gaat dit steeds beter: mensen nemen trucjes van elkaar over wanneer ze zien dat die goed werken.”
Wat voor ontwikkelingen binnen de bioinformatica zijn er gaande die belangrijk zijn voor de immunologie?
“Een leuke ontwikkeling is dat we nu algoritmes uit het veld van Natural Language Processing loslaten op de receptoren van immuuncellen. Daarbij leert een computerprogramma een menselijke taal begrijpen. Google bijvoorbeeld heeft voor hun translate algoritmes ontwikkeld om teksten te lezen en woorden te begrijpen uit die teksten. Omdat een woord in allerlei contexten voorkomt, kan het algoritme de betekenis van dat woord leren begrijpen. Zo kun je de volgorde van nucleotiden (de bouwstenen van DNA – red.) ook als woorden zien, en de receptor van een immuuncel als een zin. Als je hier een zelfde soort algoritme op loslaat, kun je de verwantschap tussen die zinnetjes, de receptoren dus, ontdekken. Gebruik jij bijvoorbeeld dezelfde woorden als ik?”
Maar als het immuunsysteem die receptoren willekeurig in elkaar zet, hoe kan daar dan een betekenis achter zitten?
“Je zou inderdaad verwachten dat er helemaal geen patroon in zit, maar dat zien wij wel. Wat we hier uiteindelijk mee willen doen, is voorspellingen doen over de ontwikkeling van ziektes bij mensen. Wanneer je de receptorsequenties van een heleboel individuele cellen bepaalt bij mensen, kan je met een computerprogramma die sequenties bij elkaar groeperen. Dit gaat op basis van combinaties van nucleotiden en de patronen die daarin zitten. Vervolgens probeer je zo’n groepje sequenties te koppelen aan een eigenschap of functie, zoals het kunnen herkennen van een bepaald virus of het hebben van een ziekte. Dan kun je bijvoorbeeld voorspellen of iemand multiple sclerose gaat ontwikkelen, wanneer die persoon eenzelfde groepje sequenties heeft als iemand anders met MS.”