Een geluidsopname houdt de gemoederen op de sociale media al enkele dagen bezig. Zegt de spreker nu ‘laurel’ of ‘yanny’? Hoe kan het dat de ene luistereraar iets heel anders hoort dan de andere?
Drie jaar geleden ging de consternatie om een jurk (was ‘ie nou blauw-zwart of wit-goud?), ditmaal is het de beurt aan een spraakopname die begin deze week online verscheen. Waar de meeste mensen ‘laurel’ verstaan, zijn andere overtuigd dat er ‘yanny’ wordt gezegd. Sommigen horen de ene keer het een, dan weer het ander. En weer anderen beweren zelfs heel iets anders te verstaan: ‘geery’ of ‘garry’. Wat is hier aan de hand?
What do you hear?! Yanny or Laurel pic.twitter.com/jvHhCbMc8I— Cloe Feldman (@CloeCouture) 15 mei 2018
Eén ding is duidelijk: oorspronkelijk klonk hier ‘laurel’. Het spraakfragment komt van vocabulary.com, een Amerikaanse site waarmee je je Engelse woordenschat kunt uitbreiden. Daar klinkt duidelijk de uitspraak van ‘laurel’ (de laurierkrans die keizers op hun hoofd dragen). Amerikaanse middelbare scholieren speelden het fragment af via de speakertjes van hun computer en namen het op met hun telefoon. Dát is de opname die inmiddels viral gaat.
Dubbelzinnig
Het afspelen via inferieure luidsprekers en het opnemen met een microfoon/app van niet de beste kwaliteit, heeft het geluidsfragment vervormd. De hoge frequenties zijn veel nadrukkelijker aanwezig dan in het origineel. Dat is goed te zien in de volgende afbeeldingen. Je ziet een spectrogram, een weergave van de energie in verschillende frequentiegebieden afgezet tegen de tijd. Elke klank is een samenzang van vele frequenties. Afhankelijk van de vorm van je mond- en keelholte resoneren sommige frequenties luider dan andere: dat zorgt voor de dikke banden (‘formanten’) in het spectrogram. Deze formanten zijn essentieel voor het verstaan van spraak. In het dubbelzinnige fragment zie je duidelijk meer energie in de hoge frequenties.
De vervorming resulteert in een dubbelzinnig fragment dat op meerdere manieren verstaan kan worden. “Mensen die meer ingetuned zijn op de hogere frequenties horen ‘yanny’, mensen die vooral afgesteld zijn op de lagere horen ‘laurel’”, legt Shruti Ullas uit. Ullas onderzoekt aan Maastricht University hoe onze hersenen zich aanpassen aan subtiele uitspraakverschillen. “Je brein probeert altijd zo goed mogelijk te bepalen wat er gezegd wordt. Bij dit dubbelzinnige geluidssignaal hangt dat af van hoe je auditieve systeem is afgesteld.”
Dat verreweg de meeste mensen ‘laurel’ of ‘yanny’ verstaan, komt volgens Ullas doordat deze opties meestal al in een begeleidende tekst gegeven zijn. “De opname zelf is onduidelijk. Dan kunnen visuele labels helpen om de ontbrekende informatie in te vullen, zodat je toch een complete waarneming ervaart. Mensen die deze labels niet zien, kunnen daardoor ook iets anders verstaan dan ‘laurel’ of ‘yanny’.” Dat verklaart waarom sommigen ‘geery’ of ‘garry’ horen.
Kalibreren
Op de website van The New York Times kun je het fragment afspelen terwijl je de nadruk meer op de lagere dan wel hogere frequenties legt. En inderdaad, als ik het pijltje op de doorlopende lijn bijna bij ‘yanny’ zet, hoor ik plots geen ‘laurel’ meer, maar onmiskenbaar ‘yanny’. Het pijltje staat dan bij het laatste streepje vóór het eindpunt, waar de hogere frequenties versterkt zijn. Zodra ik het pijltje vervolgens weer terugschuif, gebeurt er echter iets vreemds: ik blijf ‘yanny’ horen waar ik eerst ‘laurel’ verstond. Pas bijna halverwege de schaal hoor ik weer ‘laurel’.
Hoe kan dat? “Met het verschuiven van het pijltje heb je je auditieve systeem gerekalibreerd, waardoor het meer is afgesteld op de hogere frequenties”, legt Ullas uit. “Als je dan weer terug gaat, duurt het even voor het systeem zich weer heeft aangepast en weer ‘laurel’ hoort. Andersom werkt het ook: als je eerst ‘yanny’ hoort, naar links schuift tot je ‘laurel’ hoort en dan weer terugschuift, zal hetzelfde gebeuren.”
In haar onderzoek maakt Ullas gebruik van hetzelfde principe als in deze auditieve illusie. Ze manipuleert een opname zodanig dat de klank precies tussen twee bestaande klanken in ligt: een s of een f, een b of een d. Vervolgens onderzoekt ze wanneer het gemanipuleerde fragment wordt herkend als de ene klank en wanneer als de andere. “Het is heel leuk dat deze meme nu overal terugkomt. Erg relevant voor mijn onderzoek!”