Zingen in Perfecte Frequenties: Maaike Ouboter Header

Zingen in Perfecte Frequenties: Maaike Ouboter

Welke woorden gebruikt Maaike Ouboter het meest in haar liedteksten? Ik zocht het uit.

De liedteksten
Voordat de meest gebruikte woorden bekeken kunnen worden, moet vastgesteld worden welke liedteksten worden geanalyseerd. Maaike Ouboter heeft tot nu toe twee albums uitgebracht: En Hoe Het Dan Ook Weer Dag Wordt en Vanaf Nu Is Het Van Jou. Op de originele varianten van deze albums staan in totaal 23 liederen, dus deze 23 liederen zijn meegenomen in de analyse. In de spelregels is te lezen hoe deze analyse eruit heeft gezien.

De lemma’s/woorden
In Grafiek 1 staan de tien meest gebruikte lemma’s van Maaike Ouboter op een rij. In vergelijking met de Zingen in Perfecte Frequenties van Suzan & Freek valt direct op dat er geen overduidelijke winnaar is. Tussen de nummer 1 en 2 zit een verschil van zes voorkomens. Het lemma ‘jij’ (met daarin woorden als ‘je’, ‘jou’, en ‘jouw’) komt 229 keer voor in de liedteksten van Maaike Ouboter en het lemma ‘ik’ (woorden als ‘ik’, ‘mij’ en ‘mijn’) komt 223 keer voor. Op de derde plek komt ‘en’ met 135 voorkomens op de derde plek. Dit betekent theoretisch dat er in Maaike Ouboters teksten 135 keer de ruimte is voor de combinatie ‘jij en ik’. In de praktijk is dit uiteraard niet het geval, maar het geeft wel aan hoe graag Maaike Ouboter de aandacht schenkt aan de ander én aan zichzelf.

Als we de gehele top 10 bekijken, zien we ‘de ander’ nog een keer terugkomen. Naast algemene woorden als ‘de’, ‘in’, ‘het’, ‘niet’ (enzovoorts), zien we het lemma ‘hij’ onder aan de lijst binnenkomen met 48 voorkomens. Dat is – tot nu toe – een opvallende bevinding in Zingen in Perfecte Frequenties. Suzan & Freek zingen geen enkele keer over een ‘hij’.

Grafiek 1. De tien meest gebruikte lemma’s van Maaike Ouboter.

Zingen in Perfecte Frequenties: Maaike Ouboter Grafiek 1

Om hier nóg een schepje bovenop te doen heb ik de meest gebruikte persoonlijke voornaamwoorden, werkwoorden en zelfstandige naamwoorden op een rij gezet in Tabel 1. Het lemma ‘zij (enkelvoud)’ zien we met 39 voorkomens binnenkomen als 10e meest gebruikte lemma (dit lemma valt net buiten de top 10 van Grafiek 1, omdat ‘het’ en ‘zijn’ allebei 60 voorkomens hebben en dus hetzelfde rangnummer hebben). Maaike Ouboter zingt dus vaker over iemand anders in haar liedteksten (de lemma’s ‘jij’, ‘hij’ en ‘zij’) dan over zichzelf (het lemma ‘ik’).

Wat betreft het woordgebruik van Maaike Ouboter zien we een duidelijk verschil tussen doen (‘gaan’, ‘doen’, ‘zeggen’, ‘komen’, ‘stap’) en denken (‘zijn’, ‘hoofd’, ‘gedachte’, ‘verhaal’), en wordt dit verschil aangevuld met een verschil tussen zweven (‘dag’, ‘nacht’, ‘tijd’, ‘liefde’, ‘wereld’) en aarden (‘huis’, ‘oog’, ‘hand’, ‘water’, ‘haar’). Als we andere categorisering kiezen, zien we opvallend veel lichamelijke woorden (‘zeggen’, ‘hoofd’, ‘oog’, ‘hand’, ‘haar’, ‘stap’) terugkomen. Ik kan me voorstellen dat deze woorden onmisbaar zijn in het schrijven over ‘de ander’. Zonder een schets van de andere persoon kan Maaike Ouboter niet gaan doen, denken, zweven en weer aarden.

Tabel 1. De meest gebruikte persoonlijk voornaamwoorden, werkwoorden en zelfstandige naamwoorden van Maaike Ouboter.

Persoonlijk voornaamwoord Werkwoord Zelfstandig naamwoord
1. jij (229x)
2. ik (223x)
6. het (60x)
8. hij (48x)
10. zij (ev.) (39x)
6. zijn (60x)
17. hebben (25x)
18. gaan (24x)
21. doen, zeggen (17x)
24. komen, kunnen (14x)
29. hoofd, huis (9x)
30. oog (8x)
31. dag, gedachte, hand, water (7x)
32. nacht, tijd (6x)
33. haar, liefde, stap, verhaal, wereld (5x)

Wet van Zipf
Zoals in de spelregels is uitgelegd, voldoet de woordfrequentielijst van een tekst of van meerdere teksten aan de wet van Zipf. Om te onderzoeken of dit ook voor de liedteksten van Maaike Ouboter geldt, ga ik het daadwerkelijke aantal voorkomens van de meest gebruikte woorden vergelijken met het aantal voorkomens dat voorspelt wordt door de wet van Zipf.

De verwachte Zipf-lijn is uit te rekenen door naar het meest voorkomende lemma te kijken. In de teksten van Maaike Ouboter komt het lemma ‘jij’ het meest voor met 229 voorkomens. Volgens de wet van Zipf zou dit betekenen dat het tweede meest voorkomende lemma ‘ik’ twee keer zo weinig voorkomt als ‘jij’. Dat zou in dit geval betekenen dat ‘jij’ 114,5 keer voorkomt (de helft van 229). Het derde lemma komt vervolgens drie keer zo weinig voor als ‘jij’ (dat is ‘en’ met 76,33 voorkomens, want 1/3 van 229 is 76,33). Het vierde lemma ‘de’ zou dan 57,25 keer voorkomen (1/4 van 229), het vijfde lemma ‘in’ 45,8 keer (1/5 van 229), et cetera.

Grafiek 2. De verwachte Zipf-lijn naast de daadwerkelijke frequentielijn van Maaike Ouboter.

Zingen in Perfecte Frequenties: Maaike Ouboter Grafiek 2

In Grafiek 2 staat de verwachte Zipf-lijn naast de daadwerkelijke frequentielijn van Maaike Ouboter. Met een snelle blik kunnen we aan de ene kant zien dat deze lijnen verrassend goed met elkaar overeenkomen, en aan de andere kant dat de lijn in het begin pas later begint te dalen dan bij Suzan & Freek het geval was. Dit komt uiteraard doordat de lemma’s ‘jij’ en ‘ik’ ongeveer even vaak voorkomen, maar het is mooi om te zien dat dit ook uit de grafiek naar voren komen.

Desondanks laat Grafiek 2 zien dat Maaike Ouboter hoogstwaarschijnlijk wel volgens de wet van Zipf zingt. Om te onderzoeken of dit inderdaad het geval is, heb ik de correlatie tussen de Zipf-lijn en de daadwerkelijke lijn van Maaike Ouboter uitgerekend. Het resultaat van deze berekening is .945 (p < .001) en dat is een zéér hoge correlatie. Wanneer ik dit voor het gemak vertaal naar een percentage, voldoet Maaike Ouboter voor 94,5% aan de wet van Zipf. Dit ligt iets lager dan de 99,0% van Suzan & Freek, maar dit percentage is zeker weten hoog genoeg om vast te stellen dat Maaike Ouboter in perfecte frequenties zingt.

Pareto-principe
Tot slot, het Pareto-principe. In de spelregels heb ik toegelicht, dat als ik 20% van alle unieke woorden uit Maaike Ouboters liedteksten analyseer, dat ik, volgens het Pareto-principe, dan eigenlijk 80% van al hun liedteksten heb geanalyseerd. Ik heb als volgt berekent of dit inderdaad het geval is: In totaal zijn er 872 unieke woorden geteld in de liedteksten en in totaal komen deze woorden 3280 keer voor. Van de 872 woorden heb ik de eerste 20% onderzocht op lemma en woordsoort (dat zijn de 174 meest voorkomende unieke woorden). Deze 174 woorden komen in totaal 2588 keer voor in de liedteksten van Maaike Ouboter. Om te berekenen in hoeverre dit overeenkomt met het Pareto-principe moet nog berekend worden hoeveel procent 2588 is van 3280. Dit is 79% (afgerond op hele getallen), en dat betekent dat ik met de eerste 20% van de meest voorkomende woorden van Maaike Ouboter 79% van al hun liedteksten zou kunnen schrijven. Dat is bijna gelijk aan de 80% die het Pareto-principe voorspelt.

Dat is gelukkig niet zo erg, want Maaike Ouboter heeft net laten zien dat ze met 94,5% al zeer goed zingt in perfecte frequenties.

Benieuwd naar meer Zingen in Perfecte Frequenties? Klik hier voor een overzicht.

Gepubliceerd door

Vincent Zonder Klinkers

In de taal verdwaald

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Google photo

Je reageert onder je Google account. Log uit /  Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s