De vorige keer hebben we het gehad over fonologie (ook wel ‘fonemiek’), waarbij je niet meer naar een taal kijkt vanuit het perspectief van een outsider (-etiek) maar vanuit dat van een insider (-emiek). We moeten dus onze fonetische tekst (woorden die je precies zo schrijft als je ze zegt) omzetten naar een fonologische tekst (woorden die zo geschreven worden dat ze intuitief aanvoelen voor een moedertaalspreker).
In deze fase hebben we een paar honderd woorden (in ieder geval voor een voorlopige analyse; voor een echte analyse hebben we er duizenden nodig) fonetisch opgeschreven, en we hebben onze fonetische inventaris opgesteld – dus welke klanken we hebben.
Hoe komen we nou aan het impliciete begrip dat een moedertaalspreker van zijn of haar taal heeft? We kijken daarvoor naar verspreidingspatronen (interpretatie, deel 2) en fonetische omgeving (analyse, deel 3).
Om te beginnen moeten we erkennen dat de data waarvoor we zo hard gewerkt hebben om die te vergaren en die we drie keer op uitspraak gecheckt hebben, toch beïnvloed wordt door onze eigen vooroordelen. In deel 1 hebben we uitgelegd dat fonetiek gaat over 1 symbool = 1 klank. Dat blijkt toch niet helemaal te kloppen, want sommige geluiden kun je op meerdere manieren noteren! (Hou jij ook zo van vakken waarbij je in les 2 iets anders leert dan in les 1?)
[ɲ] bijvoorbeeld, (de n-klank aan het begin van het Engelse woord ‘new’, die niet een zuivere ‘n’ is) kun je noteren als [ɲ] of [nj]. Beide manieren zijn correct, maar welke heeft de voorkeur?
Als Engelsman geef ik vermoedelijk de voorkeur aan [ɲ] omdat ik het in het Engels als een enkele klank zie. Mijn gehoor vindt het een enkele klank, niet twee klanken naast elkaar zoals bijvoorbeeld [nd], wat bestaat uit twee klanken, namelijk een [n] en een [d] samen. (Noot van de vertaler: Nederlanders kiezen vermoedelijk eerder voor [nj] omdat [ɲ] in het Nederlands geen bestaande klank is; ons gehoor hoort twee aparte klanken)
Hetzelfde geldt ongeveer voor [d͡ʒ] (de j-klank in het Engelse woord “judge”). Voor mij is het logisch om dat te schrijven als de enkele affricaat [d͡ʒ] en niet als [dʒ] (twee aparte klanken). Mijn hersens zeggen dat het een enkele klank is. Het valt me meestal niet mee om aan een Engelse moedertaalspreker uit te leggen dat ‘j’ uit twee klanken bestaat en begint met ‘d’ 🙂
Bij het schrijven van de fonetiek voor een nieuwe taal nemen we dus mogelijk een vooroordeel mee dat gebaseerd is op onze moedertaal. Dus hoe onderzoeken we nu of dat in onze data gebeurd is? We moeten eerst de verdachte klanken in onze data eruit filteren. Dat zijn:
- Segmenten (enkele klanken) die je zou kunnen schrijven als sequenties (meerdere klanken).
- En andersom, sequenties die je kunt schrijven als segmenten
- Voorspelbare klanken die kunnen dienen als overgangsklank
- Halfvocalen/halfklinkers die je zou kunnen schrijven als klinkers of tweeklanken (diftongen) of andersom.
Mooie linguïstentaal hè? Maak je geen zorgen als je het niet snapt, we hebben een koffer vol linguïstengereedschap bij de hand waar ze allemaal in staan. Gewoon je data naast de lijst leggen.
De volgende stap is het vormen van een verspreidingspatroon voor de medeklinkers (C van consonant) en de klinkers in onze data. Dat betekent dus het aantal keren tellen dat [p] voorkomt aan het begin van een woord, in het midden van een woord en aan het eind van een woord. Dan opschrijven met welke andere klanken hij een ‘cluster’ vormt. Klinkt als saai handwerk hè? Is het ook, maar gelukkig is er software 😮
Het idee erachter is dat sommige klanken ondubbelzinnig zijn; ze kunnen maar op 1 manier geschreven worden; ze zijn dus niet-verdacht. Deze niet-verdachte klanken laten ons het verspreidingspatroon zien, en dan moeten we kunnen zien of het een redelijk plan is om onze verdachte klanken opnieuw te omschrijven, zodat ze in het patroon passen.
Als er bijvoorbeeld alleen maar verdachte CC-clusters zijn en er geen voorbeelden in staan van niet-verdachte clusters, dan is het mogelijk dat die er niet zijn. De enige reden dat ze op de lijst staan is dan uiteindelijk dat jij ervoor gekozen hebt om ze zo op te schrijven en als je ze in plaats daarvan als een enkele klank had geschreven, dan hadden ze er niet in gestaan.
Het is natuurlijk geen wet van Meden en Perzen. Mogelijk had je ze hetzelfde geschreven als een Kovol-moedertaalspreker had gedaan en heb je hetzelfde vooroordeel.
In het Kovol-voorbeeld zijn alle CC-clusters verdacht. Er zijn twee niet-verdachte clusters, wat kan betekenen dat CC-clusters een natuurlijk onderdeel van de taal zijn – maar het kunnen ook spelfouten zijn. Het is de moeite om daar even achteraan te gaan!
Aangezien er wel ook niet-verdachte CC-clusters zijn, lijkt dat erop te wijzen dat er meer zijn en misschien kunnen we die dus het beste laten zoals ze zijn.
Een deel van dit proces kan dan zijn dat we een aantal singen veranderen zodat bijvoorbeeld [mb] omgezet wordt in [ᵐb]. Als we al deze dubbele klanken veranderen in enkele klanken en dan doorgaan naar deel 3, kunnen we kijken wat het effect is van de beide opties. Deel 2 heeft grote invloed op wat er gebeurt in deel 3, dus moeten we vooruit kijken en van tevoren bedenken wat de implicaties zijn als we meerdere wijzigingen doorvoeren.
We zoeken de meest consistente optie, die linguïstisch logisch is, netjes en symmetrisch (dus consistent) is en die het liefst niet te veel letters in het alfabet geeft (maar wel bruikbaar blijft!).
Eerlijk gezegd is het een beetje een zooitje, waardoor het de moeite waard is om met het probleem bezig te blijven tot je de juiste oplossing vindt.
2 reacties
Anja · 01/02/2021 op 5:25 pm
Dit gaat boven mijn taalpetje…
Ieder zijn vak…
Ga door, dit is een puzzel die op te lossen valt, dat staat vast.
Ria Hoeijmakers · 03/02/2021 op 8:13 pm
Mooi gedaan Oscar! Fijn dat kunst geen taal behoeft 🙂