RuG/L04

Tutorial

1. Inleiding

RuG/L04 is programmatuur voor dialectometrie en cartografie. En meer.

Simpel gezegd: je hebt op verschillende plaatsen in een gebied de uitspraak of lokale varianten van een groot aantal woorden verzameld. Met RuG/L04 kun je die woorden met elkaar vergelijken en op basis daarvan dialectkaarten maken.

Eerst maak je een afstandstabel. Om precies te zijn: je maakt een tabel waarin voor elk paar plaatsen met een getal is aangegeven in welke mate de woorden uit die twee plaatsen van elkaar verschillen. Voor elk woord worden de varianten uit beide plaatsen met elkaar vergeleken, en het verschil tussen de twee plaatsen is het gemiddelde van al die variantverschillen.

Er zijn diverse maten om een verschil tussen twee woorden uit te drukken in een getal. Een maat is de Levenshtein distance (ook wel string edit distance of kortweg edit distance genoemd). Een andere maat is de Gewichteter Identitätswert of G.I.W.

Het Levenshtein-algoritme wordt elders gedemonstreerd en uitgelegd.

De tabel met verschillen bewerk je verder. Je maakt een indeling in groepen door middel van clustering, of een ruimtelijke indeling door middel van multidimensional scaling. Met het resultaat daarvan teken je een dialectkaart.

De ideeën, het hoe en waarom van de kaarten zoals je hieronder ziet, dat wordt elders uitgelegd.

Onderstaand diagram geeft vereenvoudigd een aantal van de voornaamste stappen weer:

En het volgende diagram laat nog een paar mogelijkheden zien:

RuG/L04 bestaat uit een verzameling losse programma's. Elk programma neemt een stap van de verwerking voor z'n rekening. Dit betekent dat je de programma's los van elkaar kunt gebruiken, en ook voor andere toepassingen. Je zou bijvoorbeeld kaarten van genetische verschillen kunnen maken als je via een andere weg een tabel met genetische verschillen tussen plaatsen hebt gemaakt.

In de gerubriceerde index van de handleiding kun je zien welke programma's allemaal aanwezig zijn.

Naast deze losse programma's is er een library voor R. R is een krachtig systeem voor statistiek dat gratis beschikbaar is voor elk computerplatform. Met de library kun je bestanden, zoals die gebruikt worden door de overige programma's, inlezen in R, analyseren, bewerken, en ook weer opslaan.