Verso la ricostruzione automatica delle protolingue
-
Sviluppato un sistema automatico con cui ricostruire lingue parlate nell'antichità partendo da parole che fanno parte di lingue moderne. Il sistema si basa su tecniche statistiche usate in biologia computazionale per ricostruire gli alberi filogenetici degli organismi ed è stato testato con successo sulle lingue austronesiane.
Frammenti della ricostruzione dei rapporti filogenetici fra le lingue austronesiane. (Cortesia A. Bouchard-Côté et al./PNAS))
Un sofisticato sistema computerizzato per la ricostruzione delle protolingue - le antiche lingue da cui si sono evolute le famiglie di lingue moderne – è stato messo a punto da un gruppo di ricercatori dell'Università della British Columbia a Vancouver e dell'Università della California a Berkeley, che lo descrivono in un articolo pubblicato sui “Proceedings of the National Academy of Sciences”.
Uno dei più vecchi problemi della linguistica riguarda proprio la parole delle protolingue, che si cerca di ricostruire con un faticoso processo di confronto “manuale” fra parole di lingue moderne che sembrano imparentate fra loro. Questo lavoro è svolto organizzando in gruppi affini le parole dei diversi vocabolari sospettate di avere una forma ancestrale comune, che si cerca di ricostruire sulla base di pochi cambiamenti regolari nel suono dei vocaboli moderni. Tuttavia, diversi fattori rendono ardua questa ricostruzione, dal fatto che molte di queste alterazioni fonetiche sono costituite da inserzioni e/o cancellazioni di stringhe di fonemi, e dal fatto che spesso le alterazioni sono sensibili al contesto.
Alexandre Bouchard-Côté, lo scienziato che ha diretto la ricerca, e colleghi hanno usato un altro approccio. Innanzitutto, i ricercatori hanno sviluppato una famiglia di modelli probabilistici di cambiamento del suono a livello dei fonemi, basati su algoritmi che ricalcano quelli usati in biologia computazionale per la determinazione delle sequenze di DNA ancestrali e per la ricostruzione degli alberi filogenetici.
In seguito, gli scienziati hanno applicato questo sistema a 142.000 forme verbali apparteneti a 637 lingue austronesiane diffuse in una vasta area che va dall'Oceania al Sud est asiatico, per spingersi a nord fino a Formosa e a ovest fino al Madagascar. In questo modo hanno ottenuto una ricostruzione automatica di un insieme di protolingue che è risultato concordare nell'85 per cento dei casi con la ricostruzione manuale ottenuta da un linguista specializzato in lingue austronesiane.
"Il nostro sistema non sostituisce il certosino e raffinato lavoro dei linguisti qualificati, ma potrebbe rivelarsi prezioso permettendo loro di aumentare il numero di lingue moderne che usano come base per le ricostruzioni", ha detto Bouchard-Côté. "Siamo fiduciosi sul fatto che questo sistema rivoluzionerà la linguistica storica più o meno allo stesso modo in cui l'analisi statistica e la potenza del computer ha rivoluzionato lo studio della biologia evolutiva."
Fonte: www.lescienze.it