De Ce Limbi și Dialecte - Acestea Sunt Lucruri Complet Diferite - Vedere Alternativă

De Ce Limbi și Dialecte - Acestea Sunt Lucruri Complet Diferite - Vedere Alternativă
De Ce Limbi și Dialecte - Acestea Sunt Lucruri Complet Diferite - Vedere Alternativă

Video: De Ce Limbi și Dialecte - Acestea Sunt Lucruri Complet Diferite - Vedere Alternativă

Video: De Ce Limbi și Dialecte - Acestea Sunt Lucruri Complet Diferite - Vedere Alternativă
Video: CE S-A DESCOPERIT PE EXOPLANETA CEA MAI APROAPIATĂ? 2024, Mai
Anonim

De multe ori, întrebările simple au răspunsuri complexe. De exemplu: care este diferența dintre limbă și dialect? Dacă decideți să întrebați un lingvist despre acest lucru, atunci stați pe spate. Deși la prima vedere nu există nimic dificil în această întrebare, poate fi răspuns în diferite moduri.

Distincția dintre limbă și dialect poate depinde de un punct de vedere sau altul. Din punct de vedere politic, limba este ceea ce oamenii vorbesc de obicei ca națiune. De exemplu, din 1850 până în 1992, a existat așa-numita limbă sârbo-croată, care a inclus mai multe dialecte, inclusiv sârbă, croată și bosniacă. Dar după ce Iugoslavia s-a împărțit în mai multe state independente la mijlocul anilor 1990, aceste dialecte au fost recunoscute ca limbi separate. Această definiție politică funcționează parțial, deși aduce mai multe probleme decât soluții: există limbi vorbite în diferite țări, un exemplu frapant în acest sens este spaniola în America Latină. Nimeni nu ar argumenta că spaniola mexicană și spaniola columbiană sunt limbi diferite. Eventual spaniolă, vorbită în părți din Spania,atât de diferit de soiurile sale latino-americane încât merită să fie numit o limbă separată, dar acest lucru nu este complet clar.

Ce se întâmplă dacă trasăm linia dintre limbă și dialect, ghidați de criteriul înțelegerii reciproce? Din păcate, nici această abordare nu este ideală. Un danez va înțelege limba suedeză ceva mai bine decât un suedez va înțelege limba daneză. La fel, o persoană care vorbește dialectul țărănesc aparte al englezei britanice va înțelege un american din Los Angeles mult mai bine decât un american. Înțelegerea reciprocă depinde adesea de factori externi - sunt o variabilă destul de incontrolabilă - și nu de proprietățile inerente ale limbajului în sine.

Deci, poate ar trebui să adoptăm o abordare pur lingvistică. Imaginați-vă că putem măsura în mod sistematic diferența (D) dintre două variante de vorbire. Sensul specific al lui D ne-ar permite apoi să definim granița dintre două dialecte și două limbi. Găsirea unei astfel de valori nu ar trebui să fie foarte dificilă, deoarece cele două limbi pot fi comparate pe mai multe criterii, cum ar fi inventarul solid, caracteristicile gramaticale sau vocabularul.

Dar dacă diferențele dintre variațiile vorbirii sunt treptate și probabilitatea de a găsi o anumită valoare a lui D este la fel de mare ca probabilitatea de a găsi o altă valoare? Atunci ar trebui să alegem o valoare arbitrară a lui D ca punct de plecare, iar o valoare arbitrară ne-ar arunca înapoi la considerații de natură politică sau practică pe care nu intenționam să le luăm în considerare. Vrem ca linia noastră de pauză să fie la nivelul în care sârba și croata sunt limbi diferite sau una? Catalogând limbile lumii, câte mii de limbi vrem să predăm uitării: cinci? Sau șapte? Poate zece mii?

În ultimii ani, au fost depășite două obstacole principale pentru a face distincția între limbă și dialect. Primul este cum să măsurați diferențele dintre variantele de vorbire - adică să găsiți o valoare pentru D. În 2008, un grup de lingviști a creat Programul de judecată a similarității automate (ASJP), un curator zilnic și fondator al căruia este cu adevărat al vostru. ASJP a pregătit cu atenție un set de date sistematic de comparare a limbajului care conține în prezent 7655 liste de cuvinte. Acestea sunt relevante pentru două treimi din limbile lumii, presupunând că, în scopurile noastre, limbile sunt definite de codul standard ISO 639-3. Deoarece fiecare listă de cuvinte conține un set fix de 40 de concepte care sunt interpretate în mod consecvent, este ușor să le comparați și astfel să obțineți o măsură a diferenței. Cea mai folosită măsură a diferenței dintre două cuvinte este distanța Levenshtein, un termen numit după Vladimir Levenshtein, un om de știință sovietic care în 1965 a dezvoltat un algoritm pentru compararea a două șiruri de caractere. El a definit „distanță” ca numărul minim de înlocuiri, inserții și ștergeri necesare pentru a transforma o linie în alta. Distanța Levenshtein poate fi util împărțită la lungimea celei mai lungi dintre cele două linii și, astfel, pune toate distanțele pe o scară de la 0 la 1. Acest fenomen este cunoscut sub numele de distanța Levenshtein normalizată sau LDN. El a definit „spațiere” ca numărul minim de înlocuiri, inserții și ștergeri necesare pentru a transforma o linie în alta. Distanța Levenshtein poate fi util împărțită la lungimea celei mai lungi dintre cele două linii și, astfel, pune toate distanțele pe o scară de la 0 la 1. Acest fenomen este cunoscut sub numele de distanța Levenshtein normalizată sau LDN. El a definit „distanță” ca numărul minim de înlocuiri, inserții și ștergeri necesare pentru a transforma o linie în alta. Distanța Levenshtein poate fi util împărțită la lungimea celei mai lungi dintre cele două linii și, astfel, pune toate distanțele pe o scară de la 0 la 1. Acest fenomen este cunoscut sub numele de distanța Levenshtein normalizată sau LDN.

Al doilea obstacol este că poate „limbajul” și „dialectul” sunt concepte care pot fi definite numai în ordine arbitrară. Aici avem câteva știri foarte încurajatoare pentru dvs. Dacă ne uităm la toate familiile de limbi din baza de date ASJP, unde participanții la proiect au inclus o proporție semnificativă de soiuri strâns legate, putem începe să căutăm diferite tipuri de comportament de limbi și dialecte. O imagine intrigantă apare în fața noastră: distanțele, de regulă, fluctuează fie în jurul valorii relativ mici, fie în jurul valorii relativ mari, iar între ele se formează o depresiune. După cum se dovedește, cel mai adesea acest jgheab se află într-un interval îngust, în medie aproximativ 0,48 LDN. Nu ne vom înșela dacă spunem că variantele de vorbire tind să nu fie parțial similare între ele în vocabularul lor de bază. Fie există o tendință către o similitudine mai mare, caz în care variantele de vorbire pot fi definite ca dialecte diferite, fie mai puține similitudini, caz în care pot fi atribuite unor limbi diferite. Aici se află limita dintre limbă și dialect.

Acest fenomen este probabil rezultatul circumstanțelor sociale. Dialectele diferă pe măsură ce oamenii se stabilesc pe teritorii noi și formează noi identități, dar dacă există încă un contact între ele, convergența poate avea loc astfel încât variantele de vorbire să rămână mai mult de 50% similare este despre o singură limbă). Cu toate acestea, o ușoară împingere spre divergență poate face ca variantele de limbă să divergă relativ rapid, crescând distanța Levenshtein, caz în care le putem califica drept limbi separate. Poate exista o relație între limita pentru distanțele dintre cuvinte din lista standard utilizată de ASJP și distanțele corespunzătoare în alte părți ale structurii limbajului, ceea ce poate duce la o pierdere gravă a înțelegerii. Cu alte cuvinte,pragul de înțelegere se poate corela cu pragul dintre limbi și dialecte. Nu am studiat încă această problemă, dar ca obiect de cercetare este extrem de interesant.

Video promotional:

Ajuns la un criteriu obiectiv mai degrabă decât arbitrar pentru separarea limbilor de dialecte, îl putem aplica la limbile lumii. Unele perechi de varietăți de vorbire care sunt considerate limbi naționale, cum ar fi bosniaca și croata, sunt cu mult sub pragul LDN de 0,48 (ceea ce înseamnă că sunt aceeași limbă, indiferent de existența Iugoslaviei). Nu departe de acest prag se află limbi precum hindi și urdu (cu greu pot fi numite două limbi diferite). Și varietățile de arabă și chineză, care sunt adesea privite ca aceleași limbi, se ridică peste LDN = 0,48 (aceste soiuri sunt limbi separate). De fapt, există mai multe perechi de soiuri care sunt de obicei considerate limbi diferite, dar fluctuează la graniță: de exemplu, daneză și suedeză, care au un LDN de 0,4921.

În cele din urmă, o tehnică derivată din seturi de date, numită cronologie ASJP, poate fi aplicată pentru a stabili timpul necesar dialectelor pentru a se distanța suficient de departe pentru a fi considerate limbi separate. Rezultatul pe care l-am găsit este de 1059 de ani, dacă nu luăm în considerare o eroare. Aceste descoperiri sunt susținute de cât timp durează de obicei ca limbajul generic al unei familii de limbi să se împartă în limbi fiice, care mai târziu devin strămoșii subfamiliei. Pentru aceasta avem nevoie de alte metode de analiză, dar rezultatele sunt similare: este nevoie de aproximativ un mileniu pentru a transforma dialectele în limbi. Știm acest lucru pentru că putem distinge acum unul de celălalt.

Søren Wichmann este un lingvist danez care colaborează cu Universitatea Leiden (Olanda), Universitatea Federală Kazan (Rusia) și Universitatea Lingvistică din Beijing (China). Cea mai recentă carte a sa, Stabilitatea temporală a caracteristicilor tipologice lingvistice (2009), a fost co-autoră cu Eric W. Holman.

Recomandat: