Internet: quali sono le lingue mancanti?

Internet è dominato dall'inglese e da una manciata di altre lingue. Le lingue e i dialetti indigeni stanno combattendo per avere voce online.

0
388

L’inglese e una manciata di altre lingue dominano letteralmente Internet, ma quali sono le conseguenze per altri idiomi?

Le culture indigene combattono per avere una voce online

In questo modo infatti le culture indigene non hanno una voce online e stanno ora combattendo per ottenere che sul web siano presenti anche le loro lingue.

Immagina che la tua piattaforma di social media preferita non ti permetta di pubblicare nella tua lingua e soprattutto una tastiera che non ti consenta di digitare le tue parole. Due sono le opzioni: o passare a un’altra lingua o optare per un silenzio digitale.

Questo è ciò che accade alle persone che parlano lingue e dialetti indigeni.

Secondo Whose knowledge?, una campagna che mira a far conoscere la realtà delle comunità emarginate online, ci sono quasi 7000 lingue e dialetti nel mondo, ma solamente il 7% si riflette nel materiale online pubblicato.

Facebook è la piattaforma online più multilingue: supporta fino a 111 lingue.

Il 98% delle pagine Web di Internet è pubblicato in sole 12 lingue

Un sondaggio pubblicato dall’Unesco nel 2008 ha rilevato che il 98% delle pagine Web di Internet è pubblicato in sole 12 lingue e più della metà di queste sono in inglese.

Ciò riduce la diversità linguistica online a una manciata di lingue, rendendo l’approccio al web più ostico, se non impossibile, per coloro che parlano una delle lingue escluse da Internet.

La comunità Maya Kaqchikel del Guatemala comprende oltre mezzo milione di parlanti. 

Miguel Ángel Oxlaj Cumez ne fa parte ed è stato uno degli organizzatori del primo Festival latinoamericano delle lingue indigene su Internet, tenutosi nel 2019.

“Quando arrivo su Internet trovo più del 90% dei contenuti in inglese e quindi una percentuale significativa in spagnolo e in altre lingue.

Quindi quello che devo fare è spostarmi in un’altra lingua, e ciò favorisce lo spostamento della mia lingua”.

“Scredita la mia lingua, perché, dato che non è su Internet, non è valida, quindi non funziona, quindi perché continuerò ad impararla? Perché lo insegnerò ai miei figli se, quando accendo Internet o la televisione, non riesco a trovarlo lì? ”

Miguel Ángel Oxlaj Cumez sta lavorando con altri attivisti per creare una versione di Wikipedia in Kaqchikel, nonché una versione tradotta del browser Web Mozilla Firefox. 

Il suo sogno è avere “vita digitale nella mia lingua” e che quando opterà per un’altra lingua sia solo ed esclusivamente per una sua decisione.

Internet: sono molte le lingue mancanti

Unesco: promuovere l’uso del multilinguismo online

Nel 2003, l’Unesco ha adottato una raccomandazione al fine di promuovere l’uso del multilinguismo online, con l’obiettivo di ottenere su Internet l’universalità, prestando particolare attenzione alle lingue indigene.

Il primo, e più grande, problema è l’accesso. Secondo le statistiche di Internet World, solamente il 58% della popolazione mondiale ha accesso alle piattaforme online. E mentre il 76% della popolazione cibernetica vive in Africa, Asia, Medio Oriente, America Latina e Caraibi, la maggior parte dei contenuti online proviene da altrove.

Indigeni primitivi nell’Oceano

Basti pensare a Wikipedia: oltre l’80% degli articoli proviene dall’Europa o dal Nord America; ciò accade anche con il 75% dei domini di primo livello del web, da .com a .org.

Un altro problema sono le tastiere. Miguel Ángel Oxlaj Cumez spiega infatti che:

“Le tastiere sono progettate per le lingue dominanti. E poiché le piattaforme sono in spagnolo o inglese o in un’altra lingua dominante, quando scrivo nella mia lingua l’autocorrezione continua a cambiare i miei testi. “

La mancanza di alfabeti diversi è il primo ostacolo che impedisce a quasi tutte le lingue indigene di prendere parte alla conversazione online.

Su Internet si trascinano quelle disuguaglianze sociali che si riscontrano nel mondo reale

Secondo Victoria Aguilar il problema principale è che le società trascinano su Internet tutte quelle disuguaglianze sociali e strutturali che si riscontrano offline, nel mondo reale. Queste le sue parole:

“Abbiamo bisogno di molto lavoro nell’adattare la tecnologia alle nostre esigenze. Internet è un meraviglioso canale di comunicazione, ma riflette anche le disuguaglianze nella vita reale. Il modo in cui alcune forme di scrittura vengono trascurate sta influenzando il fatto che non possiamo scrivere liberamente su Internet. Abbiamo bisogno di tecnologie che ci consentano di accelerare questo processo. “

Aguilar, di madrelingua mixteca, studia linguistica presso l’Università Nazionale del Messico. Sta creando, con l’aiuto di una designer, un nuovo carattere tipografico per poter scrivere online nella sua lingua con la corretta ortografia.

Grazie al suo lavoro ha scoperto che Internet ha un doppio impatto: se da un lato aiuta a rendere visibili le lingue dominanti, dall’altro la velocità della sua diffusione rischia di accelerare la scomparsa delle lingue minoritarie. Afferma infatti che se in questo momento non si velocizza il processo ci si può spingere “verso un’omogeneizzazione della lingua spagnola nel caso del Messico“.

 È un momento chiave per le lingue, perché c’è un boom di Internet.

In alcune aree le cose stanno pian piano migliorando. Unicode è uno standard di elaborazione che codifica in script caratteri, alfabeti, numeri e persino emoji. Il latino, ad esempio, è uno script che funziona per dozzine o addirittura centinaia di lingue, ma alcuni script sono usati per una sola lingua. A partire dal 2020 Unicode supporta 154 script.

Internet compie 50 anni: tanti auguri!

IDN

Sarmad Hussain sta affrontando questa sfida dal punto di vista del nome di dominio. Sta eseguendo l’implementazione di IDN (Internationalized Domain Names) all’interno di Internet Corporation for Assigned Names and Numbers (Icann). Spiega che:

Il sistema dei nomi di dominio era basato sul codice standard americano per lo scambio di informazioni (Ascii), quindi significa che i nomi di dominio erano limitati ai caratteri, ciò che chiamiamo lettera, cifra, schema di trattino, quindi sostanzialmente dalle lettere dalla A alla Z, cifre da 0 a 9 e trattino, quindi quelle erano le uniche che potevi usare per sviluppare nomi di dominio. La comunità, alla fine, mentre Internet si espandeva in paesi che non utilizzavano il set di caratteri Ascii, aveva chiaramente bisogno di espandere questo sistema di nomi di dominio per supportare tutte le altre lingue e script in tutto il mondo

A partire dal 2003 il progetto IDN ha abilitato 152 lingue, 75 in cinese, giapponese e coreano (CJK) e 33 in arabo. Attualmente ci sono più di 9 milioni di IDN registrati , che rappresentano il 2,5% di tutti i domini.

L’apertura di nomi di dominio a nuove lingue, insieme all’ampliamento dell’accesso a Internet, ha già avuto un effetto sulle popolazioni online e sui contenuti. 

I risultati di uno studio, condotto dal Consiglio dei registri nazionali dei domini di primo livello e dagli Oxford Information Labs, “indicano che i TLD nazionali e regionali (domini di primo livello) aumentano la presenza di lingue locali online e mostrano livelli più bassi di lingua inglese di quello che si trova nel settore dei nomi di dominio in tutto il mondo”.

A dicembre 2019 Wikipedia aveva pubblicato articoli in 307 lingue, rendendo la propria pagina più diversificata e multiligue.

Lingue straniere: come apprenderne almeno una

Il vicepresidente di Wikimedia in Messico, José Flores, dice che:

“Esiste la responsabilità delle piattaforme tecnologiche di dare accesso alla tecnologia in queste lingue e di ridurre il divario di accesso a Internet, e c’è anche la responsabilità dello stato”

Ma non solo: “Mi sembra che il mondo accademico, la comunità stessa e persino il giornalismo e i media siano responsabili, perché c’è bisogno di più fonti per costruire articoli su Wikipedia.

Gli articoli di Wikipedia devono citare fonti di seconda mano, come articoli o pubblicazioni accademiche. Questo spesso diventa un problema per le comunità che non sono ben documentate.

Non è solo che dobbiamo connetterci, ma anche come ci connettiamo“, aggiunge Flores. “Va oltre l’infrastruttura, perché riguarda anche gli usi sociali di questa infrastruttura“.

Il 43% delle lingue e dei dialetti del mondo non sono scritti

L’accesso ai dispositivi e alle fonti non rappresenta l’unico problema.

Le stime indicano che quasi il 43% delle lingue e dei dialetti del mondo non sono scritti; si tratta dunque di un’altra importante sfida che deve individuare il modo in cui potrebbero adattarsi al mondo online spesso basato su un testo.

Poiché sempre più persone nelle culture indigene si collegano online, esiste il rischio che le loro lingue diventino sempre più irrilevanti se non possono usarle.

Sono nati progetti come Lingua Libre, una piattaforma finanziata dalla Wikimedia Foundation per registrare le lingue orali. L’archivio, gestito da Wikimedia France, è stato aperto nell’agosto 2018 e contiene già più di 100.000 registrazioni in 43 lingue che, altrimenti, potrebbero essere state perdute per sempre.

Perché è necessario avere la mia lingua su Internet?

Miguel Ángel Oxlaj Cumez è consapevole che le sfide da affrontare rimangono difficili e complesse, ma non si scoraggia. 

“Consideriamo le sfide come opportunità. Nei seminari ho sollevato la domanda: “Perché è necessario avere la mia lingua su Internet? ” E un attivista si volta e mi dice: “Perché non dovrei avere la mia lingua indigena su Internet?”

Attualmente sta lavorando con altri attivisti indigeni online per creare versioni della lingua maya Kaqchikel di Wikipedia, WhatsApp e Duolingo. 

“Cinque anni fa, non immaginavo la mia lingua su Internet e ci sono persone che ancora non pensano a quella possibilità”.

Nel frattempo, è contento che ci sia una rete crescente di madrelingua che lottano per avere online i propri idiomi.

Ora è nelle mani di questa rete di attivisti. E tutti noi abbiamo il sogno di realizzarlo.”

Commenti