
Sviluppare un dizionario digitale cinese-italiano è possibile se sinologi di buona volonà uniscono le forze
È possibile che al giorno d’oggi, in un momento storico in cui la tecnologia avanza tumultuosamente a ritmi frenetici, compiendo giganteschi passi in avanti, in un momento in cui internet fornisce enormi risorse gratuite ed open source a disposizione di miliardi di utenti, in un momento in cui il dialogo con l’Asia e la Cina diventa ormai irrinunciabile, è possibile che in questo quadro non esista ancora un dizionario elettronico o digitale cinese – italiano gratuito come avviene per altre lingue?
La risposta sconsolante per gli amanti della Cina e del cinese sembra essere, amaramente: sì. Tuttavia, in virtù di quanto scritto sopra, non c’è da scoraggiarsi, quanto piuttosto rimboccarsi le maniche e strutturare un progetto per colmare questa lacuna.
Se è pur vero che esistono già versioni di dizionari inglese – cinese disponibili gratuitamente in molte versioni (PC desktop, App per smart devices e WebApp) che possono tornare utili a chi conosce l’inglese, tuttavia bisogna riconoscere che lo stato delle cose presenti esclude tutti gli altri. Certo è vero che la maggior parte di chi conosce il cinese ha già molto probabilmente studiato anche l’inglese o ne possiede una conoscenza tale da non trovar problemi fino ai vocaboli presenti nel dizionario HSK4, è pur vero però che da quel livello in poi ci si inizia a trovare di fronte ad un vocabolario decisamente più ricco e ci si potrebbe trovare nella condizione per cui si studia una parola cinese di cui non si conosce la corrispondente parola inglese e si avesse dunque la necessità di aver subito la traduzione italiana, evitando la faticosa e fuorviante pratica della catena dei significati cinese -> inglese -> italiano. In poche parole dal livello HSK4 in poi l’inglese potrebbe non essere più sufficiente per tradurre molte parole.
La cosa migliore in questo caso sarebbe di passare direttamente al vocabolario monolingua, questo certamente aiuterà a migliorare ulteriormente il proprio livello cinese, iniziando a pensare direttamente nella lingua che si sta apprendendo, bypassando la propria lingua madre e lo stesso inglese divenuto ormai “lingua universale”.
Comunque, aldilà di tutto, aldilà dell’utilità che può svolgere dal livello HSK4 in poi, personalmente ritengo che l’assenza di un dizionario elettronico gratuito cinese – italiano sia una mancanza inaccettabile considerati gli attuali sviluppi tecnologici e la disponibilità online di risorse gratuite e open source.
Scopo di questo articolo è dettare le linee generali per iniziare a strutturare un progetto che possa portare a compimento questa opera.
Seppur non sembra esser presente ancora un vero e proprio dizionario gratuito digitale italiano – cinese, grazie alle risorse già disponibili per altre lingue si potrà partire da un punto avanzato, non si dovrà partire letteralmente da zero nella costruzione del dizionario digitale.
Un dizionario digitale si basa su due risorse fondamentali:
In pratica un utente inserisce una richiesta nell’interfaccia, l’interfaccia la invia al database che restituisce la risposta alla richiesta effettuata dall’utente, come mostrato nello schema in basso.

In un precedente articolo ho discusso di Pablo, una risorsa gratuita ed open source disponibile online, in grado di svolgere il ruolo di dizionario elettronico cinese – inglese, questa risorsa offre gratuitamente due componenti fondamentali:
Per fortuna non si dovrà dunque partire completamente da zero.
Nei prossimi punti si descriverà per linee generali come sarebbe possibile sviluppare un dizionario elettronico cinese – italiano partendo dalle risorse open source a disposizione gratuitamente on line, quali componenti sono necessarie, quali figure e quale mole di lavoro sarebbero richieste per portare a termine l’opera, quali forme finali potrà assumere e di quali risorse necessiterà ogni diversa tipologia di dizionario.
Per rendere l’idea delle differenti applicazioni che sarebbe possibile sviluppare si prenderanno in esame alcuni esempi pratici già sviluppati, attivi e facilmente scaricabili / installabili / consultabili.
L’interfaccia non è altro che un’applicazione in grado di interrogare un database e restituire dati associati alla ricerca effettuata da un utente. Di seguito si vedrà che ne esistono di diversi tipi: versioni per PC, WebApp online consultabili da qualsiasi dispositivo connesso ad internet in grado di navigare siti internet fino alle interfaccie di App per smartdevices.
Per quanto riguarda l’ambiente Windows PC, c’è un’interfaccia disponibile e scaricabile da qualsiasi utente gratuitamente: Pablo. Il software può esser scaricato da questa pagina web.

Il vantaggio di questa risorsa è che è Open Source oltre che esser gratuita, permette inoltre di sostituire il database del dizionario, si vedrà più avanti che questo risulterà un fattore fondamentale per consultare il database del dizionario cinese – italiano una volta che verrà realizzato.
Per quanto riguarda l’interfaccia WebApp online, consultabile comodamente sia da pc che da smart devices connessi ad internet, esistono degli ottimi esempi di versioni tedesche, francesi ed ungheresi, come segnalato nella pagina web dedicata del sito mdbg.com che mette a disposizione il database aperto del dizionario inglese – cinese. In basso due screenshot con gli esempi di webapp versione tedesca e francese

Questo sito oltre a mettere a disposizione gratuita il database aperto da cui partire per costruire nuovi dizionari di altre lingue da associare al cinese, fornisce anche i link con i codici aperti per poter sviluppare altre webapp in grado di interrogare il database (si vedrà infatti che le versioni tedesche ed ungheresi sono praticamente identiche).
Il codice fornito è stato utilizzato da me per sviluppare una rudimentale interfaccia grafica di prova in grado di interrogare il formato del database. La risorsa è disponibile a questo link:
Essendo un test, l’unica traduzione disponibile in italiano è ni hao = 你好 = ciao.

Per quanto riguarda il mondo smartphone/tablet, ci sono delle applicazioni molto valide come Pleco e Hanping lite che però non dispongono di versione italiana. Pleco ha il vantaggio di poter integrare plugin esterni, sarebbe possibile in futuro integrare un dizionario italiano in questa applicazione ma l’operazione non può esser condotta dal singolo utente in autonomia, deve essere lo sviluppatore dell’applicazione ad integrarlo nel pacchetto.
Dunque, per questa soluzione, nel caso venga presa in considerazione, sarà necessario ingaggiare degli sviluppatori di App e mettere in preventivo la corrispondente spesa

Il database è il cuore del dizionario, contiene tutti i caratteri, le parole, i chengyu con la corrispondente traduzione. Questo database è già disponibile in diverse lingue come il tedesco, francese e ungherese ma non ancora nella lingua degli eredi di Marco Polo e Matteo Ricci … vale a dire l’italiano.
Grazie allo spirito di apertura e condivisione del sito https://www.mdbg.net non si inizierà da zero ma si potrà partire da un database completo di oltre 122.000 voci che includono caratteri, parole e addirittura chengyu.
Il database è disponibile al download libero al seguente indirizzo https://www.mdbg.net/chinese/dictionary?page=cc-cedict viene distribuito in formato zippato, dopo l’estrazione il file può essere aperto, letto e modificato da un qualsiasi software di lettura e scrittura per file .txt come il classico Blocco Note di Windows o Notepad ++

Grazie a questa immensa risorsa, al fine di avere un database per un eventuale dizionario italiano – cinese, sarà semplicemente necessario aprire il file con uno dei software menzionati e sostituire i campi delle traduzioni inglesi, tedeschi etc… con le corrispondenze italiane.
Non è un lavoro tecnicamente complicato, da questo punto di vista è un’operazione semplicissima che può esser svolta da qualsiasi persona in grado di accendere un pc e digitare sulla tastiera … in basso un semplicissimo esempio dove la parola “你好” viene tradotta nel file originale con “hello/hi” mentre nel file modificato con “ciao”.
Tuttavia seppur semplice si tratta chiaramente di un lavoro molto lungo perché le voci da tradurre sono oltre 122.000. Al fine di poter offrire un database corretto ed attendibile si richiede però la presenza di un ente, di un sinologo o di una rete di queste figure di comprovata conoscenza del cinese, che possa in qualche modo certificare che la traduzione sia corretta. Questo sarà dunque il nodo fondamentale del prossimo punto.
Il progetto richiede la seguenti figure:
Dovranno tradurre le voci disponibili nel database digitando le corrispondenze in italiano. Al fine di ottimizzare le risorse umane ed avere a disposizione traduttori in possesso dell’adeguato livello di conoscenza del cinese, sarà necessario effettuare una selezione. In questo caso un ruolo fondamentale potrebbe esser svolto dagli istituti Confucio presenti sul suolo nazionale italiano.
Come anticipato nel precedente punto, al fine di poter offrire una risorsa attendibile, sarà opportuno che le traduzioni vengano controllate e certificate da una rete di enti e sinologi in grado di certificare la correttezza delle traduzioni. Per la scelta dei certificatori, come per la selezione dei traduttori, l’ente più autorevole in grado di assolvere questo compito può essere la rete degli Istituti Confucio presenti in Italia.
Finora si è visto che le possibili applicazioni realizzabili sono fondamentalmente tre: Software per PC Windows, WebApp e App per smart devices. Ognuna di queste soluzioni richiede un diverso livello di impiego di tecnici ed un diverso livello di specializzazione tecnica. Di seguito elenchiamo i tre differenti esempi pratici:
A questo punto dovrebbe essere più chiaro il quadro generale di come è strutturato un dizionario digitale, delle diverse applicazioni finali in cui può esser realizzato, delle figure necessarie alla realizzazione del progetto e del punto da cui partire. Se si analizza quanto trattato sinora si evince che il cuore di tutto è il database, elemento imprescindibile del dizionario, fonte di dati dai quali qualunque applicazione si scelga di realizzare, che sia una WebApp, un’App per smart device o un software per PC dovrà attingere.
Al fine di offrire un database di dati attendibili con traduzioni corrette, è necessario selezionare attentamente i traduttori e chi dovrà gestirli, controllare le loro traduzioni e certificarle prima di rilasciare il database. Il punto di partenza di tutto, dunque, non può che essere questo, selezionare traduttori e certificatori ed iniziare la traduzione. Una volta conclusa questa fase si potrà pubblicare il database online nello stesso formato in cui è rilasciato nelle altre lingue disponibili. In questo modo, sarà già fruibile gratuitamente utilizzando il software libero Pablo da qualsiasi utente PC Windows.
Considerato che una rudimentale WebApp è già stata realizzata, sarebbe tecnicamente possibile rendere fruibile il database anche a qualsiasi utente collegato alla rete con qualsiasi dispositivo. Certo non si potranno avere ancora funzioni sofisticate come la lettura e traduzione istantanea di caratteri tramite fotocamera su cellulare, ma può certamente essere un primo strumento da cui partire.
La scelta se procedere allo step successivo e realizzare una WebApp più sofisticata o addirittura un’App per smart devices dipenderà da quante risorse riuscirà ad ottenere il progetto.
Ora che le linee generali del progetto sono state enucleate non resta che iniziare ad organizzarsi per iniziare l’opera e portarla a termine. Tutti i sinologi di buona volontà che hanno a cuore il progetto possono contattarmi tramite form di contatto disponibile a questo link, oppure iscriversi al gruppo dedicato su Sinobook denominato “Progetto dizionario digitale cinese – italiano” disponibile al seguente link: https://www.sinobook.it/bp-groups/progetto-dizionario-digitale-cinese-italiano